Tag / machine learning
-
Notes about “Structuring Machine Learning Projects” by Andrew Ng (Part I)
Are you interested in understand how to diagnose errors in a machine learning system, and
be able to prioritize the most promising directions for reducing error?
Do you want to understand complex ML settings and comparing to and/or surpassing human-level performance? -
How to show correlations between variables?
When we work with linear regression we need to understand the relationship between the variables, that is, which variables depend on others, for this we analyze the correlation between the different variables that make up our dataset. Below is an example using ggally one of the many libraries that allow us to perform this analysis…
-
Minimum requirements for a dataset
Completeness and accuracy are the minimum requirements for any dataset. In the absence of these characteristics, any final outcome is suspect of biases and wrong conclusions. Any analysis relies on the initial dataset that we have, a Machine Learning algorithm, no matter how sophisticated is, depends on the quality of the data. For this reason,…
-
Market basket analysis: Example using grocery data
Idea Our market basket analysis is based on the purchase data collected from one month of operation at a real-world grocery store. The data contains 9,835 transactions or about 327 transactions per day (roughly 30 transactions per hour in a 12-hour business day), suggesting that the retailer is not particularly large, nor is it particularly…
-
Black box: SVN – Support Vector Machines
Idea Luego de analizar que significa SVN, vamos a ver la implementacion practica en un problema cotidiano: como funciona el reconocimiento de imagenes, y en particular vamos a intentar replicar el funcionamiento de los sistemas de OCR (Optical Character Recognition). Vamos a utilizar el dataset donado a la UCI Machine learning Data Reposity compuesto por…
-
Deep learning: Neural network
Vamos a implementar una red neuronal utilizada para prediccion de valores. Idea Vamos a trabajar para poder predecir la fortaleza del concreto, si bien es un material amplisimamente utilizado, debido a que esta compuesto por una gran cantidad de materiales es dificil precedir su fortaleza en el producto final. El objetivo es predecir la fortaleza…
-
Multiple lineal regression (II) Improving the model
En este post empezamos a trabajar con linear regression, en esta segunda parte vamos a trabajar para mejorar la performance de nuestro modelo, principalmente agregando relaciones entre variables. Mejorando el modelo Vamos a agregar tres nuevas relaciones a traves de la creacion de tres nuevas variables en nuestro dataset: Cambio de la variable edad de…
-
Multiple lineal regression (I)
Cuando hablamos de modelos de regresion estamos hablando acerca de analizar relaciones entre variables numericas. Que es regresion? es entender las relaciones entre una variable dependiente (que sera el valor a ser predecido) y una o mas variables independientes (las variables predictoras). La forma mas simple de regresion asume una relacion lineal entre una variable…
-
Divide and conquer(II) : classification rules
Classification rules representa conocimiento en forma de afirmaciones sencillas de si y no, de forma de poder asignarle una clase a ejemplos que no tienen una clasificacion (todavia). Rule learners son usados de forma similar a los arboles de desicion, de la misma forma que los arboles de desicion permiten ver como se estan estableciendo…
-
Divide and conquer(I) : classification using desicion trees
En este post me gustaria desarrollar otros de los algoritmos necesarios para trabajar en problemas que impliquen clasificacion: desicion trees y Rule Learners los cuales permiten transformar desiciones complejas en un set de opciones simples. Desicion trees Tal vez una de las tecnicas mas utilizada de machine learning, aplicable a casi cualquier tipo de datos…