Library

Course: Curso Completo De Machine Learning: Data Science en Python

Curso Completo De Machine Learning: Data Science en Python

  • Life Time Access
  • Certificate on Completion
  • Access on Android and iOS App
About this Course

¿Te suenan las palabras Machine Learning o Data Scientist? ¿Te pica la curiosidad de para qué sirven estas técnicas o por qué empresas de todo el mundo pagan un sueldo de 120.000 hasta 200.000$ al año a un científico de datos? 

Pues este curso está pensado y diseñado por todo un profesional del mundo del Data Science como es Juan Gabriel Gomila, de modo que os va a compartir todo su conocimiento y ayudaros a entender la teoría tan compleja sobre las matemáticas que tiene detrás, los algoritmos y librerías de programación con Python para convertiros en todo unos expertos a pesar de que no tengáis experiencia previa. 

Veremos paso a paso como empezar a trabajar con conceptos y algoritmos del mundo del Machine Learning. Con cada nueva clase y sección que completes tendrás unas nuevas habilidades que te ayudarán a entender este mundo tan completo y lucrativo que puede ser esta rama del Data Science.

También decirte que este curso es muy divertido, en la línea de Juan Gabriel Gomila y que aprenderás y te divertirás mientras vas aprendiendo acerca de técnicas de Machine Learning con Python. En particular, los temas que trabajaremos serán los siguientes:

  • Parte 1 - Instalación de Python y paquetes necesarios para data science, machine learning y visualización de los datos
  • Parte 2 - Evolución histórica del análisis predictivo y el machine learning
  • Parte 3 - Pre procesado y limpieza de los datos 
  • Parte 4 - Manejo de datos y data wrangling, operaciones con datasets y distribuciones de probabilidad más famosas
  • Parte 5 - Repaso de estadística básica, intervalos de confianza, contrastes de hipótesis, correlación,...
  • Parte 6 - Regression lineal simple, regresión lineal múltiple y regresión polinomial, variables categóricas y tratamiento de outliers.
  • Parte 7 - Clasificación con regresión logística, estimación con máxima verosimititud, validación cruzada, K-fold cross validation, curvas ROC 
  • Parte 8 - Clustering, K-means, K-medoides, dendrogramas y clustering jerárquico, técnica del codo y análisis de la silueta
  • Parte 9 - Clasificación con árboles, bosques aleatorios, técnicas de poda, entropía, maximización de la información
  • Parte 10 - Support Vector Machines para problemas de clasificación y regresión, kernels no lineales, reconocimiento facial (cómo funciona CSI)
  • Parte 11 - Los K vecinos más cercanos, decisión por mayoría, programación de algoritmos de Machine Learning vs librerías de Python
  • Parte 12 - Análisis de componentes principales, reducción de la dimensión, LDA
  • Parte 13 - Deep learning, Reinforcement Learning, Redes neuronales artificiales y convolucionales y Tensor Flow

Además, en el curso encontrarás ejercicios, datasets para practicar basados en ejemplos de la vida real, de modo que no solo aprenderás la teoría con los vídeos, si no también a practicar para construir tus propios modelos de Machine Learning. Y como no olvidar que tendrás un github con todo el código fuente en Python para descargar y utilizar en todos tus proyectos. Así que no esperes más y apúntate al curso de Machine Learning más completo y útil del mercado español!

Who this course is for:

  • Cualquiera interesado en aprender Machine Learning
  • Estudiantes que tienen un conocimiento de matemáticas que quieran aprender acerca del Machine Learning con Python
  • Usuarios intermedios que conocen los fundamentos de Machine learning como los algoritmos clásicos de regresión lineal o logística pero buscan aprender más y explorar otros campos del aprendizaje estadístico
  • Programadores que les guste el código y que estén interesados en aprender Machine Learning para aplicar dichas técnicas a sus datasets
  • Estudiantes de universidad que busquen especializarse y aprender a ser Data Scientists
  • Analistas de datos que quieran ir más allá gracias al Machine Learning
  • Cualquier persona que no esté satisfecha con su propio trabajo y busque empezar a trabajar como un Data Scientist profesional
  • Cualquier persona que quiera dar valor añadido a su propia empresa utilizando las potentes herramientas de Machine Learning
Basic knowledge
  • Se necesitan conocimientos de matemáticas de bachillerato o conocimientos básicos de estadística
  • Se recomienda saber programar un poco para enfocarse en aprender las técnicas de análisis en Python aunque no es totalmente necesario
What you will learn
  • Ser todo un master Jedi del Machine Learning con Python
  • Llevar a cabo predicciones precisas
  • Elaborar modelos robustos de Machine Learning
  • Utilizar las técnicas de Machine Learning para uso personal y para asesorar empresas
  • Tener una buena intuición de la mayoría de modelos de Machine Learning
  • Hacer análisis muy potentes y precisos
  • Dar valor añadido a tu propia empresa o negocio
  • Conocer qué modelo de Machine Learning se ajusta mejor a cada tipo de problema
  • Construir modelos diversos de Machine Learning y combinarlos para resolver cualquier problema que uno se plantee
  • Utilizar técnicas avanzadas para reducir la dimensión del problema
Curriculum
Number of Lectures: 223
Total Duration: 47:02:53
Introducción
  • Introducción  
Instalando nuestra herramienta de trabajo
  • Cómo instalar Python con Anaconda Navigator  
  • Cómo instalar paquetes en Python gracias a pip  
  • Instalación de pip en Windows  
  • Las librerías estándar de Machine Learning en Python  
  • Los editores para programar en Python  
  • Las 5 etapas del análisis de datos  
Una introducción al análisis predictivo y al Machine Learning
  • Ser Data Scientist es la profesión más sexy del siglo XXI  
  • ¿Qué es el análisis predictivo de datos?  
  • Data Scientist = Matemáticas + Programación + Business  
  • Aplicaciones y ejemplos del mundo del Data Science  
Limpieza de Datos
  • Data Cleaning  
  • El concepto de data frame  
  • El repositorio Git del curso  
  • Leer datos procedentes de un CSV  
  • Los parámetros de la función read_csv  
  • Ejemplos de diferentes carga de datos con read_csv  
  • El método open para la carga manual de datos  
  • Cuidado con el método open  
  • Leer y escribir en un fichero con Python  
  • Leer los datos desde una URL externa  
  • La carga de datos desde una hoja de cálculo  
  • Ejercicio: descargar y procesar datos desde una URL externa  
  • Las funciones básicas de resumen, estructura, dimensiones y cabecera  
  • ¿Por qué faltan valores en los data sets?  
  • Qué hacer cuando faltan valores en el dataset  
  • Las variables dummy  
  • Visualización básica de un dataset: el scatterplot  
  • Visualización básica de un dataset: el histograma de frecuencias  
  • Visualización básica de un dataset: el boxplot  
Operaciones de manejo de datos
  • Data Wrangling  
  • Una chuleta de pandas para Data Wrangling  
  • Fe de erratas  
  • Buscar un subconjunto de datos de un dataset  
  • Filtrados alternativos  
  • Subconjuntos de filas con ciertas condiciones  
  • Subconjuntos con loc e iloc y creación de nuevas columnas  
  • Generar números aleatorios  
  • La semilla de la generación aleatoria  
  • Funciones de distribución de probabilidades  
  • La distribución uniforme  
  • La distribución Normal  
  • El método de la simulación de Monte-Carlo para encontrar el valor de Pi  
  • Generando dummy data frames  
  • Un dummy data frame con variables categóricas  
  • Agrupación de los datos por categorías  
  • Agregación de datos  
  • Filtrado, Transformación y otras operaciones útiles  
  • Conjunto de entrenamiento y de testing  
  • Atualización: cómo dividir conjunto de entrenamiento y test  
  • Muestreo aleatorio: cómo dividir un dataset en conjunto de entreno y validación  
  • Concatenar dos datasets por filas  
  • Carga de cientos de datos distribuidos  
  • Ejercicio: el data set de los juegos olímpicos  
  • Concatenar los datos con merge  
  • Formas de cruzar tablas con joins  
  • Eliminar datos de datasets con restricciones de conjunto  
  • Ejemplos de joins con Python  
  • Ya conoces las bases del manejo de datos  
Conceptos básicos de estadística para la modelización predictiva
  • Los conceptos fundamentales de estadística  
  • Muestreo aleatorio y el teorema central del límite  
  • Test de la chi cuadrado  
  • Los contrastes de hipótesis  
  • Cómo hacer un contaste de hipótesis paso a paso  
  • Correlación entre variables  
  • Un resumen de lo aprendido  
Regresión lineal con Python
  • La regresión lineal  
  • Las matemáticas tras una regresión lineal  
  • Demostración de la obtención de los parámetros del modelo lineal  
  • Errores normalmente distribuidos  
  • Sumas de los cuadrados totales, de las diferencias y de la regresión  
  • Ejercicio demostrar que SST = SSR + SSD  
  • Encontrando los coeficientes óptimos de la regresión  
  • Interpretar los parámetros de la regresión  
  • Implementar una regresión lineal con Python  
  • Regresión lineal múltiple  
  • El problema de la multicolinealidad  
  • Validando nuestro modelo  
  • El resumen de todos los modelos lineales creados  
  • Regresión lineal con scikit-learn  
  • Modelos lineales con variables categóricas  
  • Variables categóricas en una regresión lineal  
  • Otra forma más simple de calcular las predicciones  
  • Enmascarado de variables categóricas redundantes  
  • Transformar las variables en relaciones no lineales  
  • El problema de los outliers  
  • Otros problemas y consideraciones de la regresión lineal  
  • Un resumen de la regresión lineal  
Regresión logística con Python
  • La regresión logística  
  • Regresión lineal vs regresión logística  
  • Las matemáticas detrás de la regresión logística  
  • Probabilidades condicionadas  
  • Cociente de probabilidades  
  • De la regresión lineal a la logística  
  • Estimación con el método de máxima verosimilitud  
  • Crear un modelo logístico desde cero  
  • Análisis exploratorio de los datos  
  • La selección de variables del dataset para el modelo logístico  
  • Implementar una regresión logística con Python  
  • Validación del modelo y evaluación del mismo  
  • Validación cruzada con Python  
  • Las matrices de confusión y las curvas ROC  
  • Implementación de las curvas ROC en Python  
  • Resumen de la regresión logística  
Clustering y clasificación
  • Clustering  
  • ¿Qué es y para qué sirve el clustering?  
  • El concepto de distancia  
  • Matriz de distancias en Python  
  • Métodos de enlace  
  • Uniendo datos manualmente  
  • Clustering jerárquico en Python  
  • Un clustering completo: la fase de exploración de datos  
  • Un clustering completo: representación del dendrograma  
  • Un clustering completo: por donde cortamos el dendrograma  
  • Un clustering completo: visualización final del clustering  
  • El método de k-means  
  • Implementando k-means con Python  
  • Ejercicio: Segmentación de los vinos  
  • El método del codo  
  • El coeficiente de la silueta  
  • Implementando la técnica del codo y el coeficiente de la silueta  
  • Propagación de la afinidad  
  • Implementando la propagación de la afinidad  
  • Generando distribuciones en forma de anillo  
  • Los K medoides y el clustering espectral  
  • Resumen del clustering  
Árboles y bosques aleatorios
  • Árboles y bosques aleatorios  
  • ¿Qué es un árbol de decisión?  
  • Homogeneidad en los datos  
  • Entropía y ganancia de Información  
  • Algoritmos para la generación de árboles de clasificación  
  • La poda del árbol  
  • Los problemas del árbol  
  • Los árboles de clasificación con Python  
  • El tratamiento de ficheros dot  
  • La validación cruzada en un árbol de clasificación  
  • Los árboles de regresión  
  • El dataset de las casas de Boston y Kaggle  
  • Árboles de regresión con Python  
  • Random forests  
  • Random forests para regresión  
  • Random forest para clasificación  
  • ¿Por qué funcionan los random forests?  
  • Resumen de árboles y bosques aleatorios  
Máquinas de Soporte Vectorial
  • Las máquinas de soporte vectorial  
  • Las support vector machines  
  • El problema de clasificación no óptimo  
  • Los núcleos no lineales y el problema de la dimensión  
  • Soporte Vectorial Clasificador Lineal  
  • Creando el modelo clasificador lineal  
  • Representación gráfica del hiperplano separador en 2D  
  • El problema de la separación  
  • Maximizar el margen de clasificación  
  • Los soportes de SVM  
  • Kernels no lineales  
  • Radial basis function  
  • Ajustando las SVM  
  • Práctica de SVM: reconocimiento facial a lo CSI  
  • Práctica de SVM: Clasificación de las flores de Iris  
  • Truco: qué hacer cuando me toca hacer una análisis de datos  
  • SVM para regresión  
K Nearest Neighbors
  • La decisión de los K vecinos  
  • Los k vecinos más cercanos  
  • Limpieza del dataset del Cancer  
  • Clasificación según los K vecinos  
  • Clasificando nuevos datos de los tests médicos  
  • Creando los datos para la clasificación  
  • Implementando la decisión por mayoría  
  • Nuestro algoritmo vs scikit-learn  
  • Una opinión final sobre los algoritmos de Machine Learning  
Sistemas de recomendación
  • El rol de las recomendaciones dinámicas en el siglo XXI  
  • El dataset de películas de Movie Lens  
  • Análisis exploratorio de los datos y distribución de las valoraciones  
  • Esparseidad de los datos  
  • División en entrenamiento y validación  
  • La matriz de similaridad entre usuarios  
  • Predecir la valoración de un ítem para un usuario  
  • Filtrando con los K nearest neighbors  
  • Corrección: Error en la clase anterior  
  • Sistemas de Recomendación basados en Ítems  
  • Recomendando con los K items más parecidos  
  • Los resultados finales  
Análisis de componentes principales
  • Análisis de Componentes principales  
  • El problema de la dimensión  
  • Demostración de cómo se hace un ACP  
  • Implementando nuestro propio ACP en Python  
  • Plotly, la librería de gráficos personalizados e interactivos  
  • Los valores y vectores propios de la matriz de covarianzas  
  • La matriz de correlaciones y el Singular Value Decomposition  
  • La selección de las componentes principales  
  • La proyección en el subespacio vectorial resultante  
  • Implementación de ACP con sklearn  
  • Más gráficos con Plotly  
  • Personalizando los gráficos de plotly  
  • Coloraciones y etiquetas de plotly  
Introducción a las redes neuronales y al deep learning con TensorFlow
  • Redes neuronales del futuro  
  • Introducción a Tensor Flow  
  • Acerca de las redes neuronales y el deep learning  
  • Instalando TensorFlow en tu ordenador  
  • La carga del dataset de imágenes  
  • Análisis exploratorio de los datos 1  
  • Un resumen visual de imágenes  
  • Pre procesado de imágenes previo al ML  
  • Creación del modelo  
  • Entrenamiento del modelo  
  • Validación del modelo  
  • El dataset de reconocimiento de dígitos  
  • De datos desestructurados a espacios vectoriales n-dimensionales  
  • La regresión softmax  
  • Tensorflow y la regresión softmax  
  • La fase de entrenamiento de la red neuronal  
  • La fase de evaluación de la red neuronal  
Juntar código de R y Python con la librería rpy2
  • Cuando Python conoce a R, no hay límites en el Big Data  
  • Instalar la librería rpy2  
  • Nota adicional para instalar rpy2 en Windows  
  • Llevando objetos de R a Python  
  • Llevando objetos de Python a R  
  • Cómo instalar y cargar paquetes de R desde Python  
  • La librería extRemes en acción desde Python  
  • Rmagic  
  • Lo bueno de programación en Python, lo mejor de estadística con R  
¿Qué nos depara el futuro?
  • Proyecto final. ¿Qué me depara el futuro?  
  • Un regalo para ti  
Reviews (0)