Library

Course: Curso Completo De Machine Learning: Data Science con RStudio

Curso Completo De Machine Learning: Data Science con RStudio

  • Life Time Access
  • Certificate on Completion
  • Access on Android and iOS App
  • Self-Paced
About this Course

¿Te suenan las palabras Machine Learning o Data Scientist? ¿Te pica la curiosidad de para qué sirven estas técnicas o por qué empresas de todo el mundo pagan un sueldo de 120.000 hasta 200.000$ al año a un científico de datos? 

Pues este curso está pensado y diseñado por todo un profesional del mundo del Data Science como es Juan Gabriel Gomila, de modo que os va a compartir todo su conocimiento y ayudaros a entender la teoría tan compleja sobre las matemáticas que tiene detrás, los algoritmos y librerías de programación con R Studio para convertiros en todo unos expertos a pesar de que no tengáis experiencia previa. 

Veremos paso a paso como empezar a trabajar con conceptos y algoritmos del mundo del Machine Learning. Con cada nueva clase y sección que completes tendrás unas nuevas habilidades que te ayudarán a entender este mundo tan completo y lucrativo que puede ser esta rama del Data Science.

También decirte que este curso es muy divertido, en la línea de Juan Gabriel Gomila y que aprenderás y te divertirás mientras vas aprendiendo acerca de técnicas de Machine Learning con R Studio. 

El análisis de datos y el machine learning con R ha surgido como un enfoque muy importante para empresas de todo tipo, desde el mundo de las finanzas al de los videojuegos pasando por tiendas online o incluso los deportes. R permite que incluso aquellos que tienen comprensión intuitiva de los conceptos subyacentes, sin un trasfondo matemático profundo, den rienda suelta a análisis potentes y detallados de sus datos.

Este curso te mostrará cómo puedes poner sus habilidades de análisis de datos en R para uso práctico, con recetas que atienden las tareas básicas y avanzadas de análisis de datos. 

Desde la adquisición de los datos y su preparación previa para el análisis hasta las técnicas más complejas de análisis de datos, intentaremos llevar a cabo las implementaciones de cada técnica de la mejor manera posible. 

También visualizaremos los datos utilizando los paquetes más populares de R como ggplot2 y encontraremos información oculta en los mismos. 

Comenzando con la implementación de conceptos básicos del mundo del análisis de datos, como manejar sus datos para crear gráficos básicos, acabaremos dominaremos las técnicas de análisis de datos más avanzadas, como realizar análisis de clúster o generar informes y visualizaciones de análisis efectivas. 

También trabajaremos con series temporales, regresión y estimación de datos, un sistema de recomendaciones o el análisis de mercados financieros o redes sociales entre otros, por tanto ¡tienes muchos campos donde aplicar todo lo que aprendas aquí en el curso!

A lo largo del curso, conoceremos los problemas comunes y los obstáculos que se suelen encontrar al implementar cada una de las técnicas de análisis de datos en R, así como diferentes formas formas de superarlas de la manera más fácil posible.

Al final de este curso, tendrás todo el conocimiento que necesita para convertirte en un experto en análisis de datos con R, y poner sus habilidades a prueba en escenarios del mundo real.

Who this course is for:

  • Cualquiera que quiera iniciarse en el mundo de la estadística y el análisis de datos
  • Cualquiera interesado en aprender Machine Learning
  • Cualquiera que quiera aprender R y RStudio
  • Cualquiera con nociones básicas de R y estadística que busque conocer las técnicas avanzadas usadas por las grandes empresas
  • Estudiantes que tienen un conocimiento de matemáticas que quieran aprender acerca del Machine Learning con R
  • Usuarios intermedios que conocen los fundamentos de Machine learning como los algoritmos clásicos de regresión lineal o logística pero buscan aprender más y explorar otros campos del aprendizaje estadístico
  • Programadores que les guste el código y que estén interesados en aprender Machine Learning para aplicar dichas técnicas a sus datasets
  • Estudiantes de universidad que busquen especializarse y aprender a ser Data Scientists
  • Analistas de datos que quieran ir más allá gracias al Machine Learning con RStudio
  • Cualquier persona que no esté satisfecha con su propio trabajo y busque empezar a trabajar como un Data Scientist profesional
  • Cualquier persona que quiera dar valor añadido a su propia empresa utilizando las potentes herramientas de Machine Learning
Basic knowledge
  • Saber usar un ordenador con fluidez, independientemente del sistema operativo
  • Tener conocimientos básicos de estadística o de R es recomendable pero no necesario para seguir el curso
  • Se necesitan conocimientos de matemáticas de bachillerato o conocimientos básicos de estadística
What you will learn
  • Adquirir, formatear y visualizar nuestros datos usando R
  • Usar R para realizar un análisis exploratorios de los datos
  • Conocer algoritmos de machine learning tales como clasificación y regresión
  • Saber llevar acabo el análisis de redes sociales
  • Generar informes dinámicos con Shiny
  • Conocer y saber realizar el análisis geoespacial
  • Manejar datos grandes con R usando Spark y MongoDB
  • Construir un sistema de recomendaciones incluyendo el filtrado colaborativo, basado en contenido e híbrido
  • Conocer ejemplos del conjunto de datos del mundo real como la detección de fraude y reconocimiento de imágenes
  • Ser todo un master Jedi del Machine Learning con R Studio
  • Llevar a cabo predicciones y toma de decisiones precisas
  • Elaborar modelos robustos de Machine Learning
  • Utilizar las técnicas de Machine Learning para uso personal y para asesorar empresas
  • Tener una buena intuición de la mayoría de modelos de Machine Learning
  • Construir modelos diversos de Machine Learning y combinarlos para resolver cualquier problema que uno se plantee
  • Utilizar técnicas avanzadas para reducir la dimensión del problema
Curriculum
Number of Lectures: 199
Total Duration: 50:38:56
Introducción
  • Introducción  
  • Contenidos del curso  
Conoce R y RStudio
  • Descargando nuestra herramienta de trabajo: R y R Studio  
  • La organización es la clave  
  • Un paseo por la interfaz de R Studio  
Adquirir y preparar nuestros ingredientes - Los datos
  • Preparando los datos para su análisis  
  • ¿En qué consiste esto del Data Science?  
  • El fichero CSV y la función read.csv  
  • Opciones adicionales de read.csv  
  • Leyendo datos de un XML  
  • Leyendo tablas incrustadas en un HTML  
  • Leyendo datos desde un JSON  
  • Acceso a los datos con la sintaxis de $  
  • Los ficheros de ancho fijo  
  • Creando ficheros Rdata y rds  
  • Cargando ficheros Rdata y rds  
  • Eliminar datos sin valor con na.omit  
  • Limpieza selectiva de los datos sin valor  
  • Reemplazo de NA con la media o extracción aleatoria  
  • Evitando duplicaciones de entradas  
  • Reescalado lineal de datos  
  • Normalizando o estandarizando datos de un data frame  
  • Categorizando información numérica  
  • Variables ficticias para categorizaciones  
  • Formas de eliminar la información que falta  
  • Formas de completar la información que falta  
  • Combinando y separando los datos  
  • Uso de modelos predictivos para eliminar NAs  
  • Detección de outliers a través de box plots  
  • Enmascarando los outliers con transformaciones y cappings  
¿Qué tenemos aquí? - El análisis exploratorio datos
  • Acerca del análisis exploratorio de los datos  
  • Resumiendo nuestros datos con summary y str  
  • Estadísticos y medidas básicas  
  • Subconjuntos de datos  
  • Divisiones con split  
  • Partición de data frames con variables numéricas  
  • Partición de data frames con variables categóricas  
  • Histogramas, boxplots y scatterplots  
  • Personalizando nuestros gráficos  
  • Múltiples gráficos con la función par  
  • El paquete lattice  
  • Comparación a través de representaciones  
  • El gráfico de las judías  
  • Análisis de la causalidad  
  • La técnica de la validación cruzada  
  • Gráficos cuantil - cuantil  
¿Donde pongo esto? - El proceso de clasificación
  • Acerca de la clasificación en data science  
  • Cómo generar matrices de confusión  
  • Diagramas de mosaico  
  • Análisis de componentes principales  
  • Diagramas ROC  
  • Los árboles de clasificación  
  • La poda del árbol de clasificación  
  • Los bosques aleatorios  
  • Máquinas de soporte vectorial  
  • Naïve Bayes  
  • K Nearest Neighbors  
  • Eligiendo el mejor número de vecinos para la decisión  
  • Redes neuronales para clasificar  
  • Análisis del discriminante lineal  
  • La regresión logística  
  • Conexión a la API de Twitter  
  • Limpiando los tweets descargados  
  • Clasificación de textos para análisis de sentimiento  
¿Cuanto voy a vender? - Regresión
  • La regresión para predecir valores  
  • La raíz del error cuadrático medio  
  • ¿Cuanto voy a vender? - Regresión - K nearest neighbors  
  • K Nearest Neighbors sin partición de validación  
  • Regresión  
  • Entendiendo los gráficos de los residuos en un modelo lineal  
  • Opciones para las fórmulas de un modelo lineal  
  • La función step para simplificar el modelo lineal  
  • Árboles de regresión  
  • Las técnicas de Bagging and Boosting  
  • Bosques aleatorios para regresión  
  • Redes neuronales para regresión  
  • Implementando una k-fold cross validation en R  
  • Implementando una LOOCV en R  
Simplifiquemos los datos - Técnicas de reducción de datos
  • Reduciendo los datos con Clustering y ACP  
  • Clustering jerárquicos y dendogramas  
  • Las distancias y el método de generación del cluster  
  • Clusterings divisitivos y cortes en el dendograma  
  • Clustering partitivos con k-means  
  • Mini Batch K-means para segmentación de imágenes  
  • Particiones alrededor de los k medoides  
  • Clustering large application (clara)  
  • Validando los resultados de un clustering  
  • Clusterings basados en densidad de puntos  
  • Clusterings basados en modelos  
  • Reducir dimensiones con ACP  
Aprendiendo del pasado para pronosticar el futuro - Las Series Temporales
  • Series temporales y su utilidad  
  • Trabajando con información financiera  
  • Datos en tiempo real con quantmod  
  • El formato de fecha en R  
  • Operaciones y secuencias de fechas  
  • Análisis preliminar de una serie temporal  
  • El objeto serie temporal de R  
  • La descomposición de una serie temporal  
  • El filtrado de series temporales para localizar tendencias  
  • Suavizado y predicción con el método de Holt-Winters  
  • Creando un modelo autorregresivo integrado de media móvil  
Un cambio de look - Visualización de datos avanzada
  • El paquete ggplot2  
  • Gráficos de dispersión  
  • Gráficos de líneas  
  • Gráficos de barras  
  • Gráficos de distribuciones  
  • Gráficos de mosaicos  
  • Treemaps  
  • Graficos con Matrices de correlación  
  • Agregando tonalidades a las matrices de color  
  • Mapas de calor  

    Tenéis el grafo de Juego de Tronos disponible desde aquí:

    http://www.lyonwj.com/2016/06/26/graph-of-thrones-neo4j-social-network-analysis/

  • Representaciones en forma de grafo  
  • Etiquetas y leyendas  
  • Colores y temas  
  • Gráficos multivariantes  
  • Gráficos multivariantes con GGalli  
  • Gráficos 3D y animaciones  
  • Textos e Histogramas en 3D  
  • Exportando los gráficos a varios formatos de salida  
¡Creo que esto podría gustarte! - Sistemas de recomendación
  • Ofrecer una buena recomendación  
  • El dataset de Movie Lens  

    Si quieres el data set completo de películas, y no solo la versión reducida de 1000 películas, te recomiendo echarle una ojeada a 

    https://grouplens.org/datasets/movielens/

    Full: 26,000,000 ratings and 750,000 tag applications applied to 45,000 movies by 270,000 users. Includes tag genome data with 12 million relevance scores across 1,100 tags. Last updated 8/2017.

  • Los datos de las peliculas y las matrices sparsed  
  • Sistemas de filtrado colaborativo basado en ítems  
  • Sistemas de filtrado colaborativo basado en usuarios  
  • Representando la matriz de valoraciones  
  • Filtrado colaborativo para datos binarios  
  • Sistemas basados en contenido  
  • Haciendo una clasificación de películas con clustering  
  • Los sistemas de recomendaciones híbridos  
  • Medidas de semejanza  
  • Introducción a Machine Leerning  
  • Añadiendo repositorios de terceros, Githubs y fuentes externas  
  • Una aplicación de ML - Sistema de reconocimiento de imágenes  
  • Validando nuestras recomendaciones con validación cruzada  
  • Evaluación de las valoraciones  
  • Evaluación de las recomendaciones  
  • Eficacia y Precisión  
  • Identificar el modelo adecuado  
  • Optimización de parámetros  
  • Definiciones en el contexto de clasificación y recomendación  
  • Cómo funciona el sistema de detección de fraudes  
Conexiones por doquier - Análisis de Redes Sociales
  • El papel de las redes sociales en el análisis de datos  
  • La red social de Meetup y su API  
  • Generar llamadas parametrizadas a las API  
  • El problema del exceso de datos y el uso de data.table  
  • Las matrices de adyacencia y listas de aristas de un grafo  
  • El paquete igraph para representar grafos  
  • Más opciones del paquete igraph  
  • Nomenclatura y métricas de grafos  
  • Calculando métricas en grafos  
  • Añadir y quitar nodos y aristas en un grafo  
  • Análisis de tweets y el grafo de retweets  
  • Layouts basados en fuerzas de atracción y repulsión  
  • Gephi y más layouts  
Un data scientist vale lo que sus informes
  • La documentación y presentación de los hallazgos  
  • R markdown  
  • Combinando HTML y R  
  • Plots y más opciones de configuración en Markdown  
  • Tablas con HTML y Kable  
  • Shiny  
  • Distribuyendo el reporte en pestañas  
  • Selecciones dinámicas del usuario  
  • Incrustando Shiny en un Markdown  
  • Presentaciones en PDF  
  • Generación dinámica de reportes  
Soluciones elegantes y eficientes en R
  • R no es un lenguaje de programación convencional  
  • Operaciones vectorizadas  
  • El uso de la función apply  
  • Las funciones lapply y sapply  
  • Aplicando funciones a subconjuntos con tapply y by  
  • La técnica de dividir - aplicar - combinar  
  • Trabajar con grandes datos con dplyr  
  • Grandes datos y Data Table  
  • Slice and Dice con Data Table  
Análisis de datos geoespaciales (GIS)
  • Acerca de los datos geoespaciales  
  • El uso de mapas del paquete RGoogleMaps  
  • Representando puntos sobre un mapa  
  • Representar un mapa de calor con los crímenes de Chicago  
  • Cargar ficheros ESRI  
  • Representar datos de un fichero ESRI  
  • El paquete maps de RStudio  
  • Conversión de data frame a objetos espaciales  
  • Combinar data frames, mapas y objetos espaciales  
  • Añadir una nueva columna de datos con spCbind  
Un regalo final: otros lenguajes de programación y software con R
  • Trabajando con otros lenguajes de programación  
  • Instalando rJava desde fuentes externas  
  • Objetos de Java en R  
  • La sintaxis de Java en los métodos de R explicada  
  • Integración con Microsoft Excel  
  • El mundo de las bases de datos relacionales y paquetes de R para conectarse  
  • Instalando MySQL y MySQL Workbench  
  • Cargando datos en MySQL a partir de un CSV  
  • La librería RODBC  
  • La librería de RMySQL  
  • La librería RJDBC  
  • Instalando MongoDB  
  • El poder de las bases de datos no relacionales con R y MongoDB  
  • El uso de Spark en RStudio  
  • Conectando Spark, MySQL y análisis de datos distribuidos con RStudio  
Reviews (0)