Autoplay
Autocompletar
Lección previa
Completar y continuar
Curso completo para ser un experto en Machine Learning - Data Science con R y RStudio
Sección 1: Introducción
Introducción (2:44)
Contenidos del curso (7:24)
Conoce a Juan Gabriel Gomila, tu instructor online (2:12)
Únete a la comunidad de Discord para aprender con amigos (3:45)
Sección 2: Conoce R y RStudio
Descargando R y RStudio (15:23)
Ayuda con la instalación de R y Rstudio
Si tienes problemas con Ubuntu...
La organización es clave (20:16)
Un paseo por R Studio (5:39)
Repositorio de los proyectos del curso de Data Science
Sección 3: Adquirir y preparar nuestros ingredientes: los datos
Preparando los datos para su análisis (2:54)
¿En qué consiste el data science? (13:10)
El fichero csv y la función read.csv (15:07)
Opiciones adicionales de read.csv (14:47)
Cuestionario 1: Los datos en CSV
Leyendo datos de un XML (13:25)
Leyendo tablas incrustadas en un HTML (11:27)
Problemas leyendo tablas en HTML
Cuestionario 2: Los datos en XML
Leyendos datos desde un JSON (10:23)
Alternativa a la API de Yahoo finanzas
Acceso a los datos con la sintaxis de $ (9:59)
Cuestionario 3: Los datos en un JSON
Los ficheros de ancho fijo (13:17)
Cuestionario 4: Los datos en un fichero de ancho fijo
Creando fcheros Rdata y rds (11:49)
Cargando ficheros Rdata y rds (15:37)
Cuestionario 5: Los ficheros de datos de R
Eliminar datos sin valos con na.omit (7:13)
Limpieza selectiva de los datos sin valor (11:44)
Remplazo de NA con la media o extracción aleatoria (22:39)
Evitando duplicaciones de entradas (6:52)
Reescalado lineal de datos (14:02)
Normalizando o estandarizando datos de un dataframe (16:54)
Cuestionario 6: Limpieza de datos
Categorizando información numerica (15:23)
Variables ficticias para categorizaciones (12:27)
Formas de eliminar la información que falta (20:14)
Formas de completar la información que falta (26:04)
Cuestionario 7: Preparando nuestros datos iniciales
Combinando y separando los datos (27:04)
Uso de modelos predictivos para eliminar NAs (23:54)
Detección de outliers a través de boxplots (18:18)
Enmascarando los outliers con transformaciones y cappings (15:21)
Cuestionario 8: Corrección de los datos
Sección 4: ¿Qué tenemos aquí? El análisis exploratorio de datos
Acerca del análisis exploratorio de los datos (3:20)
Resumiendo nuestros datos con summary y str (14:52)
Estadísticos y medidas básicas (25:46)
Cuestionario 9: Análisis exploratorio inicial
Subconjunto de datos (25:14)
Divisiones con split (6:57)
Partición de dataframes con variables numericas (14:23)
Partición de dataframes con varianles categróricas (19:14)
Cuestionario 10: División de los datos
Histogramas, boxplots y scatterplots (22:19)
Personalizando nuestros gráficos (16:59)
Multiples gráficos con la función par (7:14)
El paquete lattice (13:32)
Comparación a traves de representaciones (19:06)
El gráfico de las judías (6:03)
Análisis de la causalidad (12:00)
Cuestionario 11: Representación de los datos
La técnica de la validación cruzada (13:39)
Gráficos cuantil-cuantil (28:51)
Sección 5: ¿Dónde pongo esto? - El proceso de clasificación
Acerca de la clasificación del data science (2:50)
¿Cómo generar matrices de confusión? (15:05)
Diagramas de mosaico (8:03)
Análisis de componentes principales (23:22)
Diagramas ROC (24:23)
Cuestionario 12: Análisis y representaciones para clasificar correctamente
Los arboles de clasificación (21:35)
La poda del árbol de clasificación (18:25)
Los bosques aleatorios (16:12)
Cuestionario 13: Un árbol de clasificación
Máquinas de soporte vectorial (26:22)
Naive-bayes (12:32)
K Neares Neighbours (18:16)
Eligiendo el mejor numero de vecinos para la decisión (16:51)
Redes neuronales para clasificar (21:22)
Análisis del discriminante lineal (9:28)
La regresión logística (14:15)
Cuestionario 14: Técnicas de clasificación
Conexión a la Api de Twitter (13:02)
Limpiando los tweet descarados (15:51)
Clasificación de textos para análisis de sentimiento (13:09)
Sección 6: ¿Cuánto voy a vender? - Regresión
La regresión para predecir valores (2:38)
La raíz del error cuadrático medio (10:15)
K Nearest Neighbours (23:28)
K Nearest Neighbours sin partición de validación (20:51)
Regresión lineal (25:22)
Entendiendo los gráficos de los residuos en un modelo lineal (21:55)
Opciones para las fórmulas de un modelo lineal (10:26)
La función step para simplificar el modelo lineal (8:09)
Cuestionario 15: Predicción de valores
Árboles de regresión (22:51)
Las técnicas de Bagging & Boosting (10:40)
Bosques aleatorios para regresión (13:30)
Redes neuronales para regresión (11:04)
Implementando una k-fold cross validation en R (17:11)
Implementando una LOOCV en R (7:00)
Cuestionario 16: Técnicas avanzadas de regresión
Sección 7: Simplifiquemos los datos - Técnicas de reducción de datos
Reduciendo los datos con Clustering y ACP (3:08)
Clustering jerárquicos y dendogramas (14:02)
Las distancias y el método de generación del cluster (14:37)
Clusterings distintivos y cortes en el dendograma (11:22)
Clusterings partitivos con k-means (17:12)
Mini batch k-means para segmentación de imágenes (20:09)
Cuestionario 17: Técnicas de reducción de datos
Particiones alrededor de los kmedoides (8:30)
Clustering large aplication (clara) (4:16)
Validando los resultados de un clustering (33:29)
Clustering basados en densidad de puntos (17:31)
Clustering basados en modelos (9:17)
Reducir dimensiones con ACP (15:27)
Cuestionario 18: Técnicas de clustering avanzadas
Sección 8: Aprendiando del pasado para pronosticar el futuro - Las Series Temporales
Las series temporales y su utilidad (2:33)
Trabajando con información financiera (23:59)
Datos en tiempo real con quantmod (8:44)
El formato de fecha en R (19:31)
Operaciones y secuencias de fechas (8:24)
Análisis preliminar de una serie temporal (18:20)
El objeto serie temporal de R (17:44)
La descomposición de una serie temporal (15:24)
El filtrado de series temporales para localizar tnedencias (11:27)
Suavizado y predicción con el método de Holt-Winters (13:03)
Creando un modelo autoregresivo integrado de media móvil (7:32)
Cuestionario 19: Las series temporales
Sección 9: Un cambio de look - Visualización de datos avanzada
El paquete ggpolt2 (5:06)
Gráficos de dispersión (20:05)
Gráficos de lineas (7:33)
Gráficos de barras (14:16)
Gráficos de distribuciones (11:19)
Gráficos de mosaicos (6:46)
Treemaps (10:47)
Gráficos con matrices de correlación (21:27)
Agregando tonalidades a las matrices de color (11:23)
Mapas de calor (15:05)
Representaciones en forma de grafo (15:06)
Etiquetas y leyendas (13:08)
Colores y temas (12:23)
Gráficos multivariantes (18:12)
Gráficos multivariantes con ggalli (17:28)
Gráficos 3D y animaciones (18:35)
Textos e histogramas en 3D (16:52)
Exportando los gráficos a varios formatos de salida (9:26)
Cuestionario 20: Gráficos con ggplot2
Sección 10: ¡Creo que esto podría gustarte! - Sistemas de recomendación
Ofrecer una buena recomendación (4:22)
El dataset de movie Lens (9:03)
Los datos de las películas y las matrices sparsed (8:10)
Sistemas de filtrado colaborativos basado en ítems (11:47)
Sistemas de filtrado colaborativos basado en usuarios (9:09)
Representando la matriz de valoraciones (16:52)
Filtrado colaborativo para datos binarios (13:13)
Sistemas basados en contenidos (20:34)
Haciendo una clasificación de películas con clustering (38:31)
Los sistemas de recomendaciones híbridos (9:35)
Medidas de semenjanza (16:44)
Cuestionario 21: Dando recomendaciones
Introducción al machine learning (6:36)
Añadiendo repositorios de terceros, githubs y fuentes externas (17:02)
Un aplicación de ML - sistema de reconocimiento de imágenes (31:15)
Validando nuestras recomendaciones con validación cruzada (8:42)
Evaluación de las valoraciones (11:33)
Evaluación de las recomendaciones (8:22)
Eficacia y precisión (7:04)
Identificar el modelo adecuado (12:44)
Optimización de parámetros (13:38)
Definiciones en el contexto de clasificación y recomendación (6:29)
¿Cómo funciona el sistema de detección de fraudes? (30:18)
Cuestionario 22: Una introducción a Machine Learning
Sección 11: Conexiones por doquier - Análisis de Redes Sociales
El papel de las redes sociales en el análisis de datos (3:30)
La red social de meetup y su API (26:10)
Generar llamadas parametrizadas a las API (25:02)
El problema del exceso de datos y el uso de data.table (17:19)
Cuestionario 23: La red social de Meetup
Las matrices de adyacencia y la lista de aristas de un grafo (21:14)
El paquete igraph para representar grafos (20:32)
Más opciones del paquete igraph (30:03)
Nomenclatura y métricas de grafos (17:33)
Calculando métricas en grafos (16:50)
Añadir y quitar nodos y aristas en un grafo (12:30)
Análisis de tweets y el grafo de retweets (31:09)
Layouts basados en fuerzas de atracción y repulsión (15:47)
Gephi y más layouts (18:36)
Cuestionario 24: La red social de Twitter
Sección 12: Un datasciencist vale lo que sus informes
La documentación y presentación de los hallazgos (3:16)
R mark down (13:50)
Truco: qué hacer si markdown no me genera el fichero en PDF (18:10)
Combinando html y R (25:27)
Plots y más opciones de configuración en mark down (22:57)
Tablas con html y kable (24:53)
Shiny (25:10)
Distribuyendo el reporte en pestañas (13:24)
Selecciones dinámicas del usuario (22:31)
Incrustando shiny en un mark down (16:51)
Presentaciones en PDF (26:56)
Generación dinámica de reportes (23:14)
Sección 13: Soluciones elegantes y eficientes en R
R no es un lenguaje de programación convencional (5:32)
Operaciones vectorizadas (15:54)
El uso de la función apply (12:48)
Las funciones lapply y sapply (17:09)
Aplicando funciones a subconjuntos con tapply y by (6:53)
La técnica de dividir-aplicar-combinar (23:29)
Trabajar con grandes datos con dplyr (12:40)
Grandes datos y data table (23:54)
Slice and dice con data table (26:19)
Cuestionario 25: Optimización del código
Sección 14: Análisis de datos geoespaciales (GIS)
Acerca de los datos geoespaciales (2:48)
El uso de datos del paquete de datos rgooglemaps (8:44)
Nota: la API de Google Maps ha cambiado
Representando puntos sobre un mapa (19:25)
Representar un mapa de calor con los crímenes de Chicago (17:05)
Cargar ficheros ESRI (13:32)
Representar datos de un fichero ESRI (10:38)
El paquete maps de R Studio (7:20)
Conversión de dataframe a objetos espaciales (11:01)
Combinar dataframes, mapas y objetos espaciales (20:51)
Añadir una nueva columna de datos con spCbind (9:29)
Cuestionario 26: Análisis de información geoespacial
Sección 15: Un regalo final: Otros lenguajes de programación y software con R
Trabajando con otros lenguajes de programación ??? (6:20)
Instalando rJava desde fuentes externas (11:29)
Objetos de java en R (21:09)
La sintaxis de java en los métodos de R explicada (18:03)
Integración con Microsoft Excel (20:54)
El mundo de las bases de datos relacionales paquetes de R para conectarse (4:56)
Instalando MySQL y MySQLWorkbench (6:48)
Cargando datos en MySQL a partir de un CSV (8:26)
La libreria RODBC (16:12)
La libreria RMySQL (15:00)
La libreria RJDBC (11:14)
Instalando MongoDB (10:55)
El poder de las bases de datos con R y MongoDB (45:03)
El uso de Spark en RStudio (25:29)
Conectando Spark MySQL y análisis de datos distribuidos con RStudio (36:36)
Sección 16: Bonus, ¡Un regalo para ti!
Nos vemos en el próximo curso (1:44)
Gráficos de mosaicos
Contenido bloqueado
Si ya estás inscrito,
deberás iniciar sesión
.
Inscríbase en el curso para desbloquear