Dirigido a profesionales del área informática o afín que requieran utilizar herramientas computacionales y estadísticas para procesar y analizar grandes volúmenes de datos.
Sociedad de la Información y calidad de vida.
La nueva era de la máquina.
Calidad de los datos y buenas prácticas.
Big Data en la Gestión de Operaciones.
Big Data en la Gestión del Control.
Big Data en la Gestión Estratégica.
De problemas de negocios a tareas de minería de datos.
El proceso de minería de datos.
Nuevos modelos de negocio basados en Big Data.
Procesamiento de grandes volúmenes de datos.
Mapreduce, NoSQL, flujos de datos.
Proveedores de servicios: cloud, hosting, ecosistemas.
Distribución de datos (HDFS), tolerancia a fallas y balance de carga.
El ecosistema Hadoop.
MapReduce.
Hbase, Hive.
Pig.
Spark.
Arquitectura.
Procesamiento de consultas. Operadores de Consulta. Lenguajes de consulta.
Procesamiento distribuido de flujos de datos.
Spark.
Estadística Descriptiva e Inferencia.
Análisis exploratorio de datos.
Identificación de relaciones entre variables.
Técnicas de Análisis Cuantitativo.
Visualización de datos.
Clasificación, Agrupamiento y Reducción de dimensionalidad.
Apache Spark.
Machine Learning Library en Spark.
Enfoques Paralelos y Distribuidos en Machine Learning.
Aprendiendo de los datos.
Clasificación, Predicción y Agrupamiento.
Modelos Lineales.
Arboles de Clasificación.
Regresión Logística.
Redes Neuronales Artificiales.
Máquinas de Soporte Vectorial.
Algoritmo de K-medias.
Dr. en Informática, Universidad de Nantes, Francia. Docente e investigador de la Escuela de Ingeniería Informática PUCV en el área de Big Data.
Dr. en Ingeniería Informática, Universidad Técnica Federico Santa María, Chile. Docente e investigador de la Escuela de Ingeniería Informática PUCV en el área de Data Science.
Dr. (c) en Ingeniería Informática, Universidad Técnica Federico Santa María, Chile. Docente e investigador de la Escuela de Ingeniería Informática PUCV en el área de Data Science. Co-founder de Analitic, empresa dedicada a la recolección, clasificación y análisis de Big Data.
Se contará con expositores invitados para temas específicos.
Clases expositivas, actividades de laboratorio.
81 horas.
Las clases se dictan en dos sesiones semanales de 3 hrs c/u, en los siguientes horarios:
Viernes de 19:00 hrs. a 22:15 hrs y Sábado de 10:00 hrs. a 13:15 hrs.
Al final de cada módulo cada relator realizará una evaluación final que será calificada en el rango 1,0 a 7,0.
Se exige un mínimo de asistencia de 75% respecto de las 81 horas programadas.
Email: bigdata@pucv.cl
Director: Dr. Wenceslao Palma
[ wenceslao.palma@pucv.cl ]