Manejo de grandes volúmenes de datos (Big Data) (online)
Curso
Online
Descripción
-
Tipología
Curso
-
Metodología
Online
-
Horas lectivas
75h
El real mejoramiento de la eficiencia organizacional está relacionado con la implementación de soluciones tecnológicas que permiten agilizar la toma de decisiones en base a información cuantitativa y cualitativa relevante en tiempo real. Dicha información proviene de una adecuada administración de grandes volúmenes de datos por minuto, que demandan extensos y rigurosos análisis junto con métricas e indicadores cada vez más exactos. El análisis de grandes volúmenes de datos permite extraer tendencias y patrones complejos de información, con enormes implicancias estratégicas, permitiendo predecir mejor y transformando la forma en la que se hacen hoy en día los negocios. Este curso permite al alumno escoger las herramientas adecuadas para manejo de los datos en su empresa, entendiendo las infraestructuras computacionales que se requieren para manejar datos de distintos volúmenes y características.
A tener en cuenta
Conocer las herramientas necesarias para transformar una empresa tradicional a una empresa que maneja datos de distinta complejidad.
- Analizar las distintas fuentes de los datos, e identificar las mejores infraestructuras computacionales para su manejo.
- Utilizar herramientas clásicas de manejo de los datos en el contexto de una organización.
Profesionales a cargo de tomar decisiones y que observan potenciales beneficios en el uso de tecnologías relacionadas a Big Data, quienes buscan incrementar significativamente las ventajas competitivas en su organización. En particular, el curso está orientado a un amplio rango de profesionales en las áreas de gestión, finanzas, comercial, marketing y en múltiples sectores desde salud, hasta la banca. A quienes aporte valor en su quehacer el comprender cómo se manejan y organizan grandes volúmenes de datos para su posterior análisis y uso.
Opiniones
Materias
- Base de datos
- Análisis de datos
- Bases relacionales
- Integración de datos
- Sistemas Distribuidos
- Base de datos de grafos
- Procesamiento de datos
Profesores
Domagoj Vrgoc
Doctor en Computación, Universidad de Edimburgo, Reino Unido
Doctor en Computación, Universidad de Edimburgo, Reino Unido. Profesor Asistente del Instituto de Ingeniería Matemática y Computacional de la Pontificia Universidad Católica. Sus áreas de interés son manejo de datos, la Web Semántica y Teoría de Computación. Su tesis de doctorado fue destacada por la British Computing Society como una de las mejores de su generación. Es autor de más de 30 papers técnicos y ha sido parte de los comités de programas de las conferencias más importantes en bases de datos, la Web, e Inteligencia Artificial, como ACM PODS, ICDT, WWW, ISWC, IJCAI, entre otros.
Temario
- Diversas fuentes de datos (excel, CSV, texto plano, páginas web)
- Organización clásica de los datos: Bases de datos relacionales
- Lenguaje SQL
- Propiedades de una base de datos relacional: ACID
- Integración de los datos
Bases de datos distribuidas
- Paso al mundo de big data (limitaciones de una base de datos relacional)
- Un sistema distribuido
- Propiedades de sistemas distribuidos: CAP y BASE
- Limitaciones de sistemas distribuidos: ACID vs CAP
- Resolución de fallas en un sistema distribuido usando el consenso distribuido
Bases de datos NoSQL
- Características de sistemas NoSQL
- Bases de datos de búsqueda: Amazon Dynamo
- Bases de datos de documentos: MongoDB
- Bases de datos de grafos: Neo4J
Procesamiento masivo de datos
- Distribución de los datos (Google distributed File System)
- Map-reduce
- Infraestructura de Apache Hadoop
- Apache Pig: lenguaje de scripting para Hadoop
Manejo de grandes volúmenes de datos (Big Data) (online)