Taller BigData

Desde las 20:00 hasta 22:30 el 22/05/2014


Programación de la jornada

Big Spatial Data, hic sunt dracones!
Hablar de geotecnologías y big data es adentrarnos en una terra incognita, plagada de quimeras y monstruos como en los mapas antiguos. Llevar la revolución del big data al geoprocesamiento y la cartografía presenta grandes retos, como veremos. Hay algunos avances, como las herramientas geomáticas de MongoDB, las posibilidades de GEOjson o la conexión de ESRI con Hadoop. Merece la pena echar un vistazo a los nuevos 'mapas sociales' que la Era de la Información nos trae. Hic Sunt Dracones!

La charla será impartida por Jorge Úbero, creador del portal Big Data 4 Success, tu recurso online sobre big data en español (@BD4S_1)

Orquestando flujos de datos

Son muchas las herramientas y alternativas que hay en BigData para el procesamiento de datos. Mucas veces los consultores se ven con la necesidad de aprender diferentes tipos de gestores y/o creación de elementos de orquestación de procesos vía código. La charla introduce Pentaho Data Integration y las capacidades para poder interactuar con sistemas Big Data, ya sea en la creación de procesos MapReduce con Hadoop, consultas a gestores de datos NoSQL como Cassandra, HBase o MongoDB, o la facilidad de orquestar acciones de tratamiento de datos.

La charla será impartida por Ignacio Bustillo, profesor asociado en los masters de BigData de la Utad y periodismo de datos por la URJC.

Introducción a Cassandra y modelado de series temporales

Modelado de series temporales. Motivos por los cuales Cassandra es la mejor elección para este tipo de aplicación y su uso en Smart cities. Introducción al datamining sobre Cassandra

La charla será impartida por José Hernández es miembro de Isthari, primer partner en España de la principal base de datos BigData, Cassandra.

Analítica "big  data" sobre Hadoop usando R
La charla introduce Hadoop y las implicaciones que tiene trabajar con datos que ya no son locales tanto desde el punto de vista tecnológico como analítico. A continuación, se presentan los paquetes disponibles para manejar Hadoop desde R y se explica el paradigma MapReduce.La tercera parte de la charla comenta como pueden distribuirse los diferentes algoritmos para que se ejecuten sobre muchas máquinas en paralelo.

La charla será impartida por Santiago Basaldúa. PhD Senior Data Scientist en Sinergic Partners. Doctor en informática y estadístico.

Lugar:
Auditorio (2ª Planta / 2nd Floor)

Sesiones de la actividad

La actividad está finalizada
Etiquetas:
#R #big data #datos