BigData Spain 2013 - Día 1 :: Un repaso + Valoraciones y comentarios

00:56

Hoy ha comenzado los dos días más esperados del año para todo desarrollador/analista/arquitecto relacionado con el mundo del "BigData" en España.


Hablamos del Big Data Spain, un evento organizado por Paradigma Tecnológico y patrocinado por Stratio / Microsoft como miembros Platinum, BBVA / IBM como miembros Gold y Datastax / Synergic como miembros Silver.

Voy a ir comentando las distintas ponencias y el qué me llevo de ellas a casa, en este caso del primer día.

Pero antes os quiero hablar de la organización:

Ha sido una de las mejores organizaciones que he visto en un evento. La entrada vale 150€, pero el cariño con el que están cuidados cada uno de los detalles para hacer agradable, cómoda y amena la estancia en Kinépolis ha sido excepcional, vale la pena el esfuerzo con creces.

Chapó a todo el equipo, lo digo de corazón.

~ 09:00 - 09:30 - Abre el congreso Oscar Méndez.


Ha dado una visión sobre lo que ha ocurrido este último año, desde el BigData Spain de 2012 (nuestros compañeros de SideLab de la URJC han hecho un buen resumen de ese evento). También ha comentado lo necesario que es para las empresas que no se queden al margen de esta "ola de BigData", puesto que el no manejarla adecuadamente se puede convertir en un Tsunami para ellas mismas, siendo desplazadas del sector.

~ 09:30 - 10:30 - Data Science - From Lab to Factory


Sean Owen, el director de Data Science en Cloudera nos ha dado una charla explicando la figura del "Científico de Datos" y su importancia en el futuro. Según el esta nueva figura tiene y debe tener, una formación 80% ingeniero y un 20% estadista. También habló sobre Hadoop y varias tecnologías relacionadas, algunas de las cuales ya hemos hablado en este blog, como HBase.

~ 10:30 - 11:00 - Break
La organización ha planteado un descanso en el que nos han servido café, zumos, bollitos, pasteles...ha sido memorable. Un evento muy cuidado en cuanto al catering.

~ 11:00 - 11:40 - Separating Hadoop Myths from Reality



Rob Anderson, VP de Ingeniería de Sistemas de MapR nos ha dado una charla orientativa sobre Hadoop, lo que se puede y lo que no se puede hacer con él, así como cuándo, cómo, dónde y por qué es necesario aplicarlo. También ha animado a las empresas a que se muevan y se animen a formar parte del BigData.

~ 11:40 - 12:40 - BigData: The Easy Way



Santiago Lorente y Pedro Pablo Malagón nos han hablado de cómo utilizan Azure con Hadoop y sus Excels. Nos han enseñado como ejecutan un Word Count clásico en sus sistemas que utilizan HIVE y Hadoop como principales sistemas de almacenamiento y gestión de datos. Esta charla me ha dejado con doble sabor. Por un lado me ha parecido una charla genial, muy aclaratoria de lo que hacen y bien explicada, con alto nivel de credibilidad de que sus soluciones funcionan. Por otro, me parece de un cinismo tecnológico aberrante, tirando a lo sospechosamente macabro, el que utilicen sistemas propietarios en front end y en back end sistemas open source, donde sus MapReduce se escriben en Visual C#, todo muy siniestro y un poco sucio moralmente, puesto que si usas open source, lo mínimo es que tú seas también open source, y con Microsoft nos encontramos con esa solución híbrida, extraña, funcional a la que le queda muuuucho camino por recorrer.

~ 12:40 - 13:20 - NoSQL: The New Normal for Big Data and Beyond



Luca Olivari, director EMEA de MongoDB nos ha enseñado como unen MongoDB (un servidor) con Hadoop (Múltiples servidores). Ha sido muy amena, aclaratoria sobre como juega MongoDB en el "BigData". La única sensación que me llevo es que su conector debe estar un poco verde y quizás es dificil de gesionar la consistencia de los datos en una sola bbdd MongoDB (o varias) por mucho buen throughtput que tenga (que lo tiene). A destacar sus diapositivas, excelentes. Un crack.

~ 13:20 - 14:15 - The three generations of Big Data processing



Ruben Casado, Investigador Senior en Treelogic nos ha dado un foco general sobre "BigData" y sus distintas fases. Nos ha hablado sobre dos focos principales, el procesamiento BATCH y la Computación Híbrida (dejado de lado la parte de NoSQL, perteneciendo más al ámbito MongoDB ...). Ha hablado sobre un popurrí tecnológico que para el que no haya visto estas tecnologías ha sido como en Mátrix cuando le dice Triniti a Tanke: "Tanque, necesito un programa de pilotaje para un helicóptero B-Doscientos" y de repente, ale, a saber pilotar. Bueno en realidad no ha sido para tanto, pero ha explicado un montón de tecnologías. Después ha entrado con la computación híbrida a saco, que consiste en mezclar el procesamiento Batch(que va capturando e indexando toda la información) en una cola, con otra cola de procesamiento Real Time, que captura y procesa toda la información que los procesos Batch no pueden, como Storm, de ahí meterlo todo en una coctelera (con gestión de colas con Kafka) y pasarlo a una BBDD. Tiene sentido en parte, pero utilizar Kafka (estos de Linked In..) es MORTAL, aunque el dice que no ha tenido problemas con Kafka...aún. Unas diapositivas muy chulas y se ha explicado muy bien.

~ 14:15 - 15:00 - Break para comer
No quiero ser repetitivo pero me ha encantado el catering, ha sido excepcional. Hemos comido muy bien, todo estaba delicioso.

~ 15:00 - 15:45 - An efficient data mining solution by integrating Spark and Cassandra



Álvaro Agea y Luca Rosellini, Team Leads y Arquitectos BigData de la plataforma Stratio (en la cual estoy trabajando) han estado hablado sobre Stratio, una solución formada por muchos pequeños productos que basa su poder en el procesamiento de los datos en sistemas basados en memoria. La unión de tecnologías como Lucene con Cassandra (para Stratio Search) multiplican la velocidad de lectura escritura brutalmente en comparación a elastic search u otros motores de búsquedas avanzados. También han mostrado el potencial de Stratio Deep (integración de Cassandra con Spark Deep (una modificación de Spark) en la que Luca nos ha enseñado una demo técnica de cómo se manejan los RDDs (extraidos de Cassandra mediante Pojos Java) en Spark Deep con Scala. Ha sido fabuloso. Mi enhorabuena al equipo.

~ 15:45 - 16:30 - Mesa redonda

Los ponentes han estado hablado de "BigData" con Oscar Méndez, director de Paradigma Tecnológico y máximo responsable al cual agradecer de que BigData Spain sea una realidad. Ha estado bastante bien y Ruben (organizador) ha estado leyendo tweets para que los ponentes resolvieran sus inquietudes de los asistentes. Muy interesante y gratificante.

Y aquí me tuve que ir al Máster de Sistemas de Ingeniería de Información, a la asignatura de Ingeniería de Sistemas para la Decisión, a estudiar Jhon Nash y su teoría de juegos aplicada al mundo informático.

La segunda parte está en proceso :)

Nos vemos!!!

You Might Also Like

0 comentarios

Sé respetuoso/a, en este blog caben todo tipo de opiniones con respeto y serenidad.

statistics :: ヽ(*・ω・)ノ

Contact Form :: (」゜ロ゜)」