BigData & Hadoop (IV) - HBase
septiembre 17, 2013
y hoy:
![]() |
Tipografía muy chunga. |
Este post pertenece a la serie de BigData & Hadoop. A continuación tenéis el esquema que iré siguiendo de publicación de los Post:
Hoy vamos a ver un componente Apache bastante interesante. Con este, podremos mantener distribuido un dataset en tablas columnares a través de múltiples Regiones(veremos que es) y múltiples Nodos de Hadoop.
¿Qué es HBase?
Cuando queremos almacenar cantidades ingentes de datos (Cientos de millones de tuplas), podemos optar por utilizar sistemas de bases de datos antiguos y esperar días u horas para obtener información de nuestros datos (si es que eso es posible) o por otra parte podemos optar por utilizar BigData y sus herramientas.
HBase nos permitirá manejar todos esos datos y tenerlos distribuidos a través de lo que denominan Regiones. Una región no es más que una partición tipo Nodo de Hadoop que se guarda en un servidor. La región aleatoria en la que se guardan los datos de una tabla se decide por nosotros, dándole un tamaño fijo a partir del cual la tabla debe distribuirse a través de las regiones.
HBase a su vez estará montando sobre HDFS de Hadoop, y podremos cargar programas en Java para realizar MapReduces personalizados.
El principal problema que tiene HBase es que no tiene un lenguaje de consulta intuitivo. Utiliza un lenguaje pseudo-javascript para crear tablas y realizar consultas.
Tiene muchas más peculiaridades, pero es redundar en lo redundado. Os dejo documentación sobre HBase en la que podemos encontrar instalación y configuración del mismo (ya sea standalone o distribuido).
Links
· Up&Running de libro: http://hbase.apache.org/book/quickstart.html
· Libro muy recomendado, donde encontraremos instalación, configuración y Tunning (esto es muy importante y viene bastante info): http://www.amazon.com/HBase-Administration-Cookbook-Yifeng-Jiang/dp/1849517142
No necesitaréis mucho más para trastear con esta tecnología.
Nos vemos en la siguiente :)
0 comentarios
Sé respetuoso/a, en este blog caben todo tipo de opiniones con respeto y serenidad.