Big Data: Introducción

BI Geek / Big Data  / Big Data: Introducción
Big Data

Big Data: Introducción

En esta serie se hablará de qué es el Big Data, del porqué los últimos años está en boca de todos y de cómo se podría incluir estas nuevas tecnologías en el ámbito del Business Intelligence.

¿Cuándo empezó todo esto de “el Big Data”?

Se lleva escuchando el termino Big Data relativamente poco tiempo, pero esta problemática y sus conceptos se establecieron hace muchos años.

En tiempos de la antigua Babilonia, allá por el 2.400 AC ya se empezaron a realizar las primeras bibliotecas recopilando ingentes cantidades de información entre solo unos pocos hombres.

Siglos más tarde, César Augusto decidió realizar un censo de todo el mundo habitado el cual se levantó cuando Cirenio fue gobernador de Siria.

Un ejemplo de Big Data moderno se dio en Reino Unido, donde los tickets del metro de Londres era examinados de forma manual para obtener así las rutas más y menos usadas para la construcción de futuras infraestructuras.

Todos estos ejemplos tienen algo en común, comparten la problemática de manejar una gran cantidad de datos y no disponer de técnicas para su manejo de una forma eficiente. Con ello podemos concluir que la problemática de Big Data o de gran cantidad de información no es algo actual y ha existido desde siempre, pero es ahora cuando empezamos a disponer de técnicas que nos permiten sacar provecho de forma eficiente de estos datos.

Ahora bien… ¿Qué es el Big Data?

El Big Data ha sido definido de muchas formas:

  • El Big Data se define como las 3 V’s (volumen, variedad, velocidad), si bien es verdad que en los últimos años han empezado a salir más V’s (value, variety, variability…). Existen muchas discrepancias acerca de cuantas V’s forman parte de la definición de Big Data.
  • El Big Data es información muy grande: El tamaño de la información es un factor muy importante a la hora de utilizar tecnologías de Big Data, pero no algo esencial, puede que manejemos poca información pero esta venga en streaming o dispongamos de poco tiempo para su manejo.
  • El Big Data son datos no estructurados: Aunque es verdad que cuando escuchamos la palabra Big Data no podemos evitar pensar en bases de datos no estructuradas o semi-estructuradas, existen múltiples tipos de bases de datos NoSQL que deben o no tener datos estructurados por lo que esto no es del todo cierto, no todas las bases de datos NoSQL son sin esquema.
  • Big Data es Hadoop: Hadoop solo es una tecnología de las muchas tecnologías existentes en el ámbito del Big Data.

Entonces… ¿Qué es el Big Data?

  • Big Data es un problema de ingeniería del software. Un problema que tiene su origen en diversos factores como la gran cantidad de datos, el manejo de estos datos en pequeñas ventanas temporales, la información no estructurada, la necesidad de escalabilidad al ir aumentando el número de información y un largo etcétera.

Como hemos dicho, a lo largo de la historia hemos tenido grandes problemas de Big Data, siempre han existido ingentes cantidades de información que no hemos podido tratar porque la tecnología del momento no estaba lo suficientemente madura para ello. Pero todo esto ha cambiado y se abre un mundo de posibilidades en el que las empresas pueden explotar todos sus datos.

¿De qué hablaremos?

En esta serie de blogs estará dividida en cuatro grandes bloques:

  • bigeek_post_cloud_servicesCloud computing: En este apartado se hablará de los distintos tipos de cloud y su necesidad como infraestructura principal en Big Data y en particular de Amazon Web Services.
  • Frameworks de software para aplicaciones distribuidas: Desde el nacimiento de Hadoop este tipo de software para la creación de aplicaciones distribuidas son el pilar de las tecnologías Big Data.
  • Bases de datos NoSQL: En este apartado trataremos su necesidad en la sociedad actual, sus ventajas y desventajas y los distintos tipos de bases de datos NoSQL que podemos encontrar.
  • Sistemas de Streaming: Como muchos auguran, el streaming es el futuro en tecnología Big Data. Se hablará del Streaming aplicado a las empresas como puede ser la Televisión Social, la geo-localización en tiempo real, etc.
Share
Consultor Business Intelligence y Big Data.