Cloud computing, el mejor camino para acceder al big data

Julián García Barbosa    10 junio, 2013

Estamos, sin lugar a dudas, ante dos de los fenómenos más revolucionarios en la industria de las Tecnologías de la Información y las Comunicaciones (TIC) de los últimos años. Pero además de ser términos de moda, ¿qué tienen en común big data y cloud computing?

Tal y como comentaba en mi anterior postBig data: el gran trampolín hacia la innovación”, antes de que las compañías y Administraciones Públicas puedan empezar a disfrutar de los múltiples beneficios de big data es preciso que dispongan de las infraestructuras tecnológicas adecuadas.

Los sistemas de data warehouse tradicionales no están preparados para gestionar grandes volúmenes de datos, tan variados (redes sociales, weblogs, vídeos, correos electrónicos… ) que llegan a una gran velocidad y que necesitamos analizar en tiempo real.

Big data ha llegado precisamente para cubrir el hueco que dejan las herramientas analíticas convencionales y permite cantidad de nuevas oportunidades.

Hoy en día es imposible hablar de big data sin mencionar Hadoop, plataforma de software libre y columna vertebral de la mayor parte de los proyectos de big data, que permite el procesamiento en paralelo de grandes cantidades de datos (estructurados y desestructurados) a través de clusters de servidores. Hadoop, además, ofrece la posibilidad de crecer de manera escalable y llegar a trabajar con miles de nodos y un volúmen de datos del orden de petabytes.

A continuación describiré una serie de requerimientos recomendables en cualquier proyecto de big data:

  • Capacidad de almacenamiento y procesamiento. Big data necesita una gran cantidad de almacenamiento y capacidad de computación (CPU). Hadoop funciona en modo “divide y vencerás”, separando los datos capturados en pequeños bloques y  distribuyéndolos entre muchísimos servidores, lo que  permite el procesamiento de grandes volúmenes de datos con un rendimiento inigualable y mínimas latencias, con la posibilidad de análisis en tiempo real.
  • Escalabilidad.  Un proyecto de big data se caracteriza por tener una serie de picos de demanda con grandes necesidades en cuanto a almacenamiento y procesamiento de datos, seguidos de periodos de poca actividad en los servidores. Sería deseable, por tanto, poder incrementar o disminuir la infraestructura tecnológica según las necesidades de cada momento.
  • Control de los costes y pago por uso. Abordar cualquier proyecto de este tipo mediante la adquisición de un modelo en propiedad de toda la infraestructura necesaria implica una gran inversión inicial, lo que provocaría que muchas compañías desistieran de dar el salto al mundo big data.

La opción más idónea es que las organizaciones puedan acceder a un modelo en el cual las inversiones iniciales necesarias (CAPEX) para la compra de servidores, cabinas de discos, licencias de software, etc. se conviertan en gastos operacionales mensuales (OPEX), y puedan disponer en cada momento de la última tecnología sin riesgos de obsolescencia y en modo pago por uso.

¿Os suenan todos estos requerimientos? Efectivamente, se trata de algunas de las ventajas más interesantes que ofrecen los servicios de computación en la nube o cloud computing.

Por todo ello, cloud es, bajo mi punto de vista, el camino mas rápido, cómodo, económico y seguro para acceder al fascinante mundo de big data.

Pero en relación a la nube “no es oro todo lo que reluce” y, en un próximo post, comentaré cuáles son los riesgos y amenazas respecto a seguridad de la información, protección de datos o cumplimiento de normativas,  que será imprescindible tener en cuenta para elegir al  proveedor de servicios cloud adecuado.

El próximo 12 de junio precisamente comienza el BDigital Global Congress 2013 en Barcelona, que este año se centrará en los retos de big data y donde Lorena de la Flor, colaboradora de este blog, expondrá cuáles son las necesidades de infraestructuras en este tipo de proyectos, y cómo se pueden resolver a través de servidores virtuales de alto rendimiento en la nube.

Puedes seguir el evento a través de la cuenta Twitter @bdigital y el hashtag #2013BDGC.

Imagen: Bernat Casero

Comentarios

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *