Un océano de datos en la era de la Inteligencia Artificial

Ismael Rihawi    10 febrero, 2021

En esta serie de dos artículos aspiramos dar respuesta a las incógnitas que rodean siempre al universo de los datos, en aras de corresponder con la célebre cita de ‘Los datos son la nueva ciencia. El Big Data son las respuestas‘ (Pat Gelsinger, exCEO de VMware/CEO de Intel, 2015).

Están por todas partes. Representan en la actualidad el eje central de cualquier conversación distendida de ámbito laboral y/o formativo; ya sea en reuniones de trabajo, cursos de especialización, workshops, conferencias o publicaciones divulgativas. Constituyen el principal estímulo de las soluciones digitales aupadas bajo la proclama de posibilitar la toma de decisiones Data-Driven. En el ejercicio de transformar digitalmente a las empresas y capacitar a los profesionales del futuro, los datos hacen viable el portfolio de propuestas de productos en multitud de sectores, propiciando lo intangible hasta el momento en conjunción con las nuevas vanguardias tecnológicas.

Siendo por tanto el motor que impulsa el conocimiento y su aplicabilidad en el contexto empresarial, es conveniente hacer frente a una serie de cuestiones clave que garanticen un correcto tratamiento y explotación: ¿Qué propició su diversidad? ¿Qué métodos de clasificación existen? ¿Cuál es el tratamiento que requieren según naturaleza de composición y uso? ¿Qué sistema de almacenamiento se recomienda para cada supuesto?

Principios que acreditan su relevancia

Figura 1: Clases de tipos de datos genéricos primitivos y compuestos
Figura 1: Clases de tipos de datos genéricos primitivos y compuestos

Los datos simbolizan la unidad mínima de información acerca de un hecho o elemento concreto, susceptible éste de la interpretabilidad humana y computacional como vía de adquisición cognitiva. Generados habitualmente por un agente externo a la infraestructura tecnológica, es a este componente al que se le atribuye la responsabilidad de aprovisionamiento, procesado y gestión de la información resultante para su consumo por parte de un usuario final. La deducción de su significado se establece en base a unos criterios de tipado que, elementales y de referencia, describen la representación, estructura, operaciones y rango de valores esperados en esa labor de conversión digital.

La agrupación de datos en torno a conjuntos organizados de manera sistemática para su clasificación y consulta recibe el nombre de bases de datos. Aún con un propósito original en su ideación, pueden adquirir nuevos enfoques de dimensionamiento y finalidad, confiriéndoles el estatus de principal vía de aprovisionamiento de las soluciones de Big Data e Inteligencia Artificial. ¿Qué otros tipos de fuentes de datos suelen considerarse significativas para alimentar nuestras aspiraciones de analítica avanzada?

Usuarios y sensores aupando la heterogeneidad de los datos

Figura 2: Ecosistema digital conformado por usuarios, servicios y cosas inteligentes generando valor en forma de datos
Figura 2: Ecosistema digital conformado por usuarios, servicios y cosas inteligentes generando valor en forma de datos

La tendencia emergente de nuevas plataformas proveedoras de información con fisionomía de red social, servicios Cloud y aplicaciones Mobile experimentada durante la segunda ola marcó un precedente en el volumen de generación de datos y tipología de los mismos. Un “muchos y muy variados” que ha visto acrecentar su cuenta en esta última etapa de irrupción del Internet de las Cosas, donde el incremento exponencial de dispositivos inteligentes interconectados proporcionan con autonomía datos relevantes del entorno operativo y quiénes conviven en él.

Dicho crecimiento propicia una mejora sustancial en el grado de personalización y refinamiento de las conclusiones analíticas que puedan extraerse, al disponer de un mayor contexto del ámbito y entidades implicadas en todo reto de negocio que se plantee.

Es por ello que, a las ya citadas bases de datos como enclave de información en el origen, debemos de contemplar adicionalmente los siguientes puntos de partida tradicionales y de nueva índole:

  • Empresas proveedoras de información y/o servicios que exponen a través de una interfaz de programación de aplicaciones (API) información relativa a sus operaciones en tiempo real.
  • Los sistemas de gestión empresarial (ERP), fuente de datos de excelente riqueza para evaluar puntos de riesgo y mejora en el ámbito de la operativa de una organización.
  • Los sistemas de gestión de las relaciones con los clientes (CRM), punto de unión del dossier de productos de las empresas y el grado de satisfacción de los actores que constituyen la principal fuente de ingresos.
  • Los sistemas de gestión de contenido (CMS), capturando toda interacción de los usuarios que operan por la plataforma, reconociendo nuevas oportunidades de negocios, posibles tipos de clientes potenciales, etc. 
  • Las redes sociales, que permiten medir las tendencias de fidelización de productos y servicios, definiendo perfiles de consumo, grupos de audiencia y diseño de productos específicos para estos. Aparte, resultan ser una fuente inagotable de datos que proveen información crucial sobre el mercado en el que se posicionan los negocios por sectores, con un desglose pormenorizado de competidores y vías de proyección.
  • Millones de datos recopilados de elementos de sensorización existentes en flotas de dispositivos de Internet of Things, que requieren de una infraestructura unificada de análisis integral para automatizar la toma de decisiones y actuación de considerarse necesario.

La elección e integración de una o varias de estas fuentes de datos citadas se verá condicionada al correcto permiso de acceso a los datos de precisarse acuerdos de alianzas (partnerships), una óptima estrategia global de captura programática de la información, así como un debido tratamiento de los datos de carácter sensible en base al Reglamento General de Protección de Datos (RGPD).

En el próximo artículo profundizaremos en las distintas clasificaciones de bases de datos existentes, describiendo ventajas e inconvenientes identificadas, citando las distribuciones más populares hasta la fecha, y estableciendo pautas según casuística a la hora de decantarnos por una tipología respecto a otra. Stay “Data” tuned!

Para mantenerte al día con LUCA, visita nuestra página web,  suscríbete a LUCA Data Speaks o síguenos en TwitterLinkedIn YouTube.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *