¿Qué es Big Data?

11/09/2020

Si algo podemos asegurar, sin temor a equivocarnos, es que internet es grande, muy grande. Esto se debe a la inmensa cantidad de datos que se transmiten continuamente a velocidades cada vez mayores, y cuando un sistema necesita procesar datos específicos debe hacerlo mediante procedimientos especiales. Seguramente te preguntarás ¿qué es el big data? Es un enorme conjunto de datos que deben analizarse para ser utilizados y aplicados.

Existen tantos datos transitando en internet que si se convirtieran en libros la tierra quedaría cubierta por una capa de miles de kilómetros de espesor. Y no exageramos. Los conjuntos de datos que se considera big data sobrepasan todas las medidas, por lo que un software normal no podría administrarlos de modo que uno o varios usuarios puedan disponer de la información para fines prácticos en un tiempo aceptable y útil.

El big data o macrodatos, como también se denominan, provienen de múltiples fuentes que están en aumento gracias a dispositivos con interconectividad. Las fuentes habituales son los registros web, los emails, mensajes, redes sociales, marketing, seguimiento de enlaces o búsquedas, transacciones virtuales, datos de usuario y de dispositivos inteligentes, en pocas palabras, todo lo relacionado con la red conforma el big data.

La importancia del Big data actualmente

El proceso de big data analytics, es decir, el análisis del conjunto de datos, puede aportar información a una empresa, institución o negocio que le permitirá mejorar el rendimiento de sus operaciones. Esto se lleva a cabo mediante la solución de problemas de toda índole en la administración de una organización y el aprovechamiento de sistemas informáticos para tal efecto con importantes ventajas:

  • Optimización de procedimientos: El análisis de los macrodatos permite optimizar los procesos administrativos existentes mediante la interpretación de información pertinente y detallada.
  • Reducción de costes: El avance en las herramientas de procesamiento aseguran la obtención de resultados de valor en menor tiempo, comparado con técnicas de análisis análogas.
  • Nuevas oportunidades: Una de las ventajas más interesantes de la analítica del big data aplicada en cualquier organización, es la detección de nuevos espacios para el desarrollo profesional o comercial.

Las 7 “V” del Big data

La cantidad de información y de fuentes de donde provienen determina las características del big data, que dan razón de las complicaciones que un negocio o empresa enfrentan al momento de aplicar el big data analysis. Estas características son denominadas como las 7V del big data y son las más aceptadas y difundidas actualmente:

· Volumen

Se refiere a la enorme cantidad de datos que se dominan, como ya habíamos explicado, pero también se refiere a como esta cantidad varía exponencialmente con el desarrollo tecnológico y el incremento de las fuentes de información a corto, mediano y largo plazo, con lo que aumentan los requerimientos de selección o filtrado de los datos según su fin.

· Velocidad

Este es un parámetro decisivo en todo lo referente al internet, por lo tanto es de esperar que sea una característica importante en la administración de macrodatos. El tiempo que toma en ser procesados y analizados por los programas especializados para que el usuario pueda usarlos, determina en gran medida la aplicación de los mismos, ya que el flujo de datos y su variabilidad es constante.

· Variedad

Esta característica hace referencia a las fuentes de producción de datos que van en aumento tanto en variedad, con los nuevos dispositivos inteligentes, como en cantidad, por el incremento en conexiones o puertos de conectividad. Si tomamos en cuenta que los sistemas deben catalogar toda esta información y agruparla, podemos entender como la complejidad del big data se hace cada vez mayor.

·Veracidad

Para aprovechar correctamente toda la información de los conjuntos de macrodatos y obtener resultados coherentes y pertinentes tras su análisis, se deben seleccionar aquellos que sean verídicos. Es decir, solo son útiles los datos provenientes de fuentes fiables y de procesos de registros estandarizados que aportan la información necesaria, en caso contrario los resultados estarían falsificados.

· Valor

El valor se refiere a la calidad de la información con respecto a su implementación y sus consecuencias en cuanto a fines prácticos, en su uso en el mundo real por decirlo de otro modo. Una vez se ha comprobado la veracidad de los datos deben también separarse aquellos que aportan valor para determinado sistema de una empresa o institución, de aquellos que no generarían cambios positivos.

Recientemente, dado que el tema del big data es un estudio continuo, algunos autores están considerando la inclusión de dos características más para un total de 7 V, siendo estas la viabilidad y la visualización. Ambas hacen referencia a pasos previos a la selección del contenido de valor, resaltando la importancia de un análisis detallado del conjunto de datos.

Internet: un universo en expansión

Como hemos podido ver en este post, la cantidad de datos que se mueven dentro de la red sobrepasa los límites de la imaginación, pero dado esta amplitud estos datos se convierten en valioso recursos para obtener información en tiempo real sobre casi cualquier cosa, información que, de otro modo, sería imposible recopilar.