La ingente cantidad de datos que generamos las personas como usuarios de Internet y otros dispositivos se acaban almacenando, ya que no son comportamientos ni datos susceptibles de perderse. El Big Data o Datos Masivos revelan comportamientos digitales, gustos, productos que se buscan, comentarios en redes sociales… y esto es algo muy jugoso para las empresas para conocer bien a sus usuarios y saber de sus comportamientos. Hoy vamos a conocer un poco mejor qué es el Big Data y por qué es algo sumamente interesante para las empresas.

En los últimos años el Big Data es un concepto que seguramente habrás escuchado y quizá aún no sepas a qué hace referencia. El Big Data es un concepto al alza y quizá podríamos decir que hasta de moda en el sector de la informática. ¿Pero sabemos realmente a qué hace referencia? El Big Data engloba la gestión y análisis de cantidades de enormes volúmenes de datos que no pueden tratarse de forma convencional, puesto que superan el límite y capacidad de cualquier herramienta de software empleada para la captura, gestión y procesamiento de datos.
El concepto del Big Data engloba infraestructuras, tecnologías y servicios creados para dar solución al procesamiento de estos enormes conjuntos de datos estructurados, no estructurados o semi-estructurados (mensajes en redes sociales, señales de móvil, archivos de audio, sensores, imágenes digitales, datos de formularios, emails, datos de encuestas, logins, etc.) que pueden provenir de sensores, micrófonos, cámaras, escáneres médicos, imágenes…
El objetivo del Big Data, al igual que los sistemas analíticos convencionales, es convertir cada dato en información que facilite la toma de decisiones, incluso en tiempo real. Sin embargo, más que una cuestión de tamaño, es una oportunidad de negocio. Las empresas ya están utilizando Big Data para entender el perfil, las necesidades y el sentir de sus clientes respecto a los productos o servicios del mercado. Esto adquiere especial relevancia, ya que permite adecuar la forma en la que interactúa la empresa con sus clientes y en cómo les prestan su servicio.
La tendencia actual del Big Data de manipular enormes cantidades de datos se debe a la necesidad, en muchos casos, de incluir esta información para la creación de informes estadísticos y modelos predictivos utilizados en diversas materias, como análisis de negocio, publicitarios, datos de enfermedades infecciosas, espionaje y seguimiento a la población o la lucha contra el crimen organizado.
Pero ¿de dónde provienen todos estos datos? De nosotros, a cada segundo… Un iPhone hoy en día tiene más capacidad de cómputo que la NASA cuando el hombre llegó a la luna, por lo que la cantidad de datos generados por persona y en unidad de tiempo es muy grande. Catalogamos la procedencia de los datos según las siguientes categorías:
• Generados por personas: el envío de emails, de mensajes de WhatsApp, de estados de Facebook, de tuits en Twitter, de respuestas de cualquier encuesta… se crean datos y metadatos susceptibles de ser analizados.
• Transacciones de datos: facturaciones, llamadas o transacciones bancarias o por Internet generan información que tratada pueden ser datos relevantes.
• E-marketing y web: Internet 2.0 hace que generemos inmensas cantidades de dato, que van desde por qué sitios pasamos el ratón a cuánto pasamos en una página o a qué hora la visitamos. Actualmente existen muchas herramientas de rastreo digital con fines de marketing y de análisis de negocio.
• Machine to Machine (M2M): tecnologías que comparten datos con dispositivos: GPS, medidores, sensores de temperatura, de luz, de altura, de presión, de sonido… que transforman las magnitudes físicas o químicas y las convierten en datos.
• Biométrica: el propósito de estos datos es proporcionar mecanismos de seguridad y suelen estar custodiadas por los ministerios de defensa y departamentos de inteligencia. Un ejemplo de aplicación es el cruce de ADN entre una muestra de un crimen y una muestra en nuestra base de datos.
Para tratar los datos del Big Data existen multitud de herramientas: Hadoop, NoSQL, Cassandra, Business Intelligence, Machine Learning, Map Reduce, etc. Tras esto, encontramos sistemas de almacenamiento de datos Big Data como el NoSQL y diferentes técnicas de análisis y visualización de datos que se pueden emplear con aplicación en multitud de campos de ámbito empresarial, deportivo o de investigación. El Big Data está ahí y lo construimos constantemente, dando pistas de cómo somos, qué nos gusta y cómo nos comportamos.
Fuente: Wikipedia, eleconomista.es