Big Data

Big Data

¿Qué significa Big Data?

Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos.

¿De dónde provienen estos datos?

• Generados por las personas (Emails, mensa jes whatsapp, Facebook, etc.).
• Transacciones de datos (Facturación, transacciones bancarias, etc.).
• Marketing electrónico y web (Datos al navegar en internet).
• Maquina a maquina (Medidores, sensores, etc.).
• Biométrica (Escaners de retina, huellas digitales, etc.).

Transformación de los datos:

Una vez encontradas las fuentes de los datos necesarios, muy posiblemente dispongamos de un sinfín de
tablas de origen sin estar relacionadas. El siguiente objetivo consta en hacer que los datos se recojan en un mismo lugar y darles un formato.
Aquí entran en juego las plataformas extraer, transformar y cargar (ETL). Su propósito es extraer los datos de las diferentes fuentes y sistemas, para después hacer transformaciones (conversiones de datos, limpieza de datos sucios, cambios de formato…) y finalmente cargar los datos en la base de datos o almacén de datos especificada.

Análisis de datos

Teniendo los datos necesarios almacenados según diferentes tecnologías de almacenamiento, nos daremos cuenta que necesitaremos diferentes técnicas de análisis de datos como las siguientes:

Asociación

Permite encontrar relaciones entre diferentes variables.

Minería de datos (data mining):

Tiene como objetivo encontrar comportamientos predictivos. Engloba el conjunto de técnicas que combina métodos estadísticos y de aprendiza je automático con almacenamiento en bases de datos.

Agrupación (clustering):

El análisis de clústeres es un tipo de minería de datos que divide grandes grupos de individuos en grupos más pequeños de los cuales no conocíamos su parecido antes del análisis. El propósito es encontrar similitudes entre estos grupos, y el descubrimiento de nuevos conociendo cuáles son las cualidades que lo definen.

Soluciones

Infraestructura

En ECN podemos ofrecer soluciones que permitan el análisis de datos gracias a nuestras alianzas estratégicas, ofreciendo una solución de grado industrial. Estas soluciones se dimensionan específicamente para los requerimientos de cada proyecto. Nuestros especialistas pueden apoyar en el dimensionamiento del proyecto así como en los temas de licenciamiento e infraestructura necesarios.