Big Data: las cualidades del buen ‘malabarista’ de datos

La ciencia de datos ha traído consigo la necesidad de nuevos per les profesionales capaces de dominar la información digital de manera inteligente y creativa.

La ingente cantidad de datos que circulan por el mundo digital están entre el dolor de cabeza de los que lo manejan y el atractivo que implica su potencial. Es por ello, que no dejarás de escuchar y leer sobre “big data” por todas partes.

Para recoger, procesar y tomar las mejores decisiones en base a esa enorme información que genera lo digital, las empresas se están poniendo las pilas y además, la formación en esta materia está en auge, por la gran demanda de profesionales en esta materia.

NATIVIDAD DURO CARRALERO

Directora del curso de Postgrado Big Data y Business Analytics en la UNED

UNED logo 50

Big Data es un conjunto de paradigmas y tecnologías, capaces de transformar los datos recogidos por las empresas en información orientada a la toma de decisiones. Es algo fundamental y presente desde la creación de los primeros sistemas de información. El volumen de datos de las empresas crece exponencialmente, y por ello, es imprescindible manejarlos eficientemente utilizando técnicas específicas que resuelvan nuevas necesidades y problemas relacionados con su estructura, velocidad, volumen, seguridad, privacidad o interoperabilidad. 

Big Data es una tecnología dirigida a organizaciones grandes y pequeñas, de todos los sectores. Su campo de aplicación es inmenso, por lo que un experto en Big Data puede explorar infinidad de ámbitos laborales y contar con una formación inicial muy diversa.

La formación específica en este campo es importante, debiendo incluir técnicas de recolección, almacenamiento y procesamiento de datos, así como soluciones de infraestructuras existentes y técnicas de análisis de datos y aprendizaje automático. Big Data es hoy en día una de las profesiones más prometedoras del siglo XXI, actualmente sin desempleo y con un crecimiento de la demanda enorme.

ALBERT GINÉ

CTO de Esneca Business School

Esneca logo

Debido a la digitalización y las nuevas tecnologías, diariamente circulan millones de datos en los sistemas informáticos de todo el mundo. Para poder abarcar todo ello, surge el Big Data, una disciplina que permite procesar toda esta información que se mueve a gran velocidad y que resulta muy compleja de organizar a través de los métodos tradicionales. 

Hoy en día, el Big Data se ha convertido en una industria que ha generado nuevos puestos de trabajo para los que se requiere una serie de competencias en diversos ámbitos, como el análisis de datos o la programación. Y precisamente, uno de los nuevos perfiles profesionales con mayor demanda es el Científico de Datos o Data Scientist, que se ocupa de traducir grandes volúmenes de datos en información relevante para las empresas. 

Quien quiera capacitarse como Data Scientist debe obtener una formación especializada en matemáticas, estadísticas, lenguajes de programación y sistemas de análisis de datos masivos. También se requieren conocimientos en bases de datos y Business Intelligence.

GERMÁN ESCALANTE

Responsable de Transformación e Innovación Digital en MasterD

La aparición de la transformación digital en nuestras vidas nos ha descubierto la cantidad de datos que cualquier persona es capaz de generar desde cualquier dispositivo inteligente. Hemos asistido al nacimiento del “Big Data”. Un campo que se ha visto impulsado por el gran negocio que las empresas son capaces de originar al respecto. Pero bien, ni todos los datos son susceptibles de aportar valor, ni todas las herramientas que los gestionan son capaces de interpretarlos de manera efectiva.  

Por ello, el científico de datos o experto en Big Data juega un rol protagonista. Desde MDigital incidimos en que es de suma importancia saber qué herramientas y lenguajes de programación debemos aprender para adentrarnos en este mundo con garantía. Desde un perfil matemático o estadístico, ligado a conocimientos técnicos en herramientas informáticas es posible comenzar la andadura en este sector que requiere también dos factores fundamentales: constancia y pasión.  

Para comenzar a formarse como científico de datos, no podemos perder de vista los dos lenguajes más importantes: Python y R.  

JESÚS GÓMEZ ALVADO

Director de Comunicación en MIOTI | Tech & Business School

Un científico de datos es un selector y transformador de materia prima en un producto de valor. Para ello debe poseer una serie de conocimientos teóricos y técnicos de alto nivel, pero también atesorar soft skill, tales comocapacidad analítica, pasión por el detalle y talento para trazar un storytelling entendible.

A partir de ahí el experto en Big Data se crea mediante una base formativa asentada en la estadística y conceptos de programación, y despegará con una formación práctica y de calidad que le prepare para afrontar los retos reales que las compañías necesitan solventar.

JAVIER PÉREZ RODRÍGUEZ

investigador experto en Big Data de la  Universidad Loyola

La transformación que están sufriendo los modelos de negocio hacen que el mercado exija profesionales que cuenten con la capacidad de manejar y analizar grandes cantidades de datos con el fin de mejorar la toma de decisiones en las empresas.

Los distintos perfiles en Big Data útiles dentro de un proyecto de esta índole deben, por tanto, ser capaz de manejar las infraestructuras, tecnologías y servicios indispensables para procesar situaciones con una ingente cantidad de datos.

Para ello, a partir de un background en informática, estadística o matemáticas, que incluyan los conocimientos en tecnologías de gestión de base de datos, programación, sistemas de almacenamiento y procesamiento distribuido, se hace necesaria una especialización en Business Intelligence y/o en Machine Learning.

En la actualidad, los estudios de posgrado en Big Data, que por lo general están impartidos por profesionales con amplia experiencia en el sector, representan la opción más popular para formar nuevos perfiles las competencias demandadas.

DANIEL MATEOS

Senior Data Scientist y co-director del Máster de Data Science en KSchool

Un científico de datos que quiera ser autónomo en el manejo de Big Data tiene que tener al menos una parte de Data Engineer. Es decir: no basta con saber o aprender técnicas estadísticas y de aprendizaje automático; hay que tener un poco de administrador de sistemas. Saber manejarse en Linux, elementos básicos de criptografía y conectar con máquinas remotas es el fundamento tanto de la nube como de los sistemas de Big Data «on premises».

Con esa base, la científica de datos puede enfrentarse a los conocimientos más específicos que debe reunir. La clave es entender cómo la computación distribuida integra el trabajo de múltiples máquinas poco fiables en un todo armonioso que sabe reponerse de fallos puntuales y los compromisos que eso implica, como ilustra por ejemplo el teorema CAP.

El paradigma MapReduce de computación es otro concepto/técnica que ilustra cómo el paso a sistemas distribuidos exige un cambio de marco mental. En KSchool preparamos para esto a nuestros alumnos enseñándoles a manejar tanto Amazon Web Services como Google Cloud Platform para ejecutar tareas de Spark, la herramienta Big Data de referencia.