El Big Data aparece por la gran cantidad de datos digitalizados que la humanidad genera desde la aparición de internet. Se suele hablar de las tres v del Big Data: velocidad, variedad y volumen. Piense el lector en las llamadas de teléfonos, mensajes de What’sApp, Tweets, páginas web, etc., y verá claramente estas tres v.

Según la consultora Mckinsey, en 2020 se necesitarán, solo en USA, 1,5 millones de analistas de datos. ¿Qué perfil tienen estos analistas y cómo podemos entrenar a tal cantidad de ellos de aquí al 2020?

MBA & Máster en Big Data y Business Intelligence
ISEB - Instituto Superior Europeo de Barcelona
1.650 €
Ver más
Máster en Marketing Analytics
UNIR.
Precio a consultar
Ver más

Concepto 1: Data Scientist

Vivimos el nacimiento de una nueva profesión y por ello existe mucha confusión. El concepto de data science fue acuñado por primera vez en 2001 por William Cleveland de Bel labs. Para hacerlo fácil, un data scientist es una persona con una formación en ingeniería de software y en algoritmos complejos, cuya principal misión es programar dichos algoritmos (software) para hacer análisis de datos. Muchos de los algoritmos que hoy están en uso son fruto de tesis doctorales de estas personas.

Formar a un data scientist bajo esta definición supone unos 10 años de preparación, como mínimo.

Seguirá habiendo data scientist, serán muy buscados y muy bien pagados, pero no en la cantidad que prevé Mckinsey.

Concepto 2: Data Architect

Las empresas tienen bases de datos desde que usan computadoras. Y hay personas en las empresas, dentro del departamento de administración de sistemas que se ocupan de estas bases de datos. Los datos son cada vez más importantes y los gestores de bases de datos también. Esta profesión está viviendo un nuevo auge y va a jugar un papel clave en el futuro.

Un data architect es un perfil complejo, especializado, con formación en computer science y experiencia en administración de sistemas. Tampoco se necesitan 1,5 millones de data architects.

Concepto 3: data manager

Un data manager es una persona que, desde el negocio, realiza procesos de análisis de datos y obtiene conclusiones válidas para mejorar la gestión del negocio.

En un plazo de 5 a 10 años, cualquier ejecutivo de línea en cualquier área, finanzas, HR, logística, marketing, ventas…. deberá tener experiencia en análisis de datos, ya que todas las decisiones empresariales se basarán en este tipo de análisis.

Un data analyst es, en esencia, un data manager junior.

Concepto 4. El proceso de análisis de datos

Si un data manager es una persona que realiza procesos de análisis de datos para el negocio, ¿cómo podemos formalizar este proceso? Estos son los pasos principales:

Paso 0.– Plantear un problema o hipótesis a demostrar. Aunque parezca una obviedad los datos nos van a dar una respuesta a una pregunta que queremos validar. Este primer paso, que nos acerca al puro razonamiento científico, supone el conocimiento de un área de negocio concreta, los problemas que tiene y los datos de que disponemos. Algunas de las preguntas que se puede hacer el gestor son las siguientes:

.- Puedo agrupar a mis clientes por criterios de agrupación más inteligentes que la edad y la zona geográfica.

.- Puedo identificar el perfil de los clientes que van a cometer fraude en el uso de sus tarjetas de crédito.

.- Puedo predecir la probabilidad de contraer una enfermedad en un paciente por comparación de sus variables vitales.

Paso 1.– El preproceso de los datos no es nada más que la depuración de los mismos y hacerlos comprensibles para la herramienta con la vamos a trabajar. Puede ser que la base de datos esté incompleta o tenga casillas vacías y el analista deberá enfocar ese tema con delicadeza. Cómo tratar el problema de los missing values es uno de los primeros puntos que tendrá que decidir en casi el 100% de los casos. ¡La vida real es imperfecta!

Puede que el analista tenga que hacer cambios para que la máquina entienda qué variables hay que tratar como números y qué variables se deben tratar como caracteres. Es decir, los dos tipos de variables más comunes que se encontraran. Finalmente, decidirá si alguno de los datos de los que dispone generan ruido o son innecesarios para el análisis y los eliminará.

Paso 2.Proceso. Ahora los datos están listos para ser procesados y es cuando el analista cogerá su caja de herramientas y empezará a procesarlos. Dentro de su caja, encontraremos varios programas como Excel, R, SAS u otras plataformas donde podrá generar visualizaciones, modelos predictivos mediante distintas clases de algoritmos, series temporales, etc. La curiosidad, el control de la calidad de los datos y el rigor del análisis son las piezas fundamentales para que ese trabajo sea correcto.

Un analista de datos no necesita programar algoritmos, ya existen y hay muchos y muy eficaces. Pero si entiende de algoritmos, sabe cómo funcionan y los utiliza con soltura y solvencia.ubiqum

Paso 3.- Validación. Los primeros resultados no son necesariamente útiles ni definitivos. El proceso es iterativo. La pregunta que se hace el analista es ¿qué grado de fiabilidad tienen estas conclusiones? Si la fiabilidad es baja, por ejemplo, menor del 60%, hay que seguir trabajando con los datos y con los algoritmos hasta alcanzar una fiabilidad suficiente para el caso en cuestión.

Paso 4 .- Conclusiones. Finalmente, el analista se encuentra con respuestas concretas a las preguntas que se ha planteado. Sin embargo, durante los procesos de análisis se suelen abrir tantas o más puertas, con nuevas preguntas, de las que se consiguen cerrar. Esto puede ser, a veces, desmotivador o generar incertidumbre, pero hay que aprender a gestionar los tiempos y a poner objetivos concretos. Una vez el analista ya tiene un paquete de conclusiones, puede trabajar en presentarlas a quien toque en cada caso y luego iterar en el proceso de análisis siguiendo el mismo esquema para entrar en mayor profundidad en los mismos temas o en los nuevos intereses que van surgiendo.

Paso 4.- Dar visibilidad a las conclusiones. El último paso, muchas veces olvidado, es la traducción de estas conclusiones a un lenguaje de gestión, no técnico y que ayude a tomar decisiones en la organización en la que esté trabajando. Para esto, el analista debe tener capacidad de síntesis y de jerarquización de la información extraída, así como conocimiento de negocio y, a poder ser, cierta pericia en el tema tratado. El broche de oro lo pondrá si tiene también habilidades de presentación, oratoria y comunicación.

CÓMO CONVERTISE EN DATA ANALYST

Un data analyst puede proceder de cualquier campo y formación previa. Cualquier persona inteligente y motivada se puede convertir en un junior data analyst en 800 horas (5 meses). La metodología de Ubiqum Code Academy se fundamenta en casos reales, organizados en proyectos, siguiendo el proceso antes descrito. Sin clases teóricas ni asignaturas, los alumnos trabajan igual que lo harán en su futuro puesto de trabajo. Ponen un énfasis especial en el aprendizaje del lenguaje R, que constituye la base para la utilización de algoritmos complejos, sin necesidad de tener que programarlos.

En Ubiqum sí creen que pueden entrenar a 1,5 millones de data analyst en 5 años.

 

 

Fuente: Blog Ubiqum

Máster en Data Management e Innovación Tecnológica
OBS Business School
6.500 €
Ver más
Máster en Big Data & Analytics
EAE - Business School
Precio a consultar
Ver más
, , , , , ,

Dejar un comentario

¿Quieres unirte a la conversación?
Siéntete libre de contribuir!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *