Los cinco perfiles de ciencia de datos que buscan las empresas
Los profesionales de big data y data science serán los más demandados en España, según un informe.
Reunir, seleccionar, examinar y saber interpretar datos para poder usarlos de forma estratégica serán las habilidades más buscadas por empresas de todo el mundo en los próximos años. Por eso, todas las profesiones relacionadas con el big data (los macrodatos) están siendo tan demandadas que incluso es posible que no haya suficientes profesionales para cubrir esta demanda.
Así lo indicó el estudio Forecast: Enterprise Software Markets, Worldwide, 2014-2021, publicado en 2017 por la consultora Gartner, que ya advirtió que el mercado mundial de macrodatos se había duplicado en cuatro años y que la demanda de servicios se había incrementado de tal forma que ya eran necesarios cinco millones de puestos de trabajo en todo el mundo para satisfacer las necesidades del sector. De hecho, los perfiles profesionales vinculados al big data y la ciencia de datos (data science) serán los más demandados en los próximos años en España, según el informe EPYCE 2018: Posiciones y competencias más demandadas, elaborado por la EAE Business School.
Un informe de Tech Cities Job Watch de Experis de 2018 también advertía que la demanda de habilidades y profesionales de macrodatos había aumentado casi el 80 % en los últimos doce meses.
Los perfiles profesionales más buscados en análisis y ciencia de datos
Según explica Teresa Sancho, directora del grado de Ciencia de Datos Aplicada (Applied Data Science) de la Universitat Oberta de Catalunya (UOC), las pequeñas y medianas empresas requieren profesionales «que puedan recoger los datos de la empresa, almacenarlos, garantizar su seguridad y tratarlos adecuadamente, y que sean capaces de responder a las preguntas que plantea la dirección», señala. «En este caso, se busca una persona versátil que tenga la formación necesaria para abordar todo el ciclo de vida de los datos y que sea capaz de dar respuesta al reto que se plantea. Sin embargo, las grandes compañías buscan especialistas que desarrollen su trabajo en un área específica», apunta.
Aunque en una formación de grado se puede definir un itinerario más orientado a la gestión de proyectos y la toma de decisiones y otro más orientado a la creación de las infraestructuras tecnológicas para desarrollar este tipo de proyectos, es en el máster y las especializaciones de posgrado donde es posible especializarse en estos cinco perfiles:
• El mánager o consultor. Tiene un rol directivo que implica la toma de decisiones. Plantea el proyecto y organiza los equipos definiendo objetivos y fases, además de presentar los resultados. Idealmente cuenta con un equipo de profesionales a los que coordina. «Se encarga del buen funcionamiento del proyecto, actuando de intermediario entre el equipo de analistas, científicos y arquitectos de datos y el cliente. Debe comprender el problema que es necesario resolver y las preguntas que hay que responder. También conoce la tecnología, aunque no se encarga de su desarrollo», explica Jordi Casas, director del máster universitario de Ciencia de Datos (Data Science) de la UOC.
• El analista de datos (data analyst). Es el profesional que procesa los datos con los que ya cuenta la empresa. Su labor es experimentar y visualizar lo que aportan esos datos. Usa algoritmos existentes para analizar los datos, generalmente en soluciones empaquetadas, es decir, productos integrados que realizan los procesos de análisis de principio a fin. «Entre sus tareas habituales está la explotación de las bases de datos para obtener informes y cuadros de mando sobre, por ejemplo, cómo evolucionan las ventas de ciertos productos o en determinadas zonas geográficas», apunta Casas.
• El científico de datos (data scientist). Se encuentra en un nivel superior al analista de datos, por lo que es capaz de hacer aportaciones en los algoritmos para proporcionar soluciones particulares a un problema específico. Si los algoritmos que existen no sirven para contestar la pregunta de forma adecuada, puede plantear modificaciones en estos o diseñar nuevos algoritmos, proporcionando valor añadido. Según explica Casas, entre sus tareas habituales está la creación de modelos de aprendizaje automático para, por ejemplo, predecir el consumo de un determinado producto o el comportamiento de un nuevo cliente. Para obtener unos resultados óptimos es necesario que conozca en profundidad las diferentes técnicas existentes, sus características y los parámetros asociados a ellas. No suele trabajar con «cajas negras», es decir, con una herramienta de la que desconocen exactamente el funcionamiento, pero a la que se le puede proporcionar unos datos de entrada para obtener unos resultados de salida, como por ejemplo haría un analista de datos trabajando con herramientas empaquetadas. En cambio, el científico de datos desarrolla sus propios modelos en lenguajes de programación, como serían Python o R.
• El arquitecto o ingeniero de datos (data architect o data engineer). Su labor es encargarse de las plataformas de datos. Se ocupa del sitio donde están los datos, lo que significa que se encarga de la plataforma y el hardware, además de la seguridad del sistema. Tiene el conocimiento necesario para manejar la infraestructura y la arquitectura que soporta los ceros y los unos. Si aumenta el volumen de datos porque hay nuevas fuentes o más clientes o porque se incrementa el número de variables que es necesario analizar, debe redimensionar el hardware para poder hacer frente al nuevo escenario.
• El arquitecto o ingeniero de macrodatos (big data architect o big data engineer). La diferencia con el anterior es que los sistemas con los que trabaja se caracterizan por manejar un volumen de datos mucho mayor, puesto que está especializado en grandes volúmenes de datos. Cuenta con la formación necesaria para trabajar con nuevas herramientas que permiten manejar volúmenes muy altos de datos.
De acuerdo con los dos itinerarios apuntados anteriormente, estos cinco perfiles específicos podrían agruparse en dos: el explorador de ciencia datos (data science explorer), cuya labor es identificar los problemas de datos y crear soluciones, además de proporcionar los indicadores para tomar decisiones, un perfil en el que entrarían el mánager o consultor y los ingenieros de datos; y el constructor de ciencia de datos (data science builder), cuya función es implantar la solución del problema y poner en marcha el sistema teniendo en cuenta los problemas de escalabilidad, lo que se correspondería con el analista y el científico de datos, dos de las profesiones a las que se augura un mayor futuro en el mercado de trabajo durante los próximos años.