Big data, los matemáticos, el pasado y la moral

Big data ha irrumpido en las conversaciones sobre tecnología y digitalización en las empresas, en los medios de comunicación generalistas y hasta en los bares, lo que ha abierto el debate sobre cómo será el mercado laboral del futuro. Basta con teclear las palabras “big data” en el buscador de cualquier plataforma de empleo para ver cómo las ofertas de trabajo se multiplican: alrededor de 500 en Infojobs, más de 1.500 en LinkedIn. El mercado laboral pide cada vez más profesionales que sepan tratar la enorme cantidad de información que generamos a cada paso digital que damos. El informe anual de LinkedIn de 2017 sobre los empleos más emergentes señalaba que tres de los puestos con más demanda en Estados Unidos eran posiciones relacionadas con los datos masivos. IBM pronostica que la demanda de este tipo de profesionales crecerá un 28% de aquí a 2020. Y en España, el último estudio sobre las posiciones y competencias más demandadas que elabora la escuela de negocios EAE coloca al experto en big data como el segundo profesional más solicitado y el primero en la lista de los puestos que más cuesta cubrir.

Sin embargo, los expertos coinciden en que el big data necesita todavía aterrizar. Por el momento, los perfiles más demandados son los expertos en tratar el dato y almacenarlo. La analítica se prevé que explotará cuando las pymes y la administración pública, comiencen a gestionar datos.

“No veo burbuja por ninguna parte. Todo es digital, todo son datos”, afirma Teresa Sancho, de la UOC. Álvaro Jaén, profesor en Neoland, añade: “La masa de datos que hay es tan ingente que no hay profesionales suficientes. Aunque como toda novedad, los proyectos de momento son muy esporádicos y en grandes empresas”.

La paradoja es que mientras los expertos afirman que big data no es un sistema maduro, también confirman que es el futuro. Y con estos mimbres se han lanzado a fabricar monumentales cestas para albergar una cantidad de datos inimaginable, sin contar con los cambios que, el “acomodo” que conlleva el uso inicial, provocarán en la solución final.

En la búsqueda de los mejores resultados, las grandes empresas están asaltado las facultades de matemáticas de todas las universidades para fichar pre-profesionales y colocarlos en el presente de una tecnología de futuro. En las últimas oposiciones a profesor de matemáticas han quedado plazas sin cubrir y, según el CSIF, faltan 300 docentes de la materia pese a que está presente como oferta educativa en 34 facultades. Las aulas de los colegios se están quedando sin profesores de matemáticas por el efecto llamada del big data, como también se quedaron sin alumnos, hace algo más de una década, con el efecto llamada de la construcción. Los efectos de estos movimientos masivos ya los conocemos.

En las empresas existe cierta confusión entre big data y data science, como entre otros conceptos tecnológicos que han tomado al asalto nuestras mentes, personales y empresariales. Big data trata el almacenamiento de grandes cantidades de datos (infraestructura, soluciones, estructura), mientras que data science se centra en la analítica de los datos almacenados.

El punto gordiano ya no es el almacenamiento, la fórmula a resolver es la calidad de esos datos y cómo se analizan, sin prejuicios e injusticias. Si los expertos necesitan entender las necesidades de las empresas para detectar qué información es valiosa para ellas (smart data), los directivos y los gestores precisan de igual manera formarse en el campo del big data, smart data y data science para así poder aprovechar su potencial.

El almacenamiento de datos compulsivo está llevando a las empresas a sufrir una de las peores enfermedades, destructiva y ruinosa: síndrome de Diógenes del dato. La consecuencia de esta “infección” es el trash data (almacenamiento de dato basura), almacenar información que solo distorsiona, hace ruido y empobrece la calidad del resultado. El desconocimiento es atrevido y al igual que ocurre con quien publica en YouTube cómo hacer una paella desde Texas o una tortilla de patata desde Australia, no entender qué es big data nos hará parecer tan ridículos con la maraña de ingredientes que hemos añadido a nuestro guiso de datos.

Por ello, el problema a resolver no es matemático, trasciende de la frialdad en la aplicación de algoritmos sobre datos del pasado y proyectarlos hacia el futuro sin moral. En su libro, “Weapons of Math Destruction”, Cathy O’Neil detalla cómo el análisis matemático de datos promueve una mayor discriminación contra los pobres. Tras analizar múltiples sistemas de análisis de datos para ofrecer resultados en diferentes sectores como el judicial, el financiera, el educativo, selección de personal y la seguridad, ha llegado a la conclusión de que se parte de bases de comportamiento del pasado e incluso del entorno de la persona para valorarla. Si vives en un determinado código postal es posible que tu seguro de coche sea más caro, o que el rating financiero que te apliquen sea superior, o que la sentencia en un juicio sea más dura, o que no seas seleccionado para un trabajo. En ninguno de estos casos sabrás el motivo, estás indefenso.

“Los procesos de big data codifican el pasado”, dice Cathy O’Neil. “No inventan el futuro. Para ello es necesaria una imaginación moral, y eso es algo que solo los seres humanos pueden proporcionar”.

Un claro ejemplo es como las aseguradoras de autos analizan a sus asegurados: número de siniestros y rentabilidad. Son dos excelentes parámetros para las empresas, pero muy subjetivos e injustos para los usuarios. Un motorista que sufre un impacto de un vehículo y evita la caída por su pericia, acaba de ahorrar cientos de miles de euros en indemnizaciones por invalidez o muerte. Las aseguradoras no tienen en cuenta las cualidades y habilidades de sus asegurados, no introducen en sus “big data” las causas objetivas del siniestro, velocidad, movimiento de los vehículos, maniobras realizadas pre y post accidente, con el fin de obtener diferentes visiones de qué hubiera ocurrido si el conductor reacciona de una determinada forma y el mayor o menor coste que hubiera generado a la compañía. La misma práctica se puede extender a los seguros de salud, hogar, vida, etc. Se trata de humanizar los datos, no de robotizar a los humanos.

¿Son los matemáticos la única solución en el análisis de datos? Con toda certeza, no. Thick data ofrece un punto de vista más humano y moral en el análisis de datos. Incorpora al equipo de estudio a sociólogos, psicólogos, etnólogos, historiadores y antropólogos que ofrecen su sesgo más racional y basado en comportamientos de largo recorrido, que son lo que nos han hecho como somos.

De nuevo la tecnología nos nubla la capacidad de decisión y nos aboca a un boom de desconocidas consecuencias. Os animo a investigar cómo thick data os puede ayudar a analizar y obtener resultados más objetivos y justos en las decisiones sobre personas.