Javier Murillo

¡Entendamos el análisis de datos!

La sana distancia, el 'home office', las clases escolares virtuales, todo al mismo tiempo junto con las necesidades analíticas y los usos operativos de los datos están proliferando en todo el mundo.

Ahora que termina el octavo mes del año de la pandemia por Covid-19, bien vale la pena reflexionar sobre los retos que tenemos los expertos en análisis de datos para crear los diseños de coordinación y estructuración para ayudar con mayor eficiencia a la humanidad en imprevistos como el de la aparición de un nuevo virus.

Los datos continúan creciendo de manera más diversa y distribuida, al igual que las fuentes de datos y los puntos de consumo de los mismos. La sana distancia, el home office, las clases escolares virtuales, todo al mismo tiempo junto con las necesidades analíticas y los usos operativos de los datos están proliferando en todo el mundo. Las necesidades de las partes interesadas ya no pueden satisfacerse con arquitecturas tradicionales que se basan en la recopilación de datos de forma centralizada y permiten usos predefinidos. Los líderes de datos, análisis y sus equipos, deben ofrecer una infraestructura de gestión de datos moderna que admita flexibilidad, diversidad de necesidades de datos y conectividad. ¿Estamos listos?

Esto, querido lector, requiere una combinación de diferentes enfoques de procesamiento y organización de datos. Sin embargo, algunos equipos y análisis todavía se centran en satisfacer necesidades utilizando un único patrón arquitectónico, ya sea un almacén de datos empresarial tradicional, un lago de datos moderno o un centro de datos.

Existe una gran confusión entre estos conceptos y de alguna forma es comprensible. Muchas organizaciones, privadas y de gobierno usarán estos términos indistintamente o usarán el mismo término para significar cosas diferentes en distintos escenarios. Por ejemplo, mientras que las consultas de los clientes de Gartner Inc. (empresa de investigación de las tecnologías de la información con sede en Stamford, Connecticut, Estados Unido) se refieren a centros de datos, éstas aumentaron en un 20 por ciento entre 2018 y 2019, más de 25 por ciento de estas consultas fueron en realidad sobre conceptos de lago de datos. Esto sugiere que existe confusión o mal uso de la terminología.

También hay una falta de claridad sobre las funciones de los almacenes de datos y los lagos de datos. Se estima que 30 por ciento de los clientes que plantean consultas sobre el lago de datos están considerando un lago de datos como reemplazo de un almacén o no tienen claro la relación entre los lagos y los almacenes de datos.

Estos tres patrones arquitectónicos (almacenes de datos, lagos de datos y centros de datos) son áreas clave de inversión. Sin embargo, es necesaria una mayor claridad y concentración. Los líderes de datos y análisis deben comprender el propósito de estos tres tipos de estructuras y el papel que pueden desempeñar en una infraestructura de gestión de datos moderna para a hacer frente a prácticamente cualquier adversidad, ya sea un proyecto de expansión empresarial o un nuevo virus que ponga en jaque la economía mundial. Quizá, si todo esto lo hubiéramos entendido antes, los efectos de la pandemia por SARS-Cov-2 serían menos devastadores. Quizá sea tiempo de aprender de esta amarga experiencia para dejar el egoísmo de lado y trabajar más coordinadamente para salvar más vidas. Al tiempo.

Fundador y presidente del Consejo de Metrics.

COLUMNAS ANTERIORES

Empoderamiento femenino en la ciencia de datos
La disputa de Musk contra OpenAI

Las expresiones aquí vertidas son responsabilidad de quien firma esta columna de opinión y no necesariamente reflejan la postura editorial de El Financiero.