Para medir la eficiencia de los datos empleados en plataformas modernas, a falta de indicadores claros de rendimiento, las empresas suelen basarse en estimaciones aproximadas o en expectativas que no siempre se cumplen. Ante esto, la compañía Denodo propone un marco de medición basado en cuatro indicadores clave, que permiten valorar si una arquitectura de datos contribuye a generar ingresos o si genera costes sin que sea evidente.
El primero de los indicadores propuestas por la compañía para valorar la eficiencia de una arquitectura de datos es el tiempo hasta obtener información útil (time to insight), que mide cuánto tiempo pasa desde que se generan la información en bruto hasta que se convierten en información útil para las operaciones diarias, los análisis estratégicos o las aplicaciones de IA.
Cuando ese proceso se alarga, suele indicar que los datos están almacenados en silos, o que la arquitectura está fragmentada. En estos casos es necesario replicar información a gran escala, intervenir de forma manual en los procesos o añadir capas de integración completas. Las consecuencias llevan a que cuando los datos tardan en llegar, las decisiones se retrasan y las empresas pierden competitividad.
Para medir el proceso es recomendable calcular cuánto tarde en estar disponible la información útil para el usuario final desde que se pide. Este tiempo de entrega puede analizarse en paneles de control, modelos analítivos y aplicaciones de IA. Esto permite detectar mejorar en procesos y comparar resultados con otras herramientas, o durante las pruebas de plataformas nuevas.
El segundo indicador es la productividad en ingeniería de datos. Este KPI se centra en la productividad de los equipos de ingeniería, uno de los aspectos que más pesan en el coste total de las plataformas de datos. Cuando es habitual intervenir de forma manual en los procesos, o reajustarlos, suele deberse a estructuras de información fragmentadas, pipelines duplicados o una baja reutilización de los productos de datos existentes.
Esta fragmentación no gestionada tiene también consecuencias negativas en aspectos fundamentales, como el control de accesos y la privacidad de la información, que es obligatorio tener en cuenta para poder poner en producción los productos de datos que estén en desarrollo. Este indicador puede medirse a partir de las horas de ingeniería necesarias para integrar fuentes nuevas, o desarrollar nuevos productos de datos. También conviene analizar la relación entre el trabajo de mantenimiento y el trabajo de desarrollo que aporta valor.
El tercer KPI es la rentabilidad de la infraestructura, y analiza el retorno real de la dedicada a los datos. Su replicación ineficiente, las pérdidas de eficiencia que consumen tiempo, los recursos de computación sobredimensionados o los ecosistemas de herramientas redundantes, pueden generar gastos innecesarios.
Para medirlo, es recomendable analizar y calcular el coste total de propiedad, incluyendo todos los costes relevantes. Como la capacidad de computación, almacenamiento, integraciones, gestión de herramientas y otros factores asociados. Evaluar métricas como el coste por consulta, caso de uso o usuario activo permite conseguir una visión más clara de la eficiencia y la escalabilidad.
En cuanto al último indicados, la agilidad y capacidad de adaptación, mide la capacidad de una empresa para adaptarse con rapidez a nuevos requisitos de negocio, cambios del mercado o exigencias regulatorias. En el entorno digital, esta capacidad depende sobre todo de la agilidad de las infraestructuras, e implica la posibilidad de reutilizar productos en distintos análisis, aplicaciones de IA o iniciativas de negocio.
Cuando los tiempos de despliegue de nuevos proyectos son demasiado largos, suele ser una señal de estructuras rígidas. Un aspecto importante para poder reutilizar de forma eficiente productos de datos es que, tanto los metadatos empleados como materia prima, como los propios productos, constituyan una capa semántica que puedan comprender los distintos roles que intervienen en el ciclo de vida del producto de datos. Entre ellos, sus consumidores.
Para medir este indicador se puede valorar el tiempo que tarda una empresa en poner en marcha nuevos proyectos basados en información útil. Desde la fase de concepto hasta su entrada en producción. También se puede analizar cuántos casos de uso reutilizan productos de datos compartidos, y requieren desarrollos independientes.
Bernardo Godar, Director general para Iberia & Latam de Denodo, señala que «medir todos estos indicadores clave es fundamental, pero el verdadero valor aparece cuando las organizaciones pueden optimizarlos. En muchos casos, el problema no es la falta de datos, sino la complejidad de las arquitecturas que dificultan acceder a ellos con agilidad. Para ello, la gestión lógica de datos adquiere un papel importante al introducir una capa semántica virtual entre las fuentes de datos y quienes los utilizan, lo que permite acceder a la información sin depender directamente de dónde se almacenan los datos».