La calidad de datos es un factor crítico de éxito en los procesos de transformación digital y orientación al cliente que muchas compañías están emprendiendo. Los datos son una ventaja competitiva pues permiten, entre otras cosas, generar inteligencia comercial basada en machine learning para optimizar el cierre de ventas, mejorar los niveles de servicio o gestionar programas de fidelización. En consecuencia, los equipos directivos está dando cada vez más prioridad a proyectos de diagnóstico y mejora de la calidad de datos e incluso planes integrales de gobierno del dato.
Cada empresa determina el esfuerzo a dedicar por tipo de dato, según el interés estratégico y operativo que tiene el dato para su negocio. Mientras que para una compañía la veracidad de los datos de contacto es crítica para garantizar la entrega de pedidos, para otra los datos de perfiles de clientes son fundamentales para las segmentaciones de marketing.
La calidad de datos: Un enfoque ágil y práctico para mejorarla
No todas las empresas tienen el mismo nivel de desarrollo de sus infraestructuras ni el mismo nivel de sofisticación en cuanto a la gestión de datos se refiere. Sin embargo, esto no significa que tengamos que renunciar a trabajar con datos en proyectos concretos para beneficio del cliente y de la compañía.
En estos casos se recomienda seguir un enfoque ágil, trabajando sobre la calidad del conjunto de datos indispensables para un proyecto que tenga un objetivo y un impacto económico específico, como puede ser un modelo de inteligencia artificial para identificar los clientes de alto valor y con probabilidad de fuga o para determinar la siguiente mejor oferta para los clientes. De esta manera ya se identifican los puntos débiles a mejorar en el gobierno de datos en la organización que se pueden ir subsanando.
En la primera etapa de este enfoque se definen el propósito de negocio, el conjunto de datos a utilizar considerando el impacto de negocio, el significado de la calidad de datos para el proyecto y los indicadores o KPIs que permitirán dar seguimiento a la calidad. Los indicadores, en conjunto con los resultados del proyecto facilitan el análisis del ROI de las acciones emprendidas para mejorar la calidad de datos.
Un buen sistema de KPIs asigna un valor a la calidad del dato y lo pondera de acuerdo con el valor de ese dato para el negocio. De esta forma mediante sumatorias se puede llegar a calcular un indicador de calidad de datos general para la empresa que se puede medir, seguir, reportar y, como no, fijar como objetivo para la compañía.
Posteriormente, se realizan iteraciones con otros proyectos de forma que el alcance de la calidad de datos se expanda de forma gradual por toda la organización.
Auditoría de datos
Existen diferentes metodologías y esquemas de referencia para auditar datos. Generalmente se evalúan la validez, la consistencia, la integridad, la unicidad, la oportunidad; y se determina si se dispone de datos completos. Asimismo en una auditoría de calidad, habrá que valorar si los datos son lógicos y si tienen sentido de negocio.
Los errores en los datos pueden ser diversos: por ejemplo una empresa de retail que detecta que el mismo producto ocupa el primer y el cuarto puesto en ventas debido a una inconsistencia en las claves y descripciones de productos; o un banco en el que un gran número de clientes tienen la misma fecha de apertura de su primera cuenta corriente debido a una migración masiva de datos entre sistemas.
Una buena auditoría incluye series temporales y otros análisis estadísticos que, con técnicas sencillas, permiten detectar errores como meses sin datos, duplicidades, outliers, etc. En este análisis se debe considerar también la estacionalidad del negocio.
Una vez realizada la auditoría, se evalúa el esfuerzo que supone limpiar, corregir y usar los datos para el proyecto; pero se deben analizar también las fuentes de error para solucionar los problemas desde su origen.
Origen de problemas de calidad de datos
La principal fuente de errores suele ser la entrada de datos por parte de empleados y clientes. Para prevenir problemas en la captura de información habrá que revisar los formularios de entrada y establecer todas las validaciones automáticas posibles.
Adicionalmente es necesario concienciar y responsabilizar al personal involucrado en la recogida de datos a través de los diferentes canales de contacto con el cliente. Esto se lograr estableciendo un sistema de KPI’s e incentivos para datos relevantes y con mayor impacto de negocio. Por ejemplo dar seguimiento a la actualización de teléfonos y correos electrónicos válidos que deben hacer los ejecutivos de servicio cada vez que atienden a un cliente.
Otras causas relevantes de problemas con la información pueden ser cambios no notificados en los sistemas de información, migraciones o consolidaciones de bases de datos, fuentes de datos externas y errores de interpretación del significado o estructura de las fuentes de información.
Una herramienta de gran ayuda para controlar la calidad de datos es la definición de un sistema de alertas para identificar errores que pueden ser críticos, moderados o leves. Este tipo de alertas previenen la ingesta de datos erróneos en los sistemas de información.
Hacia una cultura de calidad de datos
Un paso significativo para garantizar la calidad de datos es asignar a un responsable de datos para toda la organización. Conocido como Chief Data Officer será el responsable de promover una cultura centrada en datos y de la definición de procedimientos, estándares e indicadores de seguimiento. También se encargará de promover el uso de de datos en diversos proyectos de generación de valor.
En definitiva, una cultura organizacional centrada en el cliente depende de a su vez de una cultura centrada en los datos y la calidad de los mismos. No es necesario comenzar con grandes proyectos para obtener los beneficios de la explotación de datos, pues un enfoque ágil permite generar resultados o quick wins al mismo tiempo que mediante procesos iterativos se expande gradualmente la calidad a todo el conjunto de datos de la organización.
Si te ha gustado este artículo también te puede interesar nuestra guía sobre machine learning: