“Dirty data” es el conjunto de datos incorrectos, incompletos, desactualizados o duplicados que se encuentran en las bases de datos de las empresas. El 82 % de la información que poseen las empresas españolas son datos falsos u obsoletos. El dato más falsificado por los usuarios es la edad, seguido de la localización y la dirección de email
Cada vez son más las empresas que se ven desbordadas en la recopilación, el procesamiento y el almacenamiento del volumen de datos relacionados con sus actividades habituales de negocio. A esta realidad se le suma una nueva variable poco explorada y conocida por el tejido empresarial: el dirty data. Según los últimos datos analizados por la deeptech española Hocelot, este fenómeno provoca cada año en España unas pérdidas de 321 millones de euros.
En los últimos años, los “dirty data”, es decir, el conjunto de datos incorrectos, incompletos, desactualizados o duplicados que se encuentran en las bases de datos de las empresas, se han convertido en uno de los principales obstáculos para las compañías. Estos datos pueden ser incorrectos bien porque el usuario se ha equivocado al introducirlos o han quedado obsoletos (por ejemplo, por un cambio de domicilio), o bien porque han sido falsificados de forma intencionada con fines ilegales o delictivos en encuestas, formularios o solicitudes de prueba de un servicio.
Los datos aportados por Hocelot reflejan que, entre 2017 y 2019, el “dirty data” creció un 57 % en las bases de datos de las empresas españolas, y que el dato más falsificado es la edad, seguido por la localización y la dirección de email. En este sentido, los análisis realizados señalan que actualmente el 8 % de los españoles miente o aporta al menos un dato falso cuando se le solicitan datos personales en Internet. Los datos también demuestran que el 61% de los datos erróneos provienen de hombres y el 39% de mujeres.
La importancia del dato actualizado
Contar con un dato fiable y actualizado es vital para las empresas que necesitan analizar el perfil de sus clientes para ofrecerles un producto personalizado (aseguradoras, bancos, compañías telefónicas…). Cuando esos datos son erróneos, es cuando las compañías incurren en pérdidas importantes, ya que se pierde agilidad en los procesos y se toman decisiones de negocio en base a análisis incorrectos.
Para Antonio Camacho, CEO de Hocelot “estamos percibiendo una mayor concienciación entre las empresas para implementar soluciones que les ayuden a identificar qué datos son incorrectos y limpiar y optimizar así sus bases de datos”. Asimismo, “esto también tiene beneficios directos sobre los clientes finales, que ven como los productos que les ofrecen las empresas se ajustan mejor a sus necesidades reales”, añade Camacho.