- By incodiad
- In Artículos
Jenny Paola Lis-Gutiérrez[1]
Iniciativa de Investigación en Competencia Digital y Comercio Electrónico
Pontificia Universidad Javeriana
Diciembre 2023
Los datos oscuros, “datos polvorientos” o “dark data” corresponden a datos no estructurados que “las organizaciones recopilan, procesan y almacenan durante las actividades comerciales regulares [durante el proceso de negocio], pero que generalmente no los utilizan para otros fines (por ejemplo, análisis, relaciones comerciales y monetización directa)” (Gartner, 2023). Lo anterior debido a la complejidad y dificultad para analizarlos. De acuerdo con Deloitte (2017), se estimaba que para 2020 entre el 80 y el 90% de los datos almacenados digitalmente eran no estructurados y no utilizados. En caso de que fueran analizados hubieran representado $430 mil millones de dólares adicionales en productividad.
Las razones por las cuales estos datos son descartados, no etiquetados y no utilizados incluyen: (i) falta de tiempo para los análisis, (ii) carencias de recursos humanos o tecnológicos para analizarlos, (iii) situaciones en las cuales socios o subsidiarias los almacenan. En este contexto este texto tiene como pregunta orientadora ¿cuál es la relación entre los dark data y el comercio electrónico?
Tipos de dark data
En el comercio electrónico los dark data son más frecuentes debido a que la información de las compras en línea se almacena más fácilmente en las plataformas. Los datos oscuros pueden corresponder a archivos multimedia, imagen, audio, video, archivos de registro del servidor, texto, bases de datos inactivas, archivos de registro (Márquez Narváez, 2019). Pueden clasificarse de varias maneras como se muestra en la Tabla 1 y 2.
Tabla 1. Tipología de los datos oscuros
Tipo | Descripción |
Datos sin explotar que ya están en su poder | “Grandes colecciones de datos estructurados y no estructurados permanecen inactivos”.
Con respecto a los datos estructurados “se debe a que las conexiones no han sido fáciles de establecer entre conjuntos de datos dispares que pueden tener significado, especialmente información que se encuentra fuera de un sistema, función o unidad de negocios determinado.”
Los datos no estructurados “tradicionales” “se basan en texto y se encuentran dentro de los límites de la organización, pero permanecen en gran parte sin explotar, ya sea porque no viven en una base de datos relacional o porque hasta hace relativamente poco tiempo, las herramientas y técnicas necesarias para aprovecharlas de manera eficiente no existían” |
Datos no estructurados no tradicionales | “No se pueden extraer utilizando técnicas tradicionales de informes y análisis: archivos de audio y video e imágenes fijas” |
Datos en la web profunda | “Las empresas [trabajarán] inteligencia competitiva utilizando una variedad de herramientas de búsqueda emergentes diseñadas para ayudar a los usuarios a buscar investigaciones científicas, datos de activistas o incluso hilos de aficionados. encontrado en la web profunda” |
Fuente: elaboración propia con base en Deloitte (2017).
Tabla 2. Tipología según disponibilidad
Tipo | Descripción |
Datos no recopilados | “Datos que no se están recopilando actualmente” o “datos desconocidos, que la empresa no identificó y por ende, no puede aprovechar” |
Datos recopilados inaccesibles | “Datos que se están recopilando, pero a los que resulta difícil acceder en el momento y lugar correctos”. |
Datos recopilados accesibles, pero desorganizados | “Datos que se están recopilando y están disponibles, pero que aún no se han convertido en productos o no se han aplicado completamente.” |
Datos recopilados accesibles, no utilizados | “Almacenados y categorizados correctamente, pero no se los emplea para generar conocimiento o idear acciones. Puede ser por factores como falta de tiempo, de presupuesto o por desconocimiento de la manera de aprovecharlos”. |
Fuente: elaboración propia con base en Banafa (2015) y Márquez Narváez (2019).
El uso potencial de los datos oscuros
Los datos oscuros pueden incluir información sobre:
- Datos de los usuarios. Su análisis permitiría realizar un mejor perfil del cliente y facilita la segmentación.
- Patrones y comportamientos de compra. Para ayudar a las empresas a mejorar su estrategia de marketing y publicidad, mejorando la segmentación y la personalización. Esto a la par que puede maximizar el retorno de la inversión en publicidad o la creación de nuevos productos. También permite identificar tendencias emergentes y preferencias cambiantes.
- Las interacciones del cliente con un sitio web. Estos datos pueden proporcionar información sobre los productos más populares, micrositios más visitados, y los puntos de dolor del sitio web. Esto facilita obtener información valiosa para mejorar la navegación y el diseño del sitio.
- Comentarios en las redes sociales. Pueden proporcionar información sobre la satisfacción del cliente con el bien o servicio, mejorando la experiencia del usuario.
- Mensajes en correos electrónicos o chatbots, para realizar minería de texto como análisis de sentimientos e identificar las principales temáticas de contacto, relacionamiento con la marca, entre otros.
A partir de lo anterior, la analítica oscura o “Dark analytics” (Deloitte, 2017) ha tomado fuerza para obtener información sobre el negocio, los clientes y las operaciones. Todo ello, mediante el uso de: análisis cognitivo, reconocimiento de patrones, arquitectura de datos distribuidos, aprendizaje automático, uso de herramientas de visualización avanzadas, y procesamiento del lenguaje natural.
Desafíos de los datos oscuros
El análisis de los datos oscuros plantea desafíos técnicos y de privacidad. En primer lugar, las firmas que deseen hacer uso de este tipo de datos requieren de arquitectura especializada, inversión en tecnología y capacidad analítica, incluyendo la contratación de talento humano con habilidades en analítica de datos. A esto se suma contar con medios que permitan seleccionar y estructurar los datos fácilmente.
En segundo lugar, al recopilar y almacenar información personal de los clientes, las empresas deben ser conscientes de la privacidad de los clientes y cumplir con las leyes y regulaciones aplicables. En este contexto, es importante que las empresas adopten medidas de seguridad adecuadas para proteger los datos de los clientes e informen a los usuarios sobre cómo se utilizará su información. Adicionalmente, debe considerarse el costo del almacenamiento y protección de los datos (Benafa, 2015).
En tercer lugar, deben considerarse los siguientes desafíos:
- Se requiere garantizar la precisión, autenticidad, consistencia e integridad de los datos, con el fin de reducir los riesgos derivados de un análisis inadecuado o la mitigación de los riesgos derivados del almacenamiento por parte de terceros.
- Implementar los controles y la gestión del riesgo para reducir los riesgos cibernéticos.
- Error de predicción en los modelos predictivos.
- Incorporación de “datos limpios” que fortalezcan los análisis derivados de los datos oscuros.
En cuanto lugar, las organizaciones interesadas en hacer uso de los datos oscuros, se deben incorporar los siguientes procesos:
- Identificar los datos y validar su precisión, autenticidad, consistencia e integridad.
- Explorar, categorizar y ordenar los datos a partir de si se trata de datos estructurados, semiestructurados o no estructurados.
- Analizar los datos y transformarlos en información
- Tomar las decisiones transformando la información en conocimiento
Como se ha visto a lo largo de este documento el análisis de datos oscuros, extraídos de la vida digital de los clientes tienen ventajas como elaborar estrategias de comercialización, marketing, servicio al cliente y desarrollo de productos, que ofrecen a los usuarios una experiencia de cliente específica e individualizada. Con el fin de extraer el mayor valor de los datos oscuros se requiere una gestión eficiente de su análisis y afrontar los desafíos actuales para su procesamiento y toma de decisiones.
Referencias
Bhatia, S., & Alojail, M. (2022). A Novel Approach for Deciphering Big Data Value Using Dark Data. Intelligent Automation & Soft Computing, 33(2), 1261-1271. https://search.ebscohost.com/login.aspx?direct=true&profile=ehost&scope=site&authtype=crawler&jrnl=10798587&AN=155230810&h=3toLKzxYGuslBa3k%2BotwCxyNmeDXujw3p5V3tMWoA8zI%2BXh3uDixVcOjZxZNox5N5cds59jzm4SH0M6bp1NmhQ%3D%3D&crl=c
Banafa, A. (2015). Entender el Dark Data. BBVA. https://www.bbvaopenmind.com/tecnologia/mundo-digital/entender-el-dark-data/
Deloitte (2017). Dark analytics: Illuminating opportunities hidden within unstructured data
Tech Trends 2017. https://www2.deloitte.com/us/en/insights/focus/tech-trends/2017/dark-data-analyzing-unstructured-data.html https://www2.deloitte.com/content/dam/Deloitte/is/Documents/technology/deloitte-uk-tech-trends-2017-dark-analytics.pdf
Gartner, Inc. (2023). Dark Data. En: Gartner Glossary. https://www.gartner.com/en/information-technology/glossary/dark-data
Leone, M. (2022). The Next Frontier in Analytics: Welcome to the Data Lakehouse. Dell https://www.delltechnologies.com/asset/es-co/products/ready-solutions/briefs-summaries/esg-showcase-dell-lakehouse.pdf
Márquez Narváez, J.J. (2019). ¿ Qué es Dark Data? OpenWebinars https://openwebinars.net/blog/que-es-dark-data/
Radanliev, P., & De Roure, D. (2023). New and emerging forms of data and technologies: Literature and bibliometric review. Multimedia Tools and Applications, 82(2), 2887-2911. https://link.springer.com/article/10.1007/s11042-022-13451-5
Starr, K. D., Petersen, H., & Bauer, M. (2016). Control loop performance monitoring–ABB’s experience over two decades. IFAC-PapersOnLine, 49(7), 526-532. https://folk.ntnu.no/skoge/prost/proceedings/dycops-cab-2016/proceedings/media/papers/0286.pdf
[1] Doctora en Ingeniería – Industria y Organizaciones, Magister en Análisis de Problemas Políticos, Económicos e Internacionales. Magister en «sociétés contemporaines comparées Europe –Amérique latine», spécialité géographie, aménagement et urbanisme, Especialista en Estadística Aplicada, Especialista en Evaluación y Formulación de Proyectos, Economista y psicóloga. Reconocida como investigadora Senior ante Minciencias.