Definición de Minería de Datos
Periodista esp. e investigador
Hace tiempo que vengo escuchando la máxima de que los datos son el nuevo petróleo, pero si hemos de juzgar por el nombre de una de las disciplinas que trata su explotación y uso, la llamada minería de datos, yo más bien los tildaría como “el nuevo carbón”, por analogía de sus formas de extracción.
La minería de datos es una disciplina que consiste en la extracción de conclusiones a partir del análisis estadístico automatizado de una gran colección de datos.
Estos datos pueden proceder de muchas fuentes, contar con estructuras diferentes o ni siquiera estar estructurados. Por ello, en la minería de datos toman parte sistemas de inteligencia artificial y de machine learning capaces de adaptarse a los datos no estructurados y pasarlos por filtros que permitan su análisis.
Al final, de lo que se trata es de que las conclusiones sirvan para ayudar a la toma de decisiones sobre un determinado sistema, que puede ser muy variado: desde el tráfico rodado de una ciudad o región, hasta la disposición de efectivos de bomberos y otros servicios públicos para hacer frente a posibles emergencias.
También se trata de sacar a la luz patrones que siguen los datos y que, hasta ahora, estaban ocultos o no los podíamos ver con claridad, enmedio de todo el marasmo, la gran cantidad de datos existentes.
¿Qué separa la minería de datos del big data? Pues que la minería se ocupa solamente del análisis, mientras que el big data es una disciplina que se encarga de la captación y almacenamiento de los datos, así como su administración.
Para poder analizar los datos correctamente, en primer lugar debemos determinar unos objetivos que perseguimos con el análisis, una serie de preguntas a las que debemos hallar respuesta, ya que estas orientarán por donde debemos buscar.
Partiendo de estas preguntas en forma de premisas, elegimos los datos a procesar (puede ser que solamente necesitemos una parte de la base de datos, y no toda).
La fase de procesamiento difiere en cada caso, y en ella se utilizan herramientas de inteligencia artificial y machine learning, de forma que puedan adaptarse dinámicamente a los datos introducidos, modificando su operativa si es necesario.
El producto final de este procesamiento deben ser una serie de conclusiones, pero no confundamos estas con las que deben sacar los responsables del sistema o quienes toman las decisiones finales. Estas conclusiones lo son sobre el volumen de datos analizados.
Si tomamos nuevamente el ejemplo del tráfico rodado en una ciudad, podemos obtener la conclusión de que una calle determinada recibe un flujo excesivo de vehículos, pero el sistema no nos dará recetas mágicas para solucionar dicho exceso.
Aunque el sistema posea dotes de inteligencia artificial que puedan proponer soluciones, siempre será tarea del personal humano el tener la última palabra.
La minería de datos se está aplicando a la práctica en una gran cantidad de disciplinas, entre las cuáles destacan las financieras.
Así, podemos encontrar aplicaciones en apartados como la bolsa (para predecir el comportamiento de valores), aunque también en sectores que no son los propiamente financieros pero tienen una relación estrecha con el sector, como es el caso de los seguros.
El procesamiento del lenguaje natural, las búsquedas online o los coches inteligentes, son otras disciplinas en las que se está aplicando la minería de datos.
Fotos Fotolia: Moartist / Thinglass
Trabajo publicado en: Nov., 2018.
Escriba un comentario
Contribuya con su comentario para sumar valor, corregir o debatir el tema.Privacidad: a) sus datos no se compartirán con nadie; b) su email no será publicado; c) para evitar malos usos, todos los mensajes son moderados.