Qué es la minería de datos o exploración de datos

La minería de datos o exploración de datos (1) es la etapa de análisis de “Descubrimiento de conocimiento en Bases de Datos” (“Knowledge Discovery in Databases” o KDD, (2) un campo de la estadística y las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificialaprendizaje automáticoestadística y sistemas de bases de datos.

El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de (1) la etapa de análisis en bruto, supone aspectos de (2) gestión de datos y de bases de datos, de (3) procesamiento de datos, (4) del modelo y de las consideraciones de inferencia, (5) de métricas de Intereses, (6) de consideraciones de la Teoría de la complejidad computacional,(7) de post-procesamiento de las estructuras descubiertas, (8) de la visualización y de la actualización en línea.

El término es un concepto de moda, y es frecuentemente mal utilizado para referirse a (1) cualquier forma de datos a gran escala o procesamiento de la información (recolección, extracción, almacenamiento, análisis y estadísticas), pero también se ha generalizado a (2) cualquier tipo de sistema de apoyo informático decisión, incluyendo la inteligencia artificial, aprendizaje automático y la inteligencia empresarial.

La tarea real de minería de datos  es el análisis automático o semi-automático de grandes cantidades de datos para extraer patrones interesantes hasta ahora desconocidos, como (1) los grupos de registros de datos (análisis clúster), (2) registros poco usuales (la detección de anomalías) y (3) dependencias (minería por reglas de asociación). Esto generalmente implica (1) el uso de técnicas de bases de datos como los índices espaciales. (2) Estos patrones pueden entonces (a) ser vistos como una especie de resumen de los datos de entrada, y pueden (b) ser utilizados en el análisis adicional o, por ejemplo, (c) en el aprendizaje automático y análisis predictivo. Por ejemplo, el paso de minería de datos podría identificar varios grupos en los datos, que luego pueden ser utilizados para obtener resultados más precisos de predicción por un sistema de soporte de decisiones. Ni la recolección de datos, preparación de datos, ni la interpretación de los resultados y la información son parte de la etapa de minería de datos, pero pertenecen a todo el proceso KDD como pasos adicionales.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s