Documento de conferencia

Algunos resultados experimentales de la integración de agrupamiento e inducción como método de descubrimiento de conocimiento

| | | |
Resumen

El descubrimiento de conocimiento (KD Knowledge Discovery) consiste en la búsqueda de patrones interesantes y de regularidades importantes en grandes bases de información. Al hablar de descubrimiento de conocimiento basado en sistemas inteligentes nos referimos específicamente a la aplicación de métodos de aprendizaje automático u otros métodos similares, para descubrir y enumerar patrones presentes en dicha información.\nUn procedimiento recurrente a la hora de realizar descubrimiento de conocimiento basado en sistemas inteligentes consiste en tomar el conjunto de datos a estudiar, aplicar un algoritmo de agrupamiento para separarlo en distintos grupos (clases) y sobre cada uno de ellos, intentar generar reglas que caractericen su conformación, utilizando otro algoritmo a tales efectos.\nUna de las opciones para llevar adelante el proceso de agrupamiento está dada por el uso de los mapas auto-organizados, los cuales consisten en un algoritmo de redes neuronales utilizado para una gran variedad de aplicaciones, principalmente para problemas de ingeniería, pero también para análisis de datos.\nEn cuanto a la inducción de reglas, dada la caracterización de las entidades que se utilizan comúnmente en descubrimiento de conocimiento, fuertemente basada en los valores de sus atributos y no en las relaciones establecidas entre estos, se suelen emplear métodos basados en atributos. Uno de los más claros y difundidos son los árboles de decisión o clasificación en los cuales se cuenta con nodos que modelizan cada atributo, ramas que se originan en estos nodos, una por cada valor que el atributo puede tomar, y finalmente las hojas que corresponden a las clases individuales. Recorriendo un árbol desde su nodo padre hasta las distintas hojas, se pueden generar de forma muy simple las reglas a las cuales la clasificación responde. Una de las herramientas aplicadas al mencionado proceso es la familia de algoritmos TDIDT (Top Down Induction Decision Trees). Sin embargo, estos pasos se realizan únicamente bajo la presunción de obtener un resultado representativo del conjunto de datos sobre el que se trabaja.

Palabras clave
Árboles de Decisión
algoritmos TDIDT
Knowledge Discovery
http://creativecommons.org/licenses/by/4.0/

Esta obra se publica con la licencia Creative Commons Attribution 4.0 International (BY 4.0)

item.page.license
Imagen en miniatura