Redes bayesianas - Algoritmo K2 en WEKA

Rodrigo Pavez M.
Fabián Silva P.

El problema
Iris setosa Iris versicolor Iris virginica

Variables a considerar
• Petalwidth
• Petallength
• Sepalwidth
• Sepallength

Estructura de la Solución
Red Bayesiana.
Usar las variables anteriormente citadas
Estructura de la Red
Distribuciones de probabilidades locales
Búsqueda del “mejor” modelo
Algoritmo K2
Inferencia en la red

El algoritmo K2 (I)
Paso 1: Grafo inicial sin arcos.
Paso 2: Elección de un arco para añadir al grafo.
Paso 2.1: Calcula la probabilidad de la nueva red con
un arco nuevo en cada caso.
Paso 2.2: Escoge el arco que da probabilidad mayor.
Paso 3: Si el arco nuevo aumenta la probabilidad de la
nueva red, se añade y se va al paso 2, en caso contrario
Fin, esa es la red.

El algoritmo K2 (II)
El problema que soluciona K2 es el de encontrar una
red bayesiana (modelo) a partir de una base de datos
D, que contiene un set de variables denominado Z, Bsi y
Bsj que son dos modelos de red bayesiana que
contienen exactamente las mismas variables que están
en Z.

El algoritmo K2 (III)
Al calcular las razones de tales pares de estructuras de redes bayesianas, se
podrá clasificar para un conjunto de estructuras por su probabilidades a
posteriori.
Se induce una fórmula eficaz de calcular P(Bs, D), donde B representa una red
bayesiana arbitraria que contiene solo variables D.
Las variables (Z) de la base de datos (D) son discretas.
Los hechos son independientes, teniendo en cuanta el modelo de red
bayesiana.
No existen caso que tengan variables con valores perdidos.
La función de densidad f(Bp|Bs) es uniforme. Bp es un vector cuyos valores
representan la asignación de probabilidad condicional con la estructura Bs.

Configuración WEKA para la solución
Carga del origen de datos iris.arff

Resumen de datos para análisis manual

Configuración de Parámetros
initAsNaiveBayes: Cuando se establece en true será una red con una flecha
desde el nodo de clasificador a cada nodo. Cuando se establece en falso, la
estructura inicial corresponderá a una red vacía.
markovBlanketClassier: Cuando se establece en true se asegura que todos los
nodos de la red forman parte de la manta de Markov del nodo de clasificador.
maxNrOfParents: Establece el número máximo de padres que un nodo podrá
tener en la red bayesiana. Cuando se establece en 2, será una red de bayes
aumentada a árbol (TAN), y cuando se establece >2, una red de bayes
aumentada de red (BAN).
randomOrder: Cuando se establece en true, el orden de los nodos de la red es
al azar. El valor predeterminado es false y se utiliza el orden que traen los nodos
en el conjunto de datos.
scoreType: El tipo de puntuación determina la medida utilizada para evaluar
la calidad de una estructura de red.

Análisis (I)
Estimador Simple: α=0,5 – N° de padres = 1, Validación Cruzada

Análisis (II)
Estimador Simple: α=0,5 – N° de padres = 1, Validación Cruzada

Análisis (III)
Estimador Simple: α=0,9 – N° de Padres = 2, Validación Cruzada

Conclusiones
Una red bayesiana (RB) permite representar conocimiento,
de forma eficiente.
Una RB permite clasificar en base de a probabilidades de un
evento, las que pueden ser individuales o condicionales.
El algoritmo K2 permite realizar una búsqueda heurística,
para encontrar la red bayesiana con la mayor probabilidad y
así construirla.
El software WEKA (software libre), trae herramientas de
análisis de datos y modelado predictivo, como por ejemplo
las redes bayesianas.

Redes bayesianas - Algoritmo K2 en WEKA

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Destaque

Destaque (20)

Semelhante a Redes bayesianas - Algoritmo K2 en WEKA

Semelhante a Redes bayesianas - Algoritmo K2 en WEKA (20)

Último

Último (20)

Redes bayesianas - Algoritmo K2 en WEKA