"Knoten der selben Äquivalenzklasse haben Knoten der gleichen Äquivalenzklassen in ihrer jeweiligen Menge von Nachbarn." Mit dieser Definition (Prosaversion) lassen sich Netzwerke aller Art auf wiederkehrende Strukturen untersuchen.
Reguläre Äquivalenz - IP-Formulierung von Blockmodellen
1. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Reguläre Äquivalenz
IP-Formulierung von Blockmodellen
Jens Fielenbach
Arbeitsgruppe ComOpt
von Prof. Dr. Gerhard Reinelt
Fakultät für Mathematik und Informatik
Universität Heidelberg
Seminar Analyse von Netzwerken im SS 2011
2. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Gliederung
1 Ausgangspunkt / Motivation
Wiederholung der Definitionen
Exaktes Auffinden der maximalen regulären Äquivalenz
Was will man mehr?
2 Blockmodellierung
Blockmodellierung als Optimierungsproblem
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
IP-Formulierung
3. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Wiederholung der Definitionen
Reguläre Äquivalenz
Definition (Reguläre Äquivalenz)
Eine Äquivalenzrelation der Knotenmenge eines Graphen
G = (V , E) heißt regulär, wenn für jedes Knotenpaar (u, v ) mit
u ≡ w stets folgende Implikationen gelten:
i (uv ∈ E) =⇒ (∃z ≡ v : wz ∈ E)
ii (vu ∈ E) =⇒ (∃z ≡ v : zw ∈ E)
Merksatz in Prosa
Knoten der selben Äquivalenzklasse haben Knoten der
gleichen Äquivalenzklassen in ihrer jeweiligen Menge von
Nachbarn.
4. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Ein kleines Beispiel zum Warmwerden. . .
1 2
4 3
Abbildung: Finden Sie ein oder mehrere reguläre Äquivalenzen!
5. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eine Lösung
1 2
4 3
6. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eine Lösung Alle regulären Äquivalenzen
1234
1 2
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
4 3
1/2/3/4
7. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
8. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
9. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
10. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
11. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
12. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
13. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
14. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
15. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
16. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eigenschaften
Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
d.h. der maximalen regulären Partion P ≤ der Startpartition.
Laufzeit O(n3 )
maximal n Iterationen, da Anzahl der Äquivalenzklassen
streng monoton steigend – bis auf den letzten Schritt.
Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
2
Prädestiniert für Umgang mit Multiplen Relationen
über stets separate Bestimmung der Nachbarschaftsmengen
Implementierung
nicht mehr als 300-400 Zeilen Quellcode in C++
17. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eigenschaften
Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
d.h. der maximalen regulären Partion P ≤ der Startpartition.
Laufzeit O(n3 )
maximal n Iterationen, da Anzahl der Äquivalenzklassen
streng monoton steigend – bis auf den letzten Schritt.
Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
2
Prädestiniert für Umgang mit Multiplen Relationen
über stets separate Bestimmung der Nachbarschaftsmengen
Implementierung
nicht mehr als 300-400 Zeilen Quellcode in C++
18. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eigenschaften
Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
d.h. der maximalen regulären Partion P ≤ der Startpartition.
Laufzeit O(n3 )
maximal n Iterationen, da Anzahl der Äquivalenzklassen
streng monoton steigend – bis auf den letzten Schritt.
Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
2
Prädestiniert für Umgang mit Multiplen Relationen
über stets separate Bestimmung der Nachbarschaftsmengen
Implementierung
nicht mehr als 300-400 Zeilen Quellcode in C++
19. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eigenschaften
Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
d.h. der maximalen regulären Partion P ≤ der Startpartition.
Laufzeit O(n3 )
maximal n Iterationen, da Anzahl der Äquivalenzklassen
streng monoton steigend – bis auf den letzten Schritt.
Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
2
Prädestiniert für Umgang mit Multiplen Relationen
über stets separate Bestimmung der Nachbarschaftsmengen
Implementierung
nicht mehr als 300-400 Zeilen Quellcode in C++
38. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 1: Fehlertoleranz gegenüber Realdaten
Einzelne Perturbation Rollen-Primitivität
1234
1 2
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
4 3 1/2/3/4
– Kleine Ungenauigkeiten in den zu Grunde gelegten
Beziehungsdaten führen zu völlig anderer Klassenstruktur
+ Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
39. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 1: Fehlertoleranz gegenüber Realdaten
Einzelne Perturbation Rollen-Primitivität
1234
1 2
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
4 3 1/2/3/4
– Kleine Ungenauigkeiten in den zu Grunde gelegten
Beziehungsdaten führen zu völlig anderer Klassenstruktur
+ Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
40. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 1: Fehlertoleranz gegenüber Realdaten
Einzelne Perturbation Rollen-Primitivität
1234
1 2
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
4 3 1/2/3/4
– Kleine Ungenauigkeiten in den zu Grunde gelegten
Beziehungsdaten führen zu völlig anderer Klassenstruktur
+ Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
41. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 2: Einbringung von Vorwissen
1234
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
1/2/3/4
+ Im Prinzip von jeder Partition aus startbar, so lässt sich die
Trennung bestimmter Knoten erzwingen.
– Trotz strukturellem Vorwissen ist weder Klassenzahl noch
Rollengraph vorgebbar.
42. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 2: Einbringung von Vorwissen
1234
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
1/2/3/4
+ Im Prinzip von jeder Partition aus startbar, so lässt sich die
Trennung bestimmter Knoten erzwingen.
– Trotz strukturellem Vorwissen ist weder Klassenzahl noch
Rollengraph vorgebbar.
43. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 2: Einbringung von Vorwissen
1234
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
1/2/3/4
+ Im Prinzip von jeder Partition aus startbar, so lässt sich die
Trennung bestimmter Knoten erzwingen.
– Trotz strukturellem Vorwissen ist weder Klassenzahl noch
Rollengraph vorgebbar.
44. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Grundideen der Blockmodellierung
1 Klassenzahl und Rollengraph als Modell-Annahme
2 Knoten bestmöglich den Rollen zuordnen
45. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Gütebeurteilung: Was bedeutet bestmöglich?
Die Zielfunktion ∆ soll folgende Eigenschaften erfüllen:
1 ∆(P) ≥ 0
2 ∆(P) = 0 ⇔ P ist exakt regulär.
Sei Θk die Menge aller Partitionen mit k Klassen. Dann ist zu
lösen das Optimierungsproblem
∆(P ∗ ) = min ∆(P)
P∈Θk
46. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Gütebeurteilung: Was bedeutet bestmöglich?
Wähle für ∆ die Definition
∆(P) = min d(Cu × Cv , B)
B∈B(Cu ,Cv )
Cu ,Cv ∈P
mit
Cu Cluster = Äquivalenzklasse mit Repräsentant u
Cu × Cv Block = kartesisches Produkt der Cluster (Cu , Cv )
B(Cu , Cv ) Menge aller Idealblöcke für Cu × Cv
d noch zu definierende Abstandsfunktion
47. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Wie sehen ideale reguläre Blockmatrizen aus?
Definition (Regulärer Block)
Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und
jeder Spalte mindestens eine 1 enthält.
Definition (Reguläre Matrix)
Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und
regulären Blöcken besteht.
Lemma (Konsistenz der Definition)
Eine Blockmatrix R ist genau dann regulär, wenn sie eine
reguläre Partition darstellt.
48. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Wie sehen ideale reguläre Blockmatrizen aus?
Definition (Regulärer Block)
Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und
jeder Spalte mindestens eine 1 enthält.
Definition (Reguläre Matrix)
Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und
regulären Blöcken besteht.
Lemma (Konsistenz der Definition)
Eine Blockmatrix R ist genau dann regulär, wenn sie eine
reguläre Partition darstellt.
49. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Wie sehen ideale reguläre Blockmatrizen aus?
Definition (Regulärer Block)
Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und
jeder Spalte mindestens eine 1 enthält.
Definition (Reguläre Matrix)
Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und
regulären Blöcken besteht.
Lemma (Konsistenz der Definition)
Eine Blockmatrix R ist genau dann regulär, wenn sie eine
reguläre Partition darstellt.
50. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Wie sehen ideale reguläre Blockmatrizen aus?
Beweis des Lemmas für Zeilen (Spalten analog).
„⇒“ Sei R regulär. Im Falle, dass Cu × Cv Nullblock ist nichts
zu zeigen. Da für jeden Block Cu × Cv gilt
Cu × Cv regulär =⇒ ∀w ∈ Cu ∃z ∈ Cv : rwz = 1 =⇒ P reg.
„⇐“ Angenommen die Blockmatrix R stelle die reguläre
Partition P dar, aber ein Block Cu × Cv sei weder Null- noch
regulärer Block. Sei o. B. d. A.
P reg.
(ruv = 1) =⇒ (∀w ∈ Cu ∃z ∈ Cv : rwz = 1)
Dann wäre aber Cu × Cv regulär zur Annahme.
51. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Naheliegende Definition
Definition (Abstandsfunktion d)
d(Cu × Cv , B) =
#Nullzeilen + #Nullspalten, falls Cu × Cv regulär
#Einsen, falls Cu × Cv Nullblock
Bemerkung
Obige Definition von d gewichtet Abweichungen in Nullblöcken
im Mittel stärker als in regulären Blöcken. Allerdings wird so die
IP-Formulierung später wesentlich übersichtlicher.
52. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Lösungsansätze
Definition (Lokale Transformation)
1 Vertausche zwei Zeilen bzw. Spalten aus verschiedenen
Clustern.
2 Verschiebe eine Zeile bzw. Spalte in einen anderen
Cluster.
Gradienten-Verfahren
Es werden solange lokale Transformationen durchgeführt, wie
dadurch ∆ (ganzzahlig) reduziert wird. Das erreichte Optimum
ist lokal. Globale Optimalität ist nur im Falle ∆ = 0 garantiert.
Daraus ergibt sich grundsätzliche Frage: Wann gibt es ein
exakt reguläre Partition mit genau k Äquivalenzklassen?
53. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Reguläre k -Zuweisbarkeit für ungerichtete Graphen
Definition (Reguläre k -Zuweisbarkeit)
Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
ihn eine exakte reguläre Äquivalenz mit genau k Klassen
existiert.
Leicht: k = 1 und k = |V | Schwer ist dagegen. . .
Satz (NP-Vollständigkeit von 2RA)
Das Entscheidungsproblem, ob ein ungerichteter Graph G
regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
54. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Reguläre k -Zuweisbarkeit für ungerichtete Graphen
Definition (Reguläre k -Zuweisbarkeit)
Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
ihn eine exakte reguläre Äquivalenz mit genau k Klassen
existiert.
Leicht: k = 1 und k = |V | Schwer ist dagegen. . .
Satz (NP-Vollständigkeit von 2RA)
Das Entscheidungsproblem, ob ein ungerichteter Graph G
regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
55. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Reguläre k -Zuweisbarkeit für ungerichtete Graphen
Definition (Reguläre k -Zuweisbarkeit)
Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
ihn eine exakte reguläre Äquivalenz mit genau k Klassen
existiert.
Leicht: k = 1 und k = |V | Schwer ist dagegen. . .
Satz (NP-Vollständigkeit von 2RA)
Das Entscheidungsproblem, ob ein ungerichteter Graph G
regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
56. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Reguläre k -Zuweisbarkeit für ungerichtete Graphen
Definition (Reguläre k -Zuweisbarkeit)
Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
ihn eine exakte reguläre Äquivalenz mit genau k Klassen
existiert.
Leicht: k = 1 und k = |V | Schwer ist dagegen. . .
Satz (NP-Vollständigkeit von 2RA)
Das Entscheidungsproblem, ob ein ungerichteter Graph G
regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
57. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
2-Rollenverteilungen eines ungerichteten Graphen
Definition (2RAi )
Mit 2RAi bezeichnen wir das Teilproblem, zu entscheiden ob G
regulär 2-zuweisbar ist mit Rollengraph Ri .
Abbildung: Anzeichnen
R1 R4
R2 R5
R3 R6
58. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
59. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
60. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
61. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
62. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
63. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Skizze der Beweisführung
Beweisidee.
klar !
Zeige 3SAT (NP-vollständig nach Cook) p 2RA ∈ NP.
Vorgehen.
Für eine beliebige Instanz von 3SAT mit
Variablenmenge U = {u1 , u2 , . . . , ui , . . . , un }
Aussagenmenge C = {c1 , c2 , . . . , cj , . . . , cm }
konstruiere einen Graphen, der genau dann regulär
2-zuweisbar ist, wenn die 3SAT -Instanz erfüllbar ist.
64. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Skizze der Beweisführung
Beweisidee.
klar !
Zeige 3SAT (NP-vollständig nach Cook) p 2RA ∈ NP.
Vorgehen.
Für eine beliebige Instanz von 3SAT mit
Variablenmenge U = {u1 , u2 , . . . , ui , . . . , un }
Aussagenmenge C = {c1 , c2 , . . . , cj , . . . , cm }
konstruiere einen Graphen, der genau dann regulär
2-zuweisbar ist, wenn die 3SAT -Instanz erfüllbar ist.
65. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Übertragung von 3SAT auf Graphen
Truth-Setting Ti und Satisfaction-Testing-Komponenten Sj
ui ui cj1 cj2
cj3
bj3
bj1
(a) T i (b) S j
66. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Beispielgraph zum Beweis von 3SAT p 2RA5
Konstruktion in PTIME aus der 3SAT -Instanz
¯ ¯
U = {u1 , u2 , u3 , u4 } und C = {{u1 , u2 , u3 }, {u2 , u3 , u4 }}
a11 a21 a31 a41
a12 a22 a32 a42
a13 a23 a33 a43
u1 u1 u2 u2 u3 u3 u4 u4
c11 c13 c 21 c 23
c12 c 22
b13 b23
b12 b22
b11 b21
67. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Beispielgraph zum Beweis von 2RA5 p 2RA
Konstruktion in PTIME
u1 u2
u1 u2 b1 a2
a1 b2
C1 C2
x1 y1 x2 y2
(a) G (b) G
68. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
Vereinbarungen zur IP-Formulierung
N ∈ N, N ≥ 3 Anzahl der Knoten
K ∈ N {0} Anzahl der Blöcke
N×N
S ∈ {0, 1} Adjazenzmatrix des Graphen
B ∈ {0, 1}K ×K Matrixdarstellung des Rollengraphen
P∈ NK ×K
0 Abweichungs-Gewichtungsmatrix (optional)
Lateinische Kleinbuchstaben stellen ggf. Elemente der mit
Großbuchstaben bezeichneten Matrizen dar.
Alle Ausdrücke gelten für alle Indizes aus {i, j, k , l},
über die nicht summiert wird.
Ausdrücke mit αikl , βjkl gelten nur für Blöcke (k , l)|bkl = 1.
69. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
IP-Formulierung [Brusco, Steinley]
N N N N
min pkl yijkl sij + pkl αikl + pkl β
i=1 j=1 (k ,l)|bkl =0 i=1 (k ,l)|bkl =1 j=1 (k ,l)|bkl =1
K N
s.t. xik = 1 xik ≥ 1 (1)
k =1 i=1
xik + xjl − yijkl ≤ 1 xik + xjl − 2 yijkl ≥ 0 (2)
N N
yijkl sij + αikl ≥ xik yijkl sij + βjkl ≥ xjl (3)
j=1 i=1
xik , yijkl ∈ {0, 1} αikl , βjkl ∈ {0, 1} (4)
70. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
IP-Formulierung [äquivalent und lesbar]
K K N N N N
min pkl ¬bkl yijkl sij + bkl αikl + βjkl
k =1 l=1 i=1 j=1 i=1 j=1
K N
s.t. xik = 1 xik ≥ 1 (1)
k =1 i=1
xik + xjl − yijkl ≤ 1 xik + xjl − 2 yijkl ≥ 0 (2)
N N
yijkl sij + αikl ≥ xik yijkl sij + βjkl ≥ xjl (3)
j=1 i=1
xik , yijkl ∈ {0, 1} αikl , βjkl ∈ {0, 1} (4)
71. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
Nachbemerkung I zur IP-Formulierung
Die Typ (2)-Nebenbedingung
xik + xjl − 2 yijkl ≥ 0
ist von entscheidender Bedeutung. Würde sie fehlen, könnten
die yijkl trotz xik xjl = 1 irrtümlich den Wert 1 annehmen, nur um
die Nebenbedingungen vom Typ (3) zu erfüllen.
72. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
Benchmark: Das Everett-Netzwerk
a b c d e f g h i j
a 0 1 1 1 0 0 0 0 0 0
b 1 0 1 0 1 0 0 0 0 0
c 1 1 0 1 0 0 0 0 0 0
d 1 0 1 0 1 0 0 0 0 0
e 0 1 0 1 0 1 0 0 0 0
f 0 0 0 0 1 0 1 0 1 0
g 0 0 0 0 0 1 0 1 0 1
h 0 0 0 0 0 0 1 0 1 1
i 0 0 0 0 0 1 0 1 0 1
j 0 0 0 0 0 0 1 1 1 0
Tabelle: Eingangsdaten
77. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
Nachbemerkung II zur IP-Formulierung
In eine ähnliche IP-Form bringen lassen sich
Strukturelle Äquivalenz Wesentlich einfacher, da bkl = 1 ⇔
Block kl vollbesetzt.
SE und RE auf V × W Noch um einges komplexer, da Partition
zweier Mengen erforderlich.
78. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Vorzüge und Nachteile aller drei Ansätze
CATREGE Gradienten-Heuristik IP-Lösung
Güte keine Aussage lokales Optimum Optimalitätsgarantie
Vorgehen explorativ Hypothesentest Hypothesentest
Vorwissen kaum einbringbar Rollengraphvorgabe Rollengraphvorgabe
Worst-Case-Laufzeit O(n3 ) überpolynomial überpolynomial
mehrereRelationen einfach möglich großer Mehraufwand großer Mehraufwand
79. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Forschungsperspektive
Wünschenswert wären Verfahren, die alle drei Kriterien
erfüllen:
1 Rollengraph auswählen
2 Reguläre Partition finden
3 Optimalitätsgarantie liefern
80. Anhang
Weiterführende Literatur
Weiterführende Literatur I
Jürgen Lerner.
Role Assignments, S. 216–252.
in Brandes, Erlebach: Network Analysis, Springer 2005.
Fred S. Roberts, Li Sheng 2001.
How Hard Is It to Determine If a Graph Has a 2-Role
Assignment?
NETWORKS Journal, Vol. 37, S. 67-73.
Michael J. Brusco, Douglas Steinley 2009
Integer programs for one- and two-mode blockmodeling
based on prespecified image matrices for structural and
regular equivalence.
Journal of Mathematical Psychology, Nr. 53, S. 577-585.