SlideShare uma empresa Scribd logo
1 de 36
Baixar para ler offline
Vortrag
Status Quo und Zukunft von AANs
Referent: Mirko Bettermann
29.11.10 Status Quo und Zukunft von AANs 2
Inhalt
Artefakt-Akteur-Netzwerke
Netzwerk- und Dokumentanalyse
Eingesetzte Technologien
Status Quo, Probleme, Lösungen
29.11.10 Status Quo und Zukunft von AANs 3
Akteur-Netzwerk
Soziales Netzwerk: Eine Menge von
Beziehungen, die zwischen Personen
bestehen, und Rückschlüsse auf das
Sozialverhalten der Personen erlauben
Beispiele: XING, studiVZ
Akteur-Netzwerk: Abstraktion eines Sozialen
Netzwerkes
Beziehungen zwischen Akteuren werden als
ACT2
Beziehungen bezeichnet
Mögliches Vokabular: Friend-Of-A-Friend
29.11.10 Status Quo und Zukunft von AANs 4
Artefakt-Netzwerk
Netzwerk von Artefakten die miteinander in
Beziehung stehen
Artefakt: Verallgemeinerung des
Dokumentbegriffs
Beziehungen zwischen Artefakten werden als
ART2
Beziehungen bezeichnet
Mögliche Vokabulare:
Semantically-Interlinked Online Communities
(SIOC)
Dublin Core Metadata Initiative (DCMI)
29.11.10 Status Quo und Zukunft von AANs 5
Artefact-Akteur-Netzwerke (1)
Konsolidierung von
Artefakt-Netzwerken
und Akteur-
Netzwerken
Erlauben von
zusätzlichen Actor-
Artefact und Artefact-
Actor-Beziehungen
29.11.10 Status Quo und Zukunft von AANs 6
Artefact-Akteur-Netzwerke (2)
29.11.10 Status Quo und Zukunft von AANs 7
Überblick
Artefakt-Akteur-Netzwerke
Netzwerk- und Dokumentanalyse
Eingesetzte Technologien
Status Quo, Probleme, Lösungen
29.11.10 Status Quo und Zukunft von AANs 8
Netzwerkanalyse (1)
Die Dichte gibt die Stärke der Verbundenheit
eines Netzwerkes an
Die Zentralität eines Knotens gibt an wie stark
dieser in das Gesamtnetzwerk eingebunden ist
Degree-Zentralität
Betweenness-Zentralität
Dichte=
Anzahl Kanten
Anzahl möglicherKanten
29.11.10 Status Quo und Zukunft von AANs 9
Netzwerkanalyse (2)
Degree-Zentralität
Ein Knoten ist zentral wenn er mit möglichst vielen
anderen Knoten in Beziehung steht
Betweenness-Zentralität
Ein Knoten ist zentral wenn er auf vielen kürzesten
Wegen zwischen Knotenpaaren vorkommt
29.11.10 Status Quo und Zukunft von AANs 10
Netzwerkanalyse (3)
29.11.10 Status Quo und Zukunft von AANs 11
Dokumentanalyse (1)
Jedes Dokument wird durch eine Menge von
Schlüsselwörtern charakterisiert
Die Relevanz eines Schlüsselwortes sagt aus
wie gut dieses das jeweilige Dokument
beschreibt
Schlüsselwörter können entweder durch
Benutzer oder durch Dienste bestimmt werden
Relevanz=Termfrequenz⋅Inverse Dokumentfrequenz
29.11.10 Status Quo und Zukunft von AANs 12
Dokumentanalyse (2)
SemSim-Funktion zur Berechnung der
Ähnlichkeit zweier Texte A und B
ConSim berechnet die Ähnlichkeit der
Relevanzen eines Schlüsselwortes das A und B
beschreibt
29.11.10 Status Quo und Zukunft von AANs 13
Dokumentanalyse (3)
SemSim gewichtet die Ähnlichkeit der
Relevanzen mit dem Wert der kleineren
Relevanz
Anschließendes aufsummieren für alle
gemeinsamen Schlüsselwörter
Quadrieren des ConSim bewirkt Glättung
SemSim ist bereits implementiert – weitere
Funktionen zur Ähnlichkeitsberechnung sind in
Arbeit
29.11.10 Status Quo und Zukunft von AANs 14
Dokumentanalyse (4)
29.11.10 Status Quo und Zukunft von AANs 15
Überblick
Artefakt-Akteur-Netzwerke
Netzwerk- und Dokumentanalyse
Eingesetzte Technologien
Status Quo, Probleme, Lösungen
29.11.10 Status Quo und Zukunft von AANs 16
Ressource Description Framework
(1)
Standard zur Beschreibung von Ressourcen
des Internet
Ausdehnung auf Beschreibung von durch URI
bestimmbare Entitäten (z. B. Katalogdienste,
Feeds, Dateien)
RDF ist durch Maschinen auswertbar und
durchsuchbar (SPARQL)
RDF Datenmodell basiert auf gerichteten
Graphen
29.11.10 Status Quo und Zukunft von AANs 17
Ressource Description Framework
(2)
Daten sind wahre Aussagen über Ressourcen
Aussagen bestehen aus Tripel Subjekt,
Prädikat und Objekt
Subjekt: Die Ressource über die eine Aussage
getroffen wird
Prädikat: Die Eigenschaft des Subjekts
Objekt: Das Argument des Prädikats
Die Menge aller Aussagen bildet einen
gerichteten Graph
29.11.10 Status Quo und Zukunft von AANs 18
OWL
Formale Beschreibungssprachen vom W3C
Hier zur Definition von Ontologien (RDF-
Vokabulare) eingesetzt
Basiert technisch gesehen auf der RDF-Syntax,
kann aber wesentlich mehr
Vererbung
Inverse, Symmetrie, Transitivität, Kardinalitäten
Prädikatenlogik
29.11.10 Status Quo und Zukunft von AANs 19
Ontologie
29.11.10 Status Quo und Zukunft von AANs 20
Jena
Java basiertes Open Source Framework für
Semantische Netze
Speichern und Laden von Graphen in RDF
Notation
Unterstützt OWL-Ontologien und bietet
automatische Inferenzbildung
Schnelles Einfügen und Wiederfinden von RDF
Tripeln
Ermöglicht abrufen der Daten durch SPARQL
29.11.10 Status Quo und Zukunft von AANs 21
OSGi
Open Services Gateway initiative: Hardware­
unabhängige dynamische Softwareplattform
Erleichtert die Implementierung von
Komponenten-basierter Software
Ermöglicht das Einbinden neuer Komponenten
zur Laufzeit und ohne Codeänderung
Kommunikation der Komponenten durch OSGi-
Dienste
29.11.10 Status Quo und Zukunft von AANs 22
Überblick
Artefakt-Akteur-Netzwerke
Netzwerk- und Dokumentanalyse
Eingesetzte Technologien
Status Quo, Probleme, Lösungen
29.11.10 Status Quo und Zukunft von AANs 23
Ablauf (1)
29.11.10 Status Quo und Zukunft von AANs 24
Ablauf (2)
29.11.10 Status Quo und Zukunft von AANs 25
Crawler/CrawlerManager (1)
Empfangen Content-Analyse Aufträge
Der CrawlerManager nutzt die Dienste des
Crawlers und bietet selbst Funktionen auf
höherer Ebene
Der Crawler bekommt die URI des zu
analysierenden Artefaktes und setzt die
Verarbeitungskette in Gang
Accessor
MimeTyper
Parser
29.11.10 Status Quo und Zukunft von AANs 26
Ablauf (3)
29.11.10 Status Quo und Zukunft von AANs 27
Crawler/CrawlerManager (2)
Jeder Crawl-Auftrag wird in einen
eigenständigen Thread ausgeführt
Crawler erzeugt CrawlerDataObject
Problem:
Bei Systemausfall geht das CrawlerDataObject und
damit alle während des Jobs gewonnenen Daten
verloren
Lösung:
Sicherung der CrawlerDataObjects in einer
Datenbank
29.11.10 Status Quo und Zukunft von AANs 28
Ablauf (4)
29.11.10 Status Quo und Zukunft von AANs 29
Parser
Sucht in den Ressourcen nach semantischen
Relationen
Schreibt in den Jena DataStore und den
FullTextStore
Problem:
Zu jeder Ressourcen URI kann ein Volltext abgelegt
werden. Abstract oder Kompletter Volltext möglich.
Lösung:
Kennzeichnung durch zusätzlichen Parameter
29.11.10 Status Quo und Zukunft von AANs 30
Jena DataStore
Speichert vom Parser erzeugte RDF-Tripel die
der Ontologie genügen
Probleme:
Inferenzen werden erst nach konkreten Anfragen
durchgeführt
Inferenzen werden nicht persistent gespeichert
Lösung:
Inferenzen durchführen wenn neue Tripel
gespeichert werden und persistent speichern
29.11.10 Status Quo und Zukunft von AANs 31
FullTextLucene
Konkrete Implementierung des FullTextStore
und RelevanceStore in einer Komponente
Bestimmung von Schlüsselwörtern erfordert die
Speicherung von Volltext
Speichert die Relevanzen von Schlüsselwörtern
Informiert die TextAnalyser und die
ReferenceAnalyser Komponente durch OSGi
Events
29.11.10 Status Quo und Zukunft von AANs 32
Analysing-Block (1)
Network-Analyser
Reagieren auf Änderungen im Datastore
Analysieren das Netzwerk (Dichte, Zentralität)
TextAnalyser:
Reagieren auf Updates im Fulltextstore
Bestimmen Schlüsselwörter und Named Entities
und legen diese im DataStore ab
Orchestr8Analyser, OpenCalaisAnalyser,
CosineAnalyser
29.11.10 Status Quo und Zukunft von AANs 33
Analysing-Block (2)
RelevanceAnalyser
Reagiert auf OSGi Events vom FullTextLucene
SemSimAnalyser: berechnet die Semantische
Ähnlichkeit von Artefakten nach der SemSim-
Funktion
Problem:
Ähnlichkeiten werden „on the fly“ berechnet und
nicht persistent gespeichert
Lösung:
SimitarityStore zur persistenten Speicherung
29.11.10 Status Quo und Zukunft von AANs 34
Fertig!
Vielen Dank für die Aufmerksamkeit!
29.11.10 Status Quo und Zukunft von AANs 35
Literatur (1)
Wolfgang Reinhardt, Matthias Moi, Tobias Varlemann:
Artefact-Actor-Networks as tie between social networks and
artefact networks
Matthias Moi: Soziale Netzwerkanalyse in Artefact-Actor-
Networks
Wolfgang Reinhardt, Tobias Varlemann, Matthias Moi,
Adrian Wilke: Modeling, obtaining and storing data from
social media tools with Artefact-Actor-Networks
Tobias Varlemann: Konzeption und Entwicklung einer
Architektur zur semantischen Analyse, Speicherung und
Bereitstellung von Daten aus Blogs und Microblogs in
Artefact-Actor-Networks, Universität Paderborn, 2010
29.11.10 Status Quo und Zukunft von AANs 36
Literatur (2)
Adrian Wilke: Analysis and integration of Web 2.0 data
sources into a system for analysis and storage of Artefact-
Actor-Networks, Universität Paderborn, 2010
Tobias Varlemann: Kleine Einführung ins RDF und Jena
Tobias Varlemann: Kleine Einführung ins OSGi
Gespräche und E-mail Austausch mit:
Adrian Wilke, Christian Meier, Tobias Varlemann, Matthias
Moi

Mais conteúdo relacionado

Destaque

Destaque (20)

Juego powerpoint-41
Juego powerpoint-41Juego powerpoint-41
Juego powerpoint-41
 
L3 la trinidad
L3 la trinidadL3 la trinidad
L3 la trinidad
 
Nudos De Pesca
Nudos De PescaNudos De Pesca
Nudos De Pesca
 
Diapositivas de zahara
Diapositivas de zaharaDiapositivas de zahara
Diapositivas de zahara
 
Die 4 elemente_-_luft-feuer-erde-wasser
Die 4 elemente_-_luft-feuer-erde-wasserDie 4 elemente_-_luft-feuer-erde-wasser
Die 4 elemente_-_luft-feuer-erde-wasser
 
Demokratisches Stipendium
Demokratisches StipendiumDemokratisches Stipendium
Demokratisches Stipendium
 
Datenschutz Als Ideologie
Datenschutz Als IdeologieDatenschutz Als Ideologie
Datenschutz Als Ideologie
 
81139 -el__eco__de__la__vida__mqargarita
81139  -el__eco__de__la__vida__mqargarita81139  -el__eco__de__la__vida__mqargarita
81139 -el__eco__de__la__vida__mqargarita
 
Trastornos alimenticios
Trastornos alimenticios Trastornos alimenticios
Trastornos alimenticios
 
Algo
AlgoAlgo
Algo
 
Visionen 2020
Visionen 2020Visionen 2020
Visionen 2020
 
Diseño de entradas y controles de sistemas
Diseño de entradas y controles de sistemasDiseño de entradas y controles de sistemas
Diseño de entradas y controles de sistemas
 
Diapositivas gama
Diapositivas gamaDiapositivas gama
Diapositivas gama
 
Trabajo en equipo
Trabajo en equipoTrabajo en equipo
Trabajo en equipo
 
Kapitel 1 Stufe 1
Kapitel 1   Stufe 1Kapitel 1   Stufe 1
Kapitel 1 Stufe 1
 
alternatives_bauen_Brasilien
alternatives_bauen_Brasilienalternatives_bauen_Brasilien
alternatives_bauen_Brasilien
 
Das Ascona-Projekt - Joachim Ramisch
Das Ascona-Projekt - Joachim RamischDas Ascona-Projekt - Joachim Ramisch
Das Ascona-Projekt - Joachim Ramisch
 
Diapositivas del pis
Diapositivas del pisDiapositivas del pis
Diapositivas del pis
 
Echtzeit Klub - Apps: Fabien Röhlinger (AndroidPit)
Echtzeit Klub - Apps: Fabien Röhlinger (AndroidPit)Echtzeit Klub - Apps: Fabien Röhlinger (AndroidPit)
Echtzeit Klub - Apps: Fabien Röhlinger (AndroidPit)
 
2013-3_arbeitswelt im 21. jahrhundert
2013-3_arbeitswelt im 21. jahrhundert2013-3_arbeitswelt im 21. jahrhundert
2013-3_arbeitswelt im 21. jahrhundert
 

Semelhante a Status quo und zukunft von aa ns.pdf

Ist ADO.NET EntityFramework das bessere LINQ?
Ist ADO.NET EntityFramework das bessere LINQ?Ist ADO.NET EntityFramework das bessere LINQ?
Ist ADO.NET EntityFramework das bessere LINQ?.NET User Group Dresden
 
Reactive Framework (Rx)
Reactive Framework (Rx)Reactive Framework (Rx)
Reactive Framework (Rx)Martin Hey
 
eCopSoft Präsentation Sascha Rinne
eCopSoft Präsentation Sascha RinneeCopSoft Präsentation Sascha Rinne
eCopSoft Präsentation Sascha RinneWolfgang Reinhardt
 
Build Prozesse und Configuration Management
Build Prozesse und Configuration ManagementBuild Prozesse und Configuration Management
Build Prozesse und Configuration ManagementChristian Baranowski
 
Bkr Workflow Oeffentlich
Bkr Workflow OeffentlichBkr Workflow Oeffentlich
Bkr Workflow OeffentlichRalf Ruethlein
 
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSPSoftware Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSPChristian Guenther
 
Ecm 5 13_djaafar_jas_forge
Ecm 5 13_djaafar_jas_forgeEcm 5 13_djaafar_jas_forge
Ecm 5 13_djaafar_jas_forgeJasmine Conseil
 
Suche und PyLucene
Suche und PyLuceneSuche und PyLucene
Suche und PyLuceneThomas Koch
 
GraphTalk - Semantische Netze mit structr
GraphTalk - Semantische Netze mit structrGraphTalk - Semantische Netze mit structr
GraphTalk - Semantische Netze mit structrNeo4j
 
Konzeption und Implementierung eines Multi- Agentensystems zur Informationsge...
Konzeption und Implementierung eines Multi- Agentensystems zur Informationsge...Konzeption und Implementierung eines Multi- Agentensystems zur Informationsge...
Konzeption und Implementierung eines Multi- Agentensystems zur Informationsge...Daniel Brügge
 
Sich selbst verstehen – der ELK-Stack in der Praxis
Sich selbst verstehen – der ELK-Stack in der PraxisSich selbst verstehen – der ELK-Stack in der Praxis
Sich selbst verstehen – der ELK-Stack in der PraxisAlexander Papaspyrou
 
DACHNUG50 Interpretation-von-Event-Logs-aus-CNX-mit-Hilfe-von-Domino.pdf
DACHNUG50 Interpretation-von-Event-Logs-aus-CNX-mit-Hilfe-von-Domino.pdfDACHNUG50 Interpretation-von-Event-Logs-aus-CNX-mit-Hilfe-von-Domino.pdf
DACHNUG50 Interpretation-von-Event-Logs-aus-CNX-mit-Hilfe-von-Domino.pdfDNUG e.V.
 
Open Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Open Source Software zur Verarbeitung und Analyse von MetadatenmanagementOpen Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Open Source Software zur Verarbeitung und Analyse von MetadatenmanagementMagnus Pfeffer
 
Provenance-Aufzeichnung und -Analyse für Grid-Workflows
Provenance-Aufzeichnung und -Analyse für Grid-WorkflowsProvenance-Aufzeichnung und -Analyse für Grid-Workflows
Provenance-Aufzeichnung und -Analyse für Grid-WorkflowsAndreas Schreiber
 
Kollaborative Projekte mit Watson Explorer
Kollaborative Projekte mit Watson ExplorerKollaborative Projekte mit Watson Explorer
Kollaborative Projekte mit Watson ExplorerParadigma Consulting
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenBjörn Muschall
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenLydiaU
 

Semelhante a Status quo und zukunft von aa ns.pdf (20)

Ist ADO.NET EntityFramework das bessere LINQ?
Ist ADO.NET EntityFramework das bessere LINQ?Ist ADO.NET EntityFramework das bessere LINQ?
Ist ADO.NET EntityFramework das bessere LINQ?
 
Reactive Framework (Rx)
Reactive Framework (Rx)Reactive Framework (Rx)
Reactive Framework (Rx)
 
eCopSoft Präsentation Sascha Rinne
eCopSoft Präsentation Sascha RinneeCopSoft Präsentation Sascha Rinne
eCopSoft Präsentation Sascha Rinne
 
Linked Library Data & RDA
Linked Library Data & RDALinked Library Data & RDA
Linked Library Data & RDA
 
NoSQL und CouchDB
NoSQL und CouchDBNoSQL und CouchDB
NoSQL und CouchDB
 
Build Prozesse und Configuration Management
Build Prozesse und Configuration ManagementBuild Prozesse und Configuration Management
Build Prozesse und Configuration Management
 
Bkr Workflow Oeffentlich
Bkr Workflow OeffentlichBkr Workflow Oeffentlich
Bkr Workflow Oeffentlich
 
Semantisches Web
Semantisches WebSemantisches Web
Semantisches Web
 
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSPSoftware Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
Software Architecture Design Patterns der COMLINE Cloud Service Platform - CSP
 
Ecm 5 13_djaafar_jas_forge
Ecm 5 13_djaafar_jas_forgeEcm 5 13_djaafar_jas_forge
Ecm 5 13_djaafar_jas_forge
 
Suche und PyLucene
Suche und PyLuceneSuche und PyLucene
Suche und PyLucene
 
GraphTalk - Semantische Netze mit structr
GraphTalk - Semantische Netze mit structrGraphTalk - Semantische Netze mit structr
GraphTalk - Semantische Netze mit structr
 
Konzeption und Implementierung eines Multi- Agentensystems zur Informationsge...
Konzeption und Implementierung eines Multi- Agentensystems zur Informationsge...Konzeption und Implementierung eines Multi- Agentensystems zur Informationsge...
Konzeption und Implementierung eines Multi- Agentensystems zur Informationsge...
 
Sich selbst verstehen – der ELK-Stack in der Praxis
Sich selbst verstehen – der ELK-Stack in der PraxisSich selbst verstehen – der ELK-Stack in der Praxis
Sich selbst verstehen – der ELK-Stack in der Praxis
 
DACHNUG50 Interpretation-von-Event-Logs-aus-CNX-mit-Hilfe-von-Domino.pdf
DACHNUG50 Interpretation-von-Event-Logs-aus-CNX-mit-Hilfe-von-Domino.pdfDACHNUG50 Interpretation-von-Event-Logs-aus-CNX-mit-Hilfe-von-Domino.pdf
DACHNUG50 Interpretation-von-Event-Logs-aus-CNX-mit-Hilfe-von-Domino.pdf
 
Open Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Open Source Software zur Verarbeitung und Analyse von MetadatenmanagementOpen Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Open Source Software zur Verarbeitung und Analyse von Metadatenmanagement
 
Provenance-Aufzeichnung und -Analyse für Grid-Workflows
Provenance-Aufzeichnung und -Analyse für Grid-WorkflowsProvenance-Aufzeichnung und -Analyse für Grid-Workflows
Provenance-Aufzeichnung und -Analyse für Grid-Workflows
 
Kollaborative Projekte mit Watson Explorer
Kollaborative Projekte mit Watson ExplorerKollaborative Projekte mit Watson Explorer
Kollaborative Projekte mit Watson Explorer
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 

Status quo und zukunft von aa ns.pdf

  • 1. Vortrag Status Quo und Zukunft von AANs Referent: Mirko Bettermann
  • 2. 29.11.10 Status Quo und Zukunft von AANs 2 Inhalt Artefakt-Akteur-Netzwerke Netzwerk- und Dokumentanalyse Eingesetzte Technologien Status Quo, Probleme, Lösungen
  • 3. 29.11.10 Status Quo und Zukunft von AANs 3 Akteur-Netzwerk Soziales Netzwerk: Eine Menge von Beziehungen, die zwischen Personen bestehen, und Rückschlüsse auf das Sozialverhalten der Personen erlauben Beispiele: XING, studiVZ Akteur-Netzwerk: Abstraktion eines Sozialen Netzwerkes Beziehungen zwischen Akteuren werden als ACT2 Beziehungen bezeichnet Mögliches Vokabular: Friend-Of-A-Friend
  • 4. 29.11.10 Status Quo und Zukunft von AANs 4 Artefakt-Netzwerk Netzwerk von Artefakten die miteinander in Beziehung stehen Artefakt: Verallgemeinerung des Dokumentbegriffs Beziehungen zwischen Artefakten werden als ART2 Beziehungen bezeichnet Mögliche Vokabulare: Semantically-Interlinked Online Communities (SIOC) Dublin Core Metadata Initiative (DCMI)
  • 5. 29.11.10 Status Quo und Zukunft von AANs 5 Artefact-Akteur-Netzwerke (1) Konsolidierung von Artefakt-Netzwerken und Akteur- Netzwerken Erlauben von zusätzlichen Actor- Artefact und Artefact- Actor-Beziehungen
  • 6. 29.11.10 Status Quo und Zukunft von AANs 6 Artefact-Akteur-Netzwerke (2)
  • 7. 29.11.10 Status Quo und Zukunft von AANs 7 Überblick Artefakt-Akteur-Netzwerke Netzwerk- und Dokumentanalyse Eingesetzte Technologien Status Quo, Probleme, Lösungen
  • 8. 29.11.10 Status Quo und Zukunft von AANs 8 Netzwerkanalyse (1) Die Dichte gibt die Stärke der Verbundenheit eines Netzwerkes an Die Zentralität eines Knotens gibt an wie stark dieser in das Gesamtnetzwerk eingebunden ist Degree-Zentralität Betweenness-Zentralität Dichte= Anzahl Kanten Anzahl möglicherKanten
  • 9. 29.11.10 Status Quo und Zukunft von AANs 9 Netzwerkanalyse (2) Degree-Zentralität Ein Knoten ist zentral wenn er mit möglichst vielen anderen Knoten in Beziehung steht Betweenness-Zentralität Ein Knoten ist zentral wenn er auf vielen kürzesten Wegen zwischen Knotenpaaren vorkommt
  • 10. 29.11.10 Status Quo und Zukunft von AANs 10 Netzwerkanalyse (3)
  • 11. 29.11.10 Status Quo und Zukunft von AANs 11 Dokumentanalyse (1) Jedes Dokument wird durch eine Menge von Schlüsselwörtern charakterisiert Die Relevanz eines Schlüsselwortes sagt aus wie gut dieses das jeweilige Dokument beschreibt Schlüsselwörter können entweder durch Benutzer oder durch Dienste bestimmt werden Relevanz=Termfrequenz⋅Inverse Dokumentfrequenz
  • 12. 29.11.10 Status Quo und Zukunft von AANs 12 Dokumentanalyse (2) SemSim-Funktion zur Berechnung der Ähnlichkeit zweier Texte A und B ConSim berechnet die Ähnlichkeit der Relevanzen eines Schlüsselwortes das A und B beschreibt
  • 13. 29.11.10 Status Quo und Zukunft von AANs 13 Dokumentanalyse (3) SemSim gewichtet die Ähnlichkeit der Relevanzen mit dem Wert der kleineren Relevanz Anschließendes aufsummieren für alle gemeinsamen Schlüsselwörter Quadrieren des ConSim bewirkt Glättung SemSim ist bereits implementiert – weitere Funktionen zur Ähnlichkeitsberechnung sind in Arbeit
  • 14. 29.11.10 Status Quo und Zukunft von AANs 14 Dokumentanalyse (4)
  • 15. 29.11.10 Status Quo und Zukunft von AANs 15 Überblick Artefakt-Akteur-Netzwerke Netzwerk- und Dokumentanalyse Eingesetzte Technologien Status Quo, Probleme, Lösungen
  • 16. 29.11.10 Status Quo und Zukunft von AANs 16 Ressource Description Framework (1) Standard zur Beschreibung von Ressourcen des Internet Ausdehnung auf Beschreibung von durch URI bestimmbare Entitäten (z. B. Katalogdienste, Feeds, Dateien) RDF ist durch Maschinen auswertbar und durchsuchbar (SPARQL) RDF Datenmodell basiert auf gerichteten Graphen
  • 17. 29.11.10 Status Quo und Zukunft von AANs 17 Ressource Description Framework (2) Daten sind wahre Aussagen über Ressourcen Aussagen bestehen aus Tripel Subjekt, Prädikat und Objekt Subjekt: Die Ressource über die eine Aussage getroffen wird Prädikat: Die Eigenschaft des Subjekts Objekt: Das Argument des Prädikats Die Menge aller Aussagen bildet einen gerichteten Graph
  • 18. 29.11.10 Status Quo und Zukunft von AANs 18 OWL Formale Beschreibungssprachen vom W3C Hier zur Definition von Ontologien (RDF- Vokabulare) eingesetzt Basiert technisch gesehen auf der RDF-Syntax, kann aber wesentlich mehr Vererbung Inverse, Symmetrie, Transitivität, Kardinalitäten Prädikatenlogik
  • 19. 29.11.10 Status Quo und Zukunft von AANs 19 Ontologie
  • 20. 29.11.10 Status Quo und Zukunft von AANs 20 Jena Java basiertes Open Source Framework für Semantische Netze Speichern und Laden von Graphen in RDF Notation Unterstützt OWL-Ontologien und bietet automatische Inferenzbildung Schnelles Einfügen und Wiederfinden von RDF Tripeln Ermöglicht abrufen der Daten durch SPARQL
  • 21. 29.11.10 Status Quo und Zukunft von AANs 21 OSGi Open Services Gateway initiative: Hardware­ unabhängige dynamische Softwareplattform Erleichtert die Implementierung von Komponenten-basierter Software Ermöglicht das Einbinden neuer Komponenten zur Laufzeit und ohne Codeänderung Kommunikation der Komponenten durch OSGi- Dienste
  • 22. 29.11.10 Status Quo und Zukunft von AANs 22 Überblick Artefakt-Akteur-Netzwerke Netzwerk- und Dokumentanalyse Eingesetzte Technologien Status Quo, Probleme, Lösungen
  • 23. 29.11.10 Status Quo und Zukunft von AANs 23 Ablauf (1)
  • 24. 29.11.10 Status Quo und Zukunft von AANs 24 Ablauf (2)
  • 25. 29.11.10 Status Quo und Zukunft von AANs 25 Crawler/CrawlerManager (1) Empfangen Content-Analyse Aufträge Der CrawlerManager nutzt die Dienste des Crawlers und bietet selbst Funktionen auf höherer Ebene Der Crawler bekommt die URI des zu analysierenden Artefaktes und setzt die Verarbeitungskette in Gang Accessor MimeTyper Parser
  • 26. 29.11.10 Status Quo und Zukunft von AANs 26 Ablauf (3)
  • 27. 29.11.10 Status Quo und Zukunft von AANs 27 Crawler/CrawlerManager (2) Jeder Crawl-Auftrag wird in einen eigenständigen Thread ausgeführt Crawler erzeugt CrawlerDataObject Problem: Bei Systemausfall geht das CrawlerDataObject und damit alle während des Jobs gewonnenen Daten verloren Lösung: Sicherung der CrawlerDataObjects in einer Datenbank
  • 28. 29.11.10 Status Quo und Zukunft von AANs 28 Ablauf (4)
  • 29. 29.11.10 Status Quo und Zukunft von AANs 29 Parser Sucht in den Ressourcen nach semantischen Relationen Schreibt in den Jena DataStore und den FullTextStore Problem: Zu jeder Ressourcen URI kann ein Volltext abgelegt werden. Abstract oder Kompletter Volltext möglich. Lösung: Kennzeichnung durch zusätzlichen Parameter
  • 30. 29.11.10 Status Quo und Zukunft von AANs 30 Jena DataStore Speichert vom Parser erzeugte RDF-Tripel die der Ontologie genügen Probleme: Inferenzen werden erst nach konkreten Anfragen durchgeführt Inferenzen werden nicht persistent gespeichert Lösung: Inferenzen durchführen wenn neue Tripel gespeichert werden und persistent speichern
  • 31. 29.11.10 Status Quo und Zukunft von AANs 31 FullTextLucene Konkrete Implementierung des FullTextStore und RelevanceStore in einer Komponente Bestimmung von Schlüsselwörtern erfordert die Speicherung von Volltext Speichert die Relevanzen von Schlüsselwörtern Informiert die TextAnalyser und die ReferenceAnalyser Komponente durch OSGi Events
  • 32. 29.11.10 Status Quo und Zukunft von AANs 32 Analysing-Block (1) Network-Analyser Reagieren auf Änderungen im Datastore Analysieren das Netzwerk (Dichte, Zentralität) TextAnalyser: Reagieren auf Updates im Fulltextstore Bestimmen Schlüsselwörter und Named Entities und legen diese im DataStore ab Orchestr8Analyser, OpenCalaisAnalyser, CosineAnalyser
  • 33. 29.11.10 Status Quo und Zukunft von AANs 33 Analysing-Block (2) RelevanceAnalyser Reagiert auf OSGi Events vom FullTextLucene SemSimAnalyser: berechnet die Semantische Ähnlichkeit von Artefakten nach der SemSim- Funktion Problem: Ähnlichkeiten werden „on the fly“ berechnet und nicht persistent gespeichert Lösung: SimitarityStore zur persistenten Speicherung
  • 34. 29.11.10 Status Quo und Zukunft von AANs 34 Fertig! Vielen Dank für die Aufmerksamkeit!
  • 35. 29.11.10 Status Quo und Zukunft von AANs 35 Literatur (1) Wolfgang Reinhardt, Matthias Moi, Tobias Varlemann: Artefact-Actor-Networks as tie between social networks and artefact networks Matthias Moi: Soziale Netzwerkanalyse in Artefact-Actor- Networks Wolfgang Reinhardt, Tobias Varlemann, Matthias Moi, Adrian Wilke: Modeling, obtaining and storing data from social media tools with Artefact-Actor-Networks Tobias Varlemann: Konzeption und Entwicklung einer Architektur zur semantischen Analyse, Speicherung und Bereitstellung von Daten aus Blogs und Microblogs in Artefact-Actor-Networks, Universität Paderborn, 2010
  • 36. 29.11.10 Status Quo und Zukunft von AANs 36 Literatur (2) Adrian Wilke: Analysis and integration of Web 2.0 data sources into a system for analysis and storage of Artefact- Actor-Networks, Universität Paderborn, 2010 Tobias Varlemann: Kleine Einführung ins RDF und Jena Tobias Varlemann: Kleine Einführung ins OSGi Gespräche und E-mail Austausch mit: Adrian Wilke, Christian Meier, Tobias Varlemann, Matthias Moi