Folien zu unserem Vortrag "Zur Identifikation von Frames in großen Medien-Korpora. Ein methodischer Vorschlag und seine Exemplifikation anhand der Klimaberichterstattung" im Rahmen der DGuK-Jahrestagung 2013 in Mainz.
Abstract: Das Framing-Konzept gehört zum Kernbestand der Kommunikationswissenschaft. Es dient dazu, in (Medien-)Texten latente Bedeutungsstrukturen aufzudecken. Gängige Verfahren sind meist auf vorgegebene inhaltsanalytische Kategorien und/oder Interpretationen der Forscher angewiesen und bleiben bislang auf kleinere und mittelgroße Textkorpora beschränkt. Sie können daher die Möglichkeiten, die in der zunehmenden Verfügbarkeit elektronischer Volltextarchive oder des Internets als Datenquelle angelegt sind, nur begrenzt nutzen. Der hier präsentierte methodische Vorschlag soll ein erster Schritt auf dem Weg dahin sein, Frames auch in größeren Medien-Korpora identifizieren zu können. Mittels Faktorenanalysen arbeiten wir latente Bedeutungsstrukturen aus einem umfangreichen Printmedien-Korpus zu deutscher und US-Klimaberichterstattung heraus. Abschließend diskutieren wir Potenziale und Begrenzungen des Verfahrens.
Betriebswirtschaftslehre (B.Sc.) an der Universität Duisburg Essen
Ivanova & Schaefer - Frames in grossen Medienkorpora
1. www.klimacampus.de/mccc.html
Zur Identifikation von Frames in großen Medienkorpora.
Ein methodischer Vorschlag und seine Exemplifikation
anhand der Klimaberichterstattung
Ana Ivanova & Mike S. Schäfer
Institut für Journalistik und Kommunikationswissenschaft, U Hamburg
2. Hintergrund
- Projekt „Global Media Map of Climate Change“ (DFG-Exzellenzcluster „CliSAP“)
- large-n Studie mit > 100.000 Artikeln aus nationalen Leit-Printmedien
- Beschreibung und Erklärung medialer Issue Attention Cycles für Klimawandel in
(bis zu) 27 Ländern von 1996-2010; Ana Ivanovas Dissertation zur Entstehung
einer transnationalen Öffentlichkeit
- Frage: Über unsere Analysen hinaus – welche Informationen kann man aus diesen
Daten noch extrahieren?
3. Gliederung des Vortrags
1. Das Framing-Konzept
2. Methoden der Frame-Analyse
3. Unser methodischer Vorschlag
4. (Exemplarische) Ergebnisse
5. Zusammenfassung und Diskussion
5. 1. Das Framing-Konzept
- Kernbestand der KW, mit vielfältigen Anwendungsbereichen
- einige geteilte Grundannahmen
konstruktivistische Grundprämisse
Frames als „’Sinnhorizonte’ von Akteuren*,+ die gewisse Informationen hervorheben und
andere ausblenden“ (Matthes 2007: 18)
- darüber hinaus unterschiedliche Verständnisse von (Medien)Frames
- interne Strukturierung? „problem definition, causal interpretation, moral evaluation
and/or treatment recommendation“ (Entman 1993: 52, vgl. Snow & Benford 1988) vs. „central
organizing idea for making sense of relevant events“ (Gamson/Modigliani 1989: 3)
- Einseitigkeit? „konsistent“ verbundene Frame-Elemente (Matthes 2007: 136) vs. „implies a
range of positions, rather than any single one“ (Gamson/Modigliani 1989: 3)
6. 2. Methoden der Frame-Analyse
- unterschiedliche methodische Zugriffe (Matthes 2007: 63ff.; vgl. Scheufele 2003: 55ff.)
- qualitativ: induktiv, dichte Beschreibung, „labor intensive, often based on small samples,
and can be difficult to replicate“ (Semetko/Valkenburg 2000: 94)
- manuell holistisch: Framedefinition ex ante, Codierung von ganzen Frames als Variable in
Inhaltsanalysen
- manuell dimensionsreduzierend: Codierung von Frame-Elementen, anschließend
Aggregation via statistischer Verfahren (Clusteranalyse, Faktorenanalyse)
- computer-unterstützt: (semi)automatische Textanalyse, die auf der Basis großer
(Medien-)Textkorpora Aussagen über darin empirisch auffindbare Muster ermöglicht
7. 2. Methoden der Frame-Analyse
- unterschiedliche methodische Zugriffe (Matthes 2007: 63ff.; vgl. Scheufele 2003: 55ff.)
- qualitativ: induktiv, dichte Beschreibung, „labor intensive, often based on small samples,
and can be difficult to replicate“ (Semetko/Valkenburg 2000: 94)
- manuell holistisch: Framedefinition ex ante, Codierung von ganzen Frames als Variable in
Inhaltsanalysen
- manuell dimensionsreduzierend: Codierung von Frame-Elementen, anschließend
Aggregation via statistischer Verfahren (Clusteranalyse, Faktorenanalyse)
- computer-unterstützt: (semi)automatische Textanalyse, die auf der Basis großer
(Medien-)Textkorpora Aussagen über darin empirisch auffindbare Muster ermöglicht
- „frame mapping“ (vgl. v.a. Miller 1997) bestimmt objektiv und reliabel Ko-Okkurenz von Wörtern
in Texten: „Frames are not ‘found’ by the researcher but ‘computed’ by the computer program”
(Matthes/Kohring 2008: 261)
8. 2. Methoden der Frame-Analyse
Probleme computerunterst. Frame-Analyse
(vgl. König 2004; Mathes 2007, Scharkow 2012)
Unser Vorschlag
Reduktion von Frames auf typische Gruppen
von Wörtern
„Schlüsselwörter“ als manifeste Indikatoren
latenter Frames (Entman 1993: 52)
bloße Häufigkeit von Wörtern keinen
Aufschluss über ihre Wichtigkeit
Gewichtung nach „keyness“ (bes. typisch für 1
Textmenge, bes. untypisch für den Rest)
Ignoriert selten vorkommende, aber
bedeutsame Wörter
gewichtet auch relativ seltene Wörter hoch,
sofern diese hohe „keyness“ haben
manuelle Eingriffe (z.B. Auswahl relevanter
Wörter) vor Analyse nötig
Relevanz der Wörter durch
Gewichtungsalgorithmus bestimmt
Statist. Ergebnisse stark von
Forscherinterpretationen abhängig
Interpretation basiert auf individuellen Text-
und Items-Scores
10. 3. Unser methodischer Vorschlag – Materialbeschaffung
Suche in Volltextdatenbanken – Suchstring auf Artikelebene:
(climat* W/5 (chang* OR catastroph* OR disaster* OR transform* OR adjust* OR trend* OR world*
OR earth* OR warm* OR heat* OR cool* OR variab*)) OR (greenhouse* W/3 effect*) OR ((global*
OR earth* OR world* OR international* OR hemisphere*) W/5 (warm* OR heat* OR cool* OR
chill*)) OR ((temperature* W/5 (global* OR earth* OR world* OR international* OR hemisphere*)
W/8 (increas* OR rising* OR rise* OR decreas*))
semi-automatische und manuelle Bereinigung der Treffer
relevante Artikel: 6871 in SZ, 7485 in WP
Reduktion der Texte auf relevante Absätze – gleicher Suchstring auf Absatzebene
11. 3. Unser methodischer Vorschlag – Materialaufbereitung
Lemmatisierung: Überführung der Wörter in ihre Grundform
Stemming: Reduktion der Wörter auf ihren Wortstamm (Suffixe werden entfernt)
Tools: WordStat für Englisch und NLTK (Bird, Klein & Loper 2009) für Deutsch
vorher nachher
12. 3. Unser methodischer Vorschlag – Materialaufbereitung
Lemmatisierung: Überführung der Wörter in ihre Grundform
Stemming: Reduktion der Wörter auf ihren Wortstamm (Suffixe werden entfernt)
Tools: WordStat für Englisch und NLTK (Bird, Klein & Loper 2009) für Deutsch
Entfernen von „stop-words“ wie Personalpronomen, Artikel, Konjunktionen etc.
Entfernen extrem selten vorkommender Wortelemente (< 1% der Artikel)
13. 3. Unser method. Vorschlag – Dokument-Begriff-Matrix
Gewichtung der Wortelemente – TF.IDF-Gewichtungsfaktor (Manning et al. 2009)
TF – „term frequency“ – Häufigkeit des Vorkommens in einem Textes
IDF – „inversed document frequency“ – Exklusivität des Vorkommens im Korpus
Je höher der Tf.IDF-Wert eines Wortelements in einem Text, desto charakteristischer das Wortelement
für den Text sowie für seine Abgrenzung vom Rest
Indikator für „keyness“
Erstellung einer Dokument-Begriff-Matrix mit TF.IDF-Gewichten der einzelnen Wortelemente
14.
15. 3. Unser methodischer Vorschlag – Analyse
Bildung von Kombinationen aus Schlüsselwörtern, die systematisch mit ähnlichem
„keyness“ in Texten zusammen vorkommen
Hauptkomponentenanalyse mit Varimax-Rotation: Reduktion vieler Einzelitems (Variablen) auf zugrun-
de liegende Hauptkomponenten , die die enthaltene Items-Varianz bestmöglich reproduzieren (Eid et al.2010)
graduelle Reduktion der Items & Zahl der Hauptkomponenten bis … (vgl. Kirilenko et al. 2012):
… nur Items bleiben, deren Ladungen ≥ .30 sind
… jede Hauptkomponente aus mind. 3 Items besteht
… Doppelladungen sinnvoll interpretierbar sind
… keine nennenswerten Veränderungen der Lösung bei minimalen Veränderungen der Komponentenzahl
16. 3. Unser methodischer Vorschlag – Interpretation
Hauptkomponenten – Kombinationen aus Schlüsselwörtern, die systematisch mit
ähnlichem „keyness“ in Texten zusammen vorkommen
Sinneinheiten
Faktorladungen: Maß für die Wichtigkeit der Wortelemente je Sinneinheit
Faktorscores pro Artikel gespeichert: zeigen wie stark ausgeprägt eine Sinneinheit
im Artikel vorkommt
eine Sinneinheit gilt bei Faktorscore >1 in einem Text als vorhanden (stärker
ausgeprägt als eine Standardabweichung vom Mittelwert).
Bezeichnungen der Schlüsselwortkombinationen nach Durchsicht der Artikel mit
den 3 höchsten Scores
17. 4. Ergebnisse – je 38 Sinneinheiten in der SZ und WP
Abdeckung – Anteil der Artikel, die mindestens eine dieser Sinneinheiten enthalten:
SZ – 79%, WP – 76%
Erklärte Varianzanteile – Anteil der durch die Faktorenlösung erklärten Varianz an
der Gesamtvarianz der Variablen:
SZ – 43%, WP – 43%
Anzahl der Items in der endgültigen Faktorenlösung
SZ – 180 Wortelemente (ursprüngl. 660), WP – 271 Wortelemente (ursprüngl. 1090)
18. 4. Ergebnisse – Beispiele für gefundene Sinneinheiten
GRAD ,764 ZWEIFEL ,475 WELTKLIMARAT ,798
CELSIUS ,733 GRUNDSATZ ,470 IPCC ,795
TEMPERATURANSTIEG ,520 WISSENSCHAFT ,406 BERICHT ,522
TEMPERATUR ,511 KLIMAFORSCH ,400 VEROFFENT ,502
ERWARM ,489 METHOD ,355 KRITIK ,427
JAHRHUNDERT ,443 WOLK ,347 WISSENSCHAFT ,351
GLOBAL ,412 ERWARM ,303 KLIMAFORSCH ,352
DURCHSCHNITT ,381 JAHRHUNDERT ,301
MITTL ,343
WARM ,301
PROTOKOLL ,681 AL ,885 FOSSIL ,784
KYOTO ,675 GOR ,858 BRENNSTOFF ,672
JAPAN ,528 WAHRHEIT ,590 KOHL ,581
WELTKLIMAKONFERENZ ,469 FILM ,425 VERBRENN ,528
VEREINBAR ,426 ERDOL ,461
VERPFLICHT ,408 ENERGIETRAG ,453
19. 4. Ergebnisse – Beispiele für gefundene Sinneinheiten
GRAD ,764 ZWEIFEL ,475 WELTKLIMARAT ,798
CELSIUS ,733 GRUNDSATZ ,470 IPCC ,795
TEMPERATURANSTIEG ,520 WISSENSCHAFT ,406 BERICHT ,522
TEMPERATUR ,511 KLIMAFORSCH ,400 VEROFFENT ,502
ERWARM ,489 METHOD ,355 KRITIK ,427
JAHRHUNDERT ,443 WOLK ,347 WISSENSCHAFT ,351
GLOBAL ,412 ERWARM ,303 KLIMAFORSCH ,352
DURCHSCHNITT ,381 JAHRHUNDERT ,301
MITTL ,343
WARM ,301
PROTOKOLL ,681 AL ,885 FOSSIL ,784
KYOTO ,675 GOR ,858 BRENNSTOFF ,672
JAPAN ,528 WAHRHEIT ,590 KOHL ,581
WELTKLIMAKONFERENZ ,469 FILM ,425 VERBRENN ,528
VEREINBAR ,426 ERDOL ,461
VERPFLICHT ,408 ENERGIETRAG ,453
in der WP
KYOTO (.654)
RATIFI (.634)
PROTOCOL (.585)
TREATI (.471)
RUSSIA (.416)
PACT (.347)
in der WP
INCONVENI (.848)
TRUTH (.809)
DOCUMENTARI (.713)
AL (.680)
GORE (.593)
FILM (.519)
VICE (.421)
20. 4. Ergebnisse – Beispiele für gefundene Sinneinheiten
GRAD ,764 ZWEIFEL ,475 WELTKLIMARAT ,798
CELSIUS ,733 GRUNDSATZ ,470 IPCC ,795
TEMPERATURANSTIEG ,520 WISSENSCHAFT ,406 BERICHT ,522
TEMPERATUR ,511 KLIMAFORSCH ,400 VEROFFENT ,502
ERWARM ,489 METHOD ,355 KRITIK ,427
JAHRHUNDERT ,443 WOLK ,347 WISSENSCHAFT ,351
GLOBAL ,412 ERWARM ,303 KLIMAFORSCH ,352
DURCHSCHNITT ,381 JAHRHUNDERT ,301
MITTL ,343
WARM ,301
PROTOKOLL ,681 AL ,885 FOSSIL ,784
KYOTO ,675 GOR ,858 BRENNSTOFF ,672
JAPAN ,528 WAHRHEIT ,590 KOHL ,581
WELTKLIMAKONFERENZ ,469 FILM ,425 VERBRENN ,528
VEREINBAR ,426 ERDOL ,461
VERPFLICHT ,408 ENERGIETRAG ,453
IPCC
Kyoto
Protokoll
21. 4. Ergebnisse – Beispiele für gefundene Sinneinheiten
GRAD ,764 ZWEIFEL ,475 WELTKLIMARAT ,798
CELSIUS ,733 GRUNDSATZ ,470 IPCC ,795
TEMPERATURANSTIEG ,520 WISSENSCHAFT ,406 BERICHT ,522
TEMPERATUR ,511 KLIMAFORSCH ,400 VEROFFENT ,502
ERWARM ,489 METHOD ,355 KRITIK ,427
JAHRHUNDERT ,443 WOLK ,347 WISSENSCHAFT ,351
GLOBAL ,412 ERWARM ,303 KLIMAFORSCH ,352
DURCHSCHNITT ,381 JAHRHUNDERT ,301
MITTL ,343
WARM ,301
PROTOKOLL ,681 AL ,885 FOSSIL ,784
KYOTO ,675 GOR ,858 BRENNSTOFF ,672
JAPAN ,528 WAHRHEIT ,590 KOHL ,581
WELTKLIMAKONFERENZ ,469 FILM ,425 VERBRENN ,528
VEREINBAR ,426 ERDOL ,461
VERPFLICHT ,408 ENERGIETRAG ,453
Anstieg
globaler
Temperatur
Zweifel an
Klimaforschung
IPCC
Verbrennung
fossiler
Energieträger
Al Gores Film
„Eine
unbequeme
Wahrheit“
Kyoto
Protokoll
22. Innenpolitik
Umweltpolitik in Bayern
Handeln Kanzlerin Merkel
Handeln Sigmar Gabriel
BUND Naturschutz
Mittlerer globaler Temperaturanstieg
Gletscherschmelze Polarregionen
Hurrikans, Stürme
Lebensraum von Tieren und Pflanzen
Saisonale Verschiebungen
Anstieg des Meeresspiegels
Freisetzung Treibhausgase in die Luft
Umwelt
Außenpolitik
EU-Klimapolitik
Handeln Großbritanniens
Handeln US-Präsident Bush
Handeln US-Präsident Obama
Kyoto Protokoll
COP15
UN-Klimapolitik
Chinas Handeln
Handeln Staats- und Regierungsschefs
Handeln Schwellenländer
Verbrennung fossiler Energieträger
Schäden Versicherungsbranche
Ausbau /Nutzung ernerbarer Energie
Ökonomische Kosten
Folgen für Tourismus/ Skigebiete
Handeln von Wirtschaftakteure
Folgen für Induistrie/ versch. Branchen
Automobilbranche
Wirtschaft
4. Ergebnisse – Spektrum der gefundenen Sinneinheiten
23. 4. Ergebnisse – Zeitverlauf in SZ und WP
Relative Bedeutung einer Sinneinheit pro Zeitraum
– weighed factor index (WFI) (Kirilenko/Stepchenkova 2012)
F einzelne Sinneinheit aus der Menge aller Sinneinheiten {f}; F Є {f};
t Zeitraum für den der Index berechnet wird
Faktorscore eines Artikels aus dem Zeitraum t auf Faktor f
m Schwellenwert für die zu berücksichtigenden Faktorladungen (bei uns m=1)
26. 5. Zusammenfassung und Diskussion
Was leistet die vorgeschlagene Methode?
Analyse großer Korpora, in mehreren Sprachen
bestimmt Wort-Gruppen, deren interne Gewichtung, deren Spezifik für best. Textmengen
die sich (u.a. anhand der betreffenden Artikel) sinnvoll interpretieren lassen
reduziert deutlich den Forschereinfluss
Aber sind das nun Frames?
keine einseitig argumentierenden Frames mit bestimmter Binnenstruktur
eher „central organizing ideas“ – Perspektiven auf ein Thema – die intern unterschiedliche
Positionen zulassen
oder Frame-Elemente, die noch interpretativ oder statistisch verdichtet werden müssten