Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten
Den Einfluss der Suchmaschinenoptimierung messbar machen:
Ein halb-automatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten
Sebastian Sünkler
16. Internationalen Symposiums für Informationswissenschaft (ISI 2021) March 8-11, 2021, Online
https://www.youtube.com/watch?v=3IbqxM52Ifo
Sünkler, S.; Lewandowski, D.(2021). Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten. In: T. Schmidt, C. Wolff (Hrsg.): Information between Data and Knowledge. Information Science and its Neighbors from Data Science to Digital Humanities. Proceedings of the 16th International Symposium of Information Science (ISI 2021), Regensburg, Germany, 8th—10th March 2021. Glückstadt: Verlag Werner Hülsbusch, pp. 273—298. https://www.doi.org/10.5283/epub.44948
Semelhante a Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten
Semelhante a Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten (20)
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten
1. Sebastian Sünkler und Dirk Lewandowski
Hochschule für Angewandte Wissenschaften (HAW) Hamburg
9. März 2021
Präsentation im Rahmen des 16. Internationalen Symposiums für
Informationswissenschaft (ISI 2021)
DEN EINFLUSS DER
SUCHMASCHINENOPTIMIERUNG MESSBAR
MACHEN
EIN HALB-AUTOMATISIERTER ANSATZ ZUR BESTIMMUNG VON
OPTIMIERTEN ERGEBNISSEN AUF GOOGLES
SUCHERGEBNISSEITEN
2. Department Information
Sebastian Sünkler
Dirk Lewandowski
INHALT
Folie 1
1. Einleitung
2. Identifizierung von SEO-Indikatoren
- Halbautomatische Analysemethoden zur Bewertung der SEO-Wahrscheinlichkeit
- Identifizierung von Plugins und Tools
- Kategorisierung der Seite anhand bekannter Domains
- Analyse der Indikatoren
3. Regelbasierte Klassifikation der SEO-Wahrscheinlichkeit
4. Suchmaschinenoptimierung in kommerziellen Suchmaschinen
- Studiendesign
- Beschreibung der Datensätze
- Ergebnisse
5. Fazit und weiteres Vorgehen
6. Quellen
4. Department Information
Sebastian Sünkler
Dirk Lewandowski
1. EINLEITUNG
Folie 3
Relevanz von Suchmaschinen für Inhaltsanbieter
• Suchmaschinen sind der wichtigste Zugang zu Inhalten im Web
• Inhaltsanbieter brauchen Top-Positionen in Suchmaschinen, insbesondere von Google
• Google ist klarer Marktführer (87% in den USA und 93% in Europa) (Statcounter 2020a, Statcounter 2020b)
Suchmaschinenmarketing
• SEA (Search Engine Advertising)
• SEO (Search Engine Optimization)
SEO-Branche
• Hohe Relevanz der SEO-Branche durch die Abhängigkeit der Inhaltsanbieter
• Vorhersage des Umsatzes der SEO-Branche in den USA bei 80 Milliarden Dollar (McCue 2018)
Forschungsfrage
• Wie viel Einfluss haben SEO-Maßnahmen auf die „Manipulierung“
der Ergebnislisten in Suchmaschinen?
7. Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIZIERUNG VON SEO-INDIKATOREN
IDENTIFIZIERUNG VON PLUGINS UND TOOLS
Folie 6
Relevanz von SEO-Plugins und Analytics Tools
• SEO-Plugins sind ein eindeutiger Hinweis auf Suchmaschinenoptimierung
• Analytics Tools sind ein sehr guter Indikator für ein kommerzielles Interesse
Vorgehensweise zur Erfassung der Tools
• Auswertung von 30.000 Webseiten, um SEO-Plugins und Analytics Tools zu
identifizieren
• Speichern der identifizierten Tools in Listen mit Wildcard-Suchmustern
SEO-Plugin: Yoast SEO Plugin
HTML-Code: <!--This site is optimized with the Yoast SEO plugin v12.4 - https://yoast.com/wordpress /plugins/seo/-->
https://yoast.com/wordpress/plugins/seo/
Suchmuster: "*yoast seo*"
Anzahl der identifizierten Plugins und Tools
• SEO-Plugins: 58
• Analytics Tools: 54
8. Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIZIERUNG VON SEO-INDIKATOREN
KATEGORISIERUNG DER SEITE ANHAND BEKANNTER DOMAINS
Folie 7
Relevanz von kategorisierten Seiten für die Identifizierung von SEO
• Relativ kleine Anzahl an verschiedenen Webseiten in den Suchergebnissen (Petrescu, 2014)
• Manuelle Klassifikation dieser Seiten und Erfassung der Hauptdomains bietet eine einfache
Möglichkeit, um die SEO-Wahrscheinlichkeit von anderen Dokumenten zu bestimmen
Identifizierte Kategorien mit geschätzter Wahrscheinlichkeit für SEO
Kategorie Anzahl der Domains SEO-Wahrscheinlichkeit
Kunden von SEO-Agenturen 1.004 hoch
Nachrichtenangebote 1.203 hoch
Webseiten mit Werbung 325 hoch
Online-Shops 178 mittel
Unternehmensseiten 72 mittel
Nicht optimierte Seiten 1 keine
9. Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIZIERUNG VON SEO-INDIKATOREN
ANALYSE DER SEO-INDIKATOREN
Folie 8
Zusammenstellung von technischen Indikatoren für SEO
• Auswahl anhand von Experteninterviews und Fachliteratur (Schultheiß & Lewandowski, 2021; Enge, 2015 & Erlhofer, 2019)
• Fokus auf Merkmale, die sich aus dem Quelltext und Metadaten einer URL ermitteln lassen.
Viewport für responsives Design
Seitentitel
SEO-Plugin
Canonical Link
Open Graph Title
Open Graph Description
11. Department Information
Sebastian Sünkler
Dirk Lewandowski
3. REGELBASIERTE KLASSIFIKATION DER SEO-WAHRSCHEINLICHKEIT
Folie 10
Entwicklung der Klassifikation
• Analyse von Fachliteratur und Abstimmung mit Experten
• Bildung von vier Klassen anhand der Wahrscheinlichkeit von SEO
Klasse Regeln
Höchstwahrscheinlich
optimiert
SEO-Plugin ODER Agenturkunde ODER Nachrichtenangebot
ODER Werbeanzeigen ODER Microdata für SEO
Wahrscheinlich
optimiert
NICHT höchstwahrscheinlich optimiert UND
(Online Shop ODER Unternehmensseite ODER Analytics Tool ODER https ODER SEO
in robots.txt ODER Sitemap vorhanden ODER Viewport definiert ODER Nofollow-Links
ODER Canonical-Links ODER Ladegeschwindigkeit < 3s)
Wahrscheinlich
nicht optimiert
NICHT höchstwahrscheinlich optimiert UND NICHT wahrscheinlich optimiert UND
(NICHT Description ODER NICHT Title ODER NICHT Open Graph)
Höchstwahrscheinlich
nicht optimiert
Nicht optimierte Domain
13. Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 12
Studiendesign
• Test unserer Software und Anwendung der regelbasierten Klassifikation
• Erfassen von Suchergebnissen zu verschiedenen Themenschwerpunkten
Methodik
• Scraping von Suchergebnissen
• Identifikation von technischen SEO-Indikatoren
• Abgleich der Domains der Suchergebnisse mit unseren Listen
• Klassifikation der Suchergebnisse anhand der Regeln, um die SEO-Wahrscheinlichkeit zu
ermitteln
14. Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 13
Beschreibung der Datensätze
Datensatz Beschreibung Erhebungs-
zeitraum
Suchanfragen Suchergebnisse
Google Trends Top-Suchanfragen von Google
https://trends.google.de/trends/?geo=DE
03/20 – 06/20 1.478 244.985
Potenziell
rechtsradikale
Inhalte
Suchanfragen in Kooperation mit der
Landesmedienanstalt Hamburg
Schleswig Holstein
03/20 82 13.403
Corona Top-Anfragen aus Microsoft Bing zum
Thema Corona
https://github.com/microsoft/BingCoronavi
rusQuerySet
09/20 483 5.402
15. Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 14
Populärste Domains im Datensatz
Domain
Anzahl der Dokumente mit dieser Domain
in allen Datensätzen
Anteil der Dokumente mit dieser Domain
in allen Datensätzen in %
books.google.de 5.724 12,13
de.wikipedia.org 2.442 5,18
youtube.com 2.122 4,50
t-online.de 2.075 4,40
focus.de 1.915 4,06
welt.de 1.814 3,85
spiegel.de 1.713 3,63
sueddeutsche.de 1.699 3,60
stern.de 1.622 3,44
rtl.de 1.535 3,25
16. Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 15
Verteilung der SEO-Plugins und Analytics Tools
Datensatz Anzahl an Dokumenten
mit SEO-Plugins
Anzahl an Dokumenten
mit Analytics Tools
Google Trends
(244.985 Dokumente)
8%
(19.515 Dokumente)
36%
(87.175 Dokumente)
Potenziell rechtsradikale Inhalte
(13.403 Dokumente)
8%
(1.206 Dokumente)
36%
(4.765 Dokumente)
Corona
(5.402 Dokumente)
6%
(332 Dokumente)
33%
(1.793 Dokumente)
18. Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 17
Zusammenfassung und Diskussion (1 / 2)
• Bis zu 9% (wahrscheinlich) nicht optimiert.
• Bis zu 10% nutzen SEO-Plugins und ein Drittel aller Seiten nutzen Analytics Tools.
• Nachrichtenangebote machten den größten Teil aller Quellen in den Datensätzen aus
• Benachteiligung für Inhaltsanbieter durch Bevorzugung von Eigenangeboten von
Suchmaschinentreibern (z. B. books.google.de und YouTube)
19. Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 18
Zusammenfassung und Diskussion (2 / 2)
• Keine Aussage darüber, ob der Einfluss der Suchmaschinenoptimierung sich positiv oder
negativ auf die Ergebnisqualität auswirkt.
• Suchmaschinenoptimierung hat unabhängig von den Themenbereichen einen Einfluss auf
die Suchergebnisse.
• Neben dem Einfluss der Suchmaschinenoptimierung auf die Ergebnisse sind auch Aspekte
wie die Diversität der Domains und die Eigenangebote der Suchmaschinenbetreiber relevant
für die Zusammensetzung der Suchergebnisse.
21. Department Information
Sebastian Sünkler
Dirk Lewandowski
5. FAZIT UND WEITERES VORGEHEN
Folie 20
• Entwicklung einer ersten Methodik zur Ermittlung der SEO-Wahrscheinlichkeit in
Suchergebnissen
• Bewährte Ansätze, um Suchergebnisse automatisiert zu speichern, relevante Merkmale zu
extrahieren und eine Kategorisierung der URLs vorzunehmen.
• Modell für die Klassifikation ist noch nicht vollständig und wird durch weitere Merkmale,
Faktorenanalysen, Gewichtungen von Merkmalen und Merkmalsgruppen sowie Analysen mit
Machine-Learning-Methoden aus dem unüberwachten Lernen (z. B. durch Clustering)
erweitert.
• Erste Ergebnisse in Studien zeigen, wie stark Suchergebnisse unabhängig von Themen
optimiert sind.
• In Zukunft werden wir weitere Studien durchführen und dabei den Einfluss der Eigenangebote
und die Diversität von Quellen in Verbindung mit SEO näher untersuchen.
23. Department Information
Sebastian Sünkler
Dirk Lewandowski
6. QUELLEN
Literatur der Folien
Enge, E., Spencer, S., Stricchiola, J. (2015). The Art of SEO: Mastering Search Engine Optimization. O’Reilly, Sebastopol, CA
Erlhofer, S. (2019). Suchmaschinen-Optimierung: Das umfassende Handbuch. Rheinwerk Verlag, Bonn
McCue, T. (2018). SEO Industry Approaching $80 Billion But All You Want Is More Web Traffic. forbes.com.
https://www.forbes.com/sites/tjmccue/2018/07/30/seo-industry-approaching-80-billion-but-all-you-want-is-more-web-traffic/
Schultheiß, S., Lewandowski, D.: Expert interviews with stakeholder groups in the context of commercial search engines within the SEO Effect project.
(2021). https://osf.io/y3d6t/
StatCounter (2020a). StatCounter: Search Engine Market Share United States Of America | StatCounter Global Stats.
StatCounter (2020b). StatCounter: Search Engine Market Share Europe | StatCounter Global Stats.
Petrescu, P. (2014). Google Organic Click-Through Rates in 2014. https://moz.com/blog/google-organic-click-through-rates-in-2014
Forschungsdaten
https://osf.io/rvx54/
Folie 22