SlideShare uma empresa Scribd logo
1 de 24
Sebastian Sünkler und Dirk Lewandowski
Hochschule für Angewandte Wissenschaften (HAW) Hamburg
9. März 2021
Präsentation im Rahmen des 16. Internationalen Symposiums für
Informationswissenschaft (ISI 2021)
DEN EINFLUSS DER
SUCHMASCHINENOPTIMIERUNG MESSBAR
MACHEN
EIN HALB-AUTOMATISIERTER ANSATZ ZUR BESTIMMUNG VON
OPTIMIERTEN ERGEBNISSEN AUF GOOGLES
SUCHERGEBNISSEITEN
Department Information
Sebastian Sünkler
Dirk Lewandowski
INHALT
Folie 1
1. Einleitung
2. Identifizierung von SEO-Indikatoren
- Halbautomatische Analysemethoden zur Bewertung der SEO-Wahrscheinlichkeit
- Identifizierung von Plugins und Tools
- Kategorisierung der Seite anhand bekannter Domains
- Analyse der Indikatoren
3. Regelbasierte Klassifikation der SEO-Wahrscheinlichkeit
4. Suchmaschinenoptimierung in kommerziellen Suchmaschinen
- Studiendesign
- Beschreibung der Datensätze
- Ergebnisse
5. Fazit und weiteres Vorgehen
6. Quellen
1 EINLEITUNG
Department Information
Sebastian Sünkler
Dirk Lewandowski
1. EINLEITUNG
Folie 3
Relevanz von Suchmaschinen für Inhaltsanbieter
• Suchmaschinen sind der wichtigste Zugang zu Inhalten im Web
• Inhaltsanbieter brauchen Top-Positionen in Suchmaschinen, insbesondere von Google
• Google ist klarer Marktführer (87% in den USA und 93% in Europa) (Statcounter 2020a, Statcounter 2020b)
Suchmaschinenmarketing
• SEA (Search Engine Advertising)
• SEO (Search Engine Optimization)
SEO-Branche
• Hohe Relevanz der SEO-Branche durch die Abhängigkeit der Inhaltsanbieter
• Vorhersage des Umsatzes der SEO-Branche in den USA bei 80 Milliarden Dollar (McCue 2018)
Forschungsfrage
• Wie viel Einfluss haben SEO-Maßnahmen auf die „Manipulierung“
der Ergebnislisten in Suchmaschinen?
2 IDENTIFIZIERUNG VON SEO-INDIKATOREN
Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIZIERUNG VON SEO-INDIKATOREN
HALBAUTOMATISCHE ANALYSEMETHODEN ZUR BEWERTUNG DER SEO-WAHRSCHEINLICHKEIT
Folie 5
Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIZIERUNG VON SEO-INDIKATOREN
IDENTIFIZIERUNG VON PLUGINS UND TOOLS
Folie 6
Relevanz von SEO-Plugins und Analytics Tools
• SEO-Plugins sind ein eindeutiger Hinweis auf Suchmaschinenoptimierung
• Analytics Tools sind ein sehr guter Indikator für ein kommerzielles Interesse
Vorgehensweise zur Erfassung der Tools
• Auswertung von 30.000 Webseiten, um SEO-Plugins und Analytics Tools zu
identifizieren
• Speichern der identifizierten Tools in Listen mit Wildcard-Suchmustern
SEO-Plugin: Yoast SEO Plugin
HTML-Code: <!--This site is optimized with the Yoast SEO plugin v12.4 - https://yoast.com/wordpress /plugins/seo/-->
https://yoast.com/wordpress/plugins/seo/
Suchmuster: "*yoast seo*"
Anzahl der identifizierten Plugins und Tools
• SEO-Plugins: 58
• Analytics Tools: 54
Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIZIERUNG VON SEO-INDIKATOREN
KATEGORISIERUNG DER SEITE ANHAND BEKANNTER DOMAINS
Folie 7
Relevanz von kategorisierten Seiten für die Identifizierung von SEO
• Relativ kleine Anzahl an verschiedenen Webseiten in den Suchergebnissen (Petrescu, 2014)
• Manuelle Klassifikation dieser Seiten und Erfassung der Hauptdomains bietet eine einfache
Möglichkeit, um die SEO-Wahrscheinlichkeit von anderen Dokumenten zu bestimmen
Identifizierte Kategorien mit geschätzter Wahrscheinlichkeit für SEO
Kategorie Anzahl der Domains SEO-Wahrscheinlichkeit
Kunden von SEO-Agenturen 1.004 hoch
Nachrichtenangebote 1.203 hoch
Webseiten mit Werbung 325 hoch
Online-Shops 178 mittel
Unternehmensseiten 72 mittel
Nicht optimierte Seiten 1 keine
Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIZIERUNG VON SEO-INDIKATOREN
ANALYSE DER SEO-INDIKATOREN
Folie 8
Zusammenstellung von technischen Indikatoren für SEO
• Auswahl anhand von Experteninterviews und Fachliteratur (Schultheiß & Lewandowski, 2021; Enge, 2015 & Erlhofer, 2019)
• Fokus auf Merkmale, die sich aus dem Quelltext und Metadaten einer URL ermitteln lassen.
Viewport für responsives Design
Seitentitel
SEO-Plugin
Canonical Link
Open Graph Title
Open Graph Description
3 REGELBASIERTE KLASSIFIKATION
DER SEO-WAHRSCHEINLICHKEIT
Department Information
Sebastian Sünkler
Dirk Lewandowski
3. REGELBASIERTE KLASSIFIKATION DER SEO-WAHRSCHEINLICHKEIT
Folie 10
Entwicklung der Klassifikation
• Analyse von Fachliteratur und Abstimmung mit Experten
• Bildung von vier Klassen anhand der Wahrscheinlichkeit von SEO
Klasse Regeln
Höchstwahrscheinlich
optimiert
SEO-Plugin ODER Agenturkunde ODER Nachrichtenangebot
ODER Werbeanzeigen ODER Microdata für SEO
Wahrscheinlich
optimiert
NICHT höchstwahrscheinlich optimiert UND
(Online Shop ODER Unternehmensseite ODER Analytics Tool ODER https ODER SEO
in robots.txt ODER Sitemap vorhanden ODER Viewport definiert ODER Nofollow-Links
ODER Canonical-Links ODER Ladegeschwindigkeit < 3s)
Wahrscheinlich
nicht optimiert
NICHT höchstwahrscheinlich optimiert UND NICHT wahrscheinlich optimiert UND
(NICHT Description ODER NICHT Title ODER NICHT Open Graph)
Höchstwahrscheinlich
nicht optimiert
Nicht optimierte Domain
4 SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 12
Studiendesign
• Test unserer Software und Anwendung der regelbasierten Klassifikation
• Erfassen von Suchergebnissen zu verschiedenen Themenschwerpunkten
Methodik
• Scraping von Suchergebnissen
• Identifikation von technischen SEO-Indikatoren
• Abgleich der Domains der Suchergebnisse mit unseren Listen
• Klassifikation der Suchergebnisse anhand der Regeln, um die SEO-Wahrscheinlichkeit zu
ermitteln
Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 13
Beschreibung der Datensätze
Datensatz Beschreibung Erhebungs-
zeitraum
Suchanfragen Suchergebnisse
Google Trends Top-Suchanfragen von Google
https://trends.google.de/trends/?geo=DE
03/20 – 06/20 1.478 244.985
Potenziell
rechtsradikale
Inhalte
Suchanfragen in Kooperation mit der
Landesmedienanstalt Hamburg
Schleswig Holstein
03/20 82 13.403
Corona Top-Anfragen aus Microsoft Bing zum
Thema Corona
https://github.com/microsoft/BingCoronavi
rusQuerySet
09/20 483 5.402
Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 14
Populärste Domains im Datensatz
Domain
Anzahl der Dokumente mit dieser Domain
in allen Datensätzen
Anteil der Dokumente mit dieser Domain
in allen Datensätzen in %
books.google.de 5.724 12,13
de.wikipedia.org 2.442 5,18
youtube.com 2.122 4,50
t-online.de 2.075 4,40
focus.de 1.915 4,06
welt.de 1.814 3,85
spiegel.de 1.713 3,63
sueddeutsche.de 1.699 3,60
stern.de 1.622 3,44
rtl.de 1.535 3,25
Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 15
Verteilung der SEO-Plugins und Analytics Tools
Datensatz Anzahl an Dokumenten
mit SEO-Plugins
Anzahl an Dokumenten
mit Analytics Tools
Google Trends
(244.985 Dokumente)
8%
(19.515 Dokumente)
36%
(87.175 Dokumente)
Potenziell rechtsradikale Inhalte
(13.403 Dokumente)
8%
(1.206 Dokumente)
36%
(4.765 Dokumente)
Corona
(5.402 Dokumente)
6%
(332 Dokumente)
33%
(1.793 Dokumente)
Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 16
SEO-Wahrscheinlichkeit
Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 17
Zusammenfassung und Diskussion (1 / 2)
• Bis zu 9% (wahrscheinlich) nicht optimiert.
• Bis zu 10% nutzen SEO-Plugins und ein Drittel aller Seiten nutzen Analytics Tools.
• Nachrichtenangebote machten den größten Teil aller Quellen in den Datensätzen aus
• Benachteiligung für Inhaltsanbieter durch Bevorzugung von Eigenangeboten von
Suchmaschinentreibern (z. B. books.google.de und YouTube)
Department Information
Sebastian Sünkler
Dirk Lewandowski
4. SUCHMASCHINENOPTIMIERUNG IN
KOMMERZIELLEN SUCHMASCHINEN
Folie 18
Zusammenfassung und Diskussion (2 / 2)
• Keine Aussage darüber, ob der Einfluss der Suchmaschinenoptimierung sich positiv oder
negativ auf die Ergebnisqualität auswirkt.
• Suchmaschinenoptimierung hat unabhängig von den Themenbereichen einen Einfluss auf
die Suchergebnisse.
• Neben dem Einfluss der Suchmaschinenoptimierung auf die Ergebnisse sind auch Aspekte
wie die Diversität der Domains und die Eigenangebote der Suchmaschinenbetreiber relevant
für die Zusammensetzung der Suchergebnisse.
5 FAZIT UND WEITERES VORGEHEN
Department Information
Sebastian Sünkler
Dirk Lewandowski
5. FAZIT UND WEITERES VORGEHEN
Folie 20
• Entwicklung einer ersten Methodik zur Ermittlung der SEO-Wahrscheinlichkeit in
Suchergebnissen
• Bewährte Ansätze, um Suchergebnisse automatisiert zu speichern, relevante Merkmale zu
extrahieren und eine Kategorisierung der URLs vorzunehmen.
• Modell für die Klassifikation ist noch nicht vollständig und wird durch weitere Merkmale,
Faktorenanalysen, Gewichtungen von Merkmalen und Merkmalsgruppen sowie Analysen mit
Machine-Learning-Methoden aus dem unüberwachten Lernen (z. B. durch Clustering)
erweitert.
• Erste Ergebnisse in Studien zeigen, wie stark Suchergebnisse unabhängig von Themen
optimiert sind.
• In Zukunft werden wir weitere Studien durchführen und dabei den Einfluss der Eigenangebote
und die Diversität von Quellen in Verbindung mit SEO näher untersuchen.
6 QUELLEN
Department Information
Sebastian Sünkler
Dirk Lewandowski
6. QUELLEN
Literatur der Folien
Enge, E., Spencer, S., Stricchiola, J. (2015). The Art of SEO: Mastering Search Engine Optimization. O’Reilly, Sebastopol, CA
Erlhofer, S. (2019). Suchmaschinen-Optimierung: Das umfassende Handbuch. Rheinwerk Verlag, Bonn
McCue, T. (2018). SEO Industry Approaching $80 Billion But All You Want Is More Web Traffic. forbes.com.
https://www.forbes.com/sites/tjmccue/2018/07/30/seo-industry-approaching-80-billion-but-all-you-want-is-more-web-traffic/
Schultheiß, S., Lewandowski, D.: Expert interviews with stakeholder groups in the context of commercial search engines within the SEO Effect project.
(2021). https://osf.io/y3d6t/
StatCounter (2020a). StatCounter: Search Engine Market Share United States Of America | StatCounter Global Stats.
StatCounter (2020b). StatCounter: Search Engine Market Share Europe | StatCounter Global Stats.
Petrescu, P. (2014). Google Organic Click-Through Rates in 2014. https://moz.com/blog/google-organic-click-through-rates-in-2014
Forschungsdaten
https://osf.io/rvx54/
Folie 22
VIELEN DANK FÜR IHRE
AUFMERKSAMKEIT!

Mais conteúdo relacionado

Semelhante a Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten

Erste Schritte mit der Searchmetrcis Suite
Erste Schritte mit der Searchmetrcis SuiteErste Schritte mit der Searchmetrcis Suite
Erste Schritte mit der Searchmetrcis SuiteYourposition AG
 
SEO-Controlling mit Google Analytics koks.digital 2016
SEO-Controlling mit Google Analytics koks.digital 2016SEO-Controlling mit Google Analytics koks.digital 2016
SEO-Controlling mit Google Analytics koks.digital 2016AGOM_Online_Marketing
 
SiteBoosters Webinar „SEO – Suchmaschinenoptimierung“
SiteBoosters Webinar „SEO – Suchmaschinenoptimierung“SiteBoosters Webinar „SEO – Suchmaschinenoptimierung“
SiteBoosters Webinar „SEO – Suchmaschinenoptimierung“SiteBoosters
 
Pixel Rank - die bessere Metrik für dein Ranking?
Pixel Rank - die bessere Metrik für dein Ranking?Pixel Rank - die bessere Metrik für dein Ranking?
Pixel Rank - die bessere Metrik für dein Ranking?Johanna Maier
 
SEO Audit Workshop SMWHH
SEO Audit Workshop SMWHHSEO Audit Workshop SMWHH
SEO Audit Workshop SMWHHcrowdmedia GmbH
 
SEO A/B Testing by John Munoz (Digital Loop)
SEO A/B Testing by John Munoz (Digital Loop)SEO A/B Testing by John Munoz (Digital Loop)
SEO A/B Testing by John Munoz (Digital Loop)John Muñoz
 
Seo Basics: Google Rankingfaktoren 2016
Seo Basics: Google Rankingfaktoren 2016Seo Basics: Google Rankingfaktoren 2016
Seo Basics: Google Rankingfaktoren 2016Hanns Kronenberg
 
SEO-Controlling und SEO-Kennzahlen
SEO-Controlling und SEO-KennzahlenSEO-Controlling und SEO-Kennzahlen
SEO-Controlling und SEO-KennzahlenHanns Kronenberg
 
(Un)bekannte Akteure auf der Suchergebnisseite? Ein Vergleich zwischen selbst...
(Un)bekannte Akteure auf der Suchergebnisseite? Ein Vergleich zwischen selbst...(Un)bekannte Akteure auf der Suchergebnisseite? Ein Vergleich zwischen selbst...
(Un)bekannte Akteure auf der Suchergebnisseite? Ein Vergleich zwischen selbst...Sebastian Schultheiß
 
SEO-Workshop Sissach mit Markus Pfeisinger
SEO-Workshop Sissach mit Markus PfeisingerSEO-Workshop Sissach mit Markus Pfeisinger
SEO-Workshop Sissach mit Markus PfeisingerMarkus Pfeisinger
 
Searchmetrics Ranking Faktoren DE 2014
Searchmetrics Ranking Faktoren DE 2014Searchmetrics Ranking Faktoren DE 2014
Searchmetrics Ranking Faktoren DE 2014Holger Etzel
 
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Dirk Lewandowski
 
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...Stefan Seifarth
 
Google Search Trends 2014 - Session auf der Internet World München 2014
Google Search Trends 2014 - Session auf der Internet World München 2014Google Search Trends 2014 - Session auf der Internet World München 2014
Google Search Trends 2014 - Session auf der Internet World München 2014seonative
 
Misconceptions in SEO - Darum funktioniert Dein SEO nicht!
Misconceptions in SEO - Darum funktioniert Dein SEO nicht!Misconceptions in SEO - Darum funktioniert Dein SEO nicht!
Misconceptions in SEO - Darum funktioniert Dein SEO nicht!get traction GmbH
 
SeoDay 2017: Mikroprozesse im SEO
SeoDay 2017: Mikroprozesse im SEOSeoDay 2017: Mikroprozesse im SEO
SeoDay 2017: Mikroprozesse im SEOget traction GmbH
 

Semelhante a Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten (20)

SEO Prozess
SEO ProzessSEO Prozess
SEO Prozess
 
Erste Schritte mit der Searchmetrcis Suite
Erste Schritte mit der Searchmetrcis SuiteErste Schritte mit der Searchmetrcis Suite
Erste Schritte mit der Searchmetrcis Suite
 
SEO-Controlling mit Google Analytics koks.digital 2016
SEO-Controlling mit Google Analytics koks.digital 2016SEO-Controlling mit Google Analytics koks.digital 2016
SEO-Controlling mit Google Analytics koks.digital 2016
 
SiteBoosters Webinar „SEO – Suchmaschinenoptimierung“
SiteBoosters Webinar „SEO – Suchmaschinenoptimierung“SiteBoosters Webinar „SEO – Suchmaschinenoptimierung“
SiteBoosters Webinar „SEO – Suchmaschinenoptimierung“
 
Pixel Rank - die bessere Metrik für dein Ranking?
Pixel Rank - die bessere Metrik für dein Ranking?Pixel Rank - die bessere Metrik für dein Ranking?
Pixel Rank - die bessere Metrik für dein Ranking?
 
SEO Audit Workshop SMWHH
SEO Audit Workshop SMWHHSEO Audit Workshop SMWHH
SEO Audit Workshop SMWHH
 
SEO A/B Testing by John Munoz (Digital Loop)
SEO A/B Testing by John Munoz (Digital Loop)SEO A/B Testing by John Munoz (Digital Loop)
SEO A/B Testing by John Munoz (Digital Loop)
 
dda-12-2009
dda-12-2009dda-12-2009
dda-12-2009
 
Seo Basics: Google Rankingfaktoren 2016
Seo Basics: Google Rankingfaktoren 2016Seo Basics: Google Rankingfaktoren 2016
Seo Basics: Google Rankingfaktoren 2016
 
SEO-Controlling und SEO-Kennzahlen
SEO-Controlling und SEO-KennzahlenSEO-Controlling und SEO-Kennzahlen
SEO-Controlling und SEO-Kennzahlen
 
(Un)bekannte Akteure auf der Suchergebnisseite? Ein Vergleich zwischen selbst...
(Un)bekannte Akteure auf der Suchergebnisseite? Ein Vergleich zwischen selbst...(Un)bekannte Akteure auf der Suchergebnisseite? Ein Vergleich zwischen selbst...
(Un)bekannte Akteure auf der Suchergebnisseite? Ein Vergleich zwischen selbst...
 
Vortrag kuk-0210
Vortrag kuk-0210Vortrag kuk-0210
Vortrag kuk-0210
 
SEO-Workshop Sissach mit Markus Pfeisinger
SEO-Workshop Sissach mit Markus PfeisingerSEO-Workshop Sissach mit Markus Pfeisinger
SEO-Workshop Sissach mit Markus Pfeisinger
 
Searchmetrics Ranking Faktoren DE 2014
Searchmetrics Ranking Faktoren DE 2014Searchmetrics Ranking Faktoren DE 2014
Searchmetrics Ranking Faktoren DE 2014
 
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
 
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
 
Google Search Trends 2014 - Session auf der Internet World München 2014
Google Search Trends 2014 - Session auf der Internet World München 2014Google Search Trends 2014 - Session auf der Internet World München 2014
Google Search Trends 2014 - Session auf der Internet World München 2014
 
Misconceptions in SEO - Darum funktioniert Dein SEO nicht!
Misconceptions in SEO - Darum funktioniert Dein SEO nicht!Misconceptions in SEO - Darum funktioniert Dein SEO nicht!
Misconceptions in SEO - Darum funktioniert Dein SEO nicht!
 
SEOlytics & OPENsiteexplorer
SEOlytics & OPENsiteexplorerSEOlytics & OPENsiteexplorer
SEOlytics & OPENsiteexplorer
 
SeoDay 2017: Mikroprozesse im SEO
SeoDay 2017: Mikroprozesse im SEOSeoDay 2017: Mikroprozesse im SEO
SeoDay 2017: Mikroprozesse im SEO
 

Mais de Hamburg University of Applied Sciences (HAW)

Mais de Hamburg University of Applied Sciences (HAW) (11)

Entwicklungen und Anwendungsbereiche von digitalen Assistenten mit Sprachsuche
Entwicklungen und Anwendungsbereiche von digitalen Assistenten mit SprachsucheEntwicklungen und Anwendungsbereiche von digitalen Assistenten mit Sprachsuche
Entwicklungen und Anwendungsbereiche von digitalen Assistenten mit Sprachsuche
 
Die Relevanz von sprachgesteuerter Suche für den Onlinehandel
Die Relevanz von sprachgesteuerter Suche für den OnlinehandelDie Relevanz von sprachgesteuerter Suche für den Onlinehandel
Die Relevanz von sprachgesteuerter Suche für den Onlinehandel
 
The influence of search engine optimization on Google's results: A multi-dime...
The influence of search engine optimization on Google's results: A multi-dime...The influence of search engine optimization on Google's results: A multi-dime...
The influence of search engine optimization on Google's results: A multi-dime...
 
Ok Google... The end of search as we know it
Ok Google... The end of search as we know itOk Google... The end of search as we know it
Ok Google... The end of search as we know it
 
THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...
THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...
THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...
 
WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...
WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...
WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...
 
World Usability Day Hamburg 2015: Workshop Voice Search
World Usability Day Hamburg 2015: Workshop Voice SearchWorld Usability Day Hamburg 2015: Workshop Voice Search
World Usability Day Hamburg 2015: Workshop Voice Search
 
Lebensmittelkontrolle 2.0: Das AAPVL Projekt
Lebensmittelkontrolle 2.0: Das AAPVL ProjektLebensmittelkontrolle 2.0: Das AAPVL Projekt
Lebensmittelkontrolle 2.0: Das AAPVL Projekt
 
Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...
Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...
Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...
 
Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...
Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...
Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...
 
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
 

Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten

  • 1. Sebastian Sünkler und Dirk Lewandowski Hochschule für Angewandte Wissenschaften (HAW) Hamburg 9. März 2021 Präsentation im Rahmen des 16. Internationalen Symposiums für Informationswissenschaft (ISI 2021) DEN EINFLUSS DER SUCHMASCHINENOPTIMIERUNG MESSBAR MACHEN EIN HALB-AUTOMATISIERTER ANSATZ ZUR BESTIMMUNG VON OPTIMIERTEN ERGEBNISSEN AUF GOOGLES SUCHERGEBNISSEITEN
  • 2. Department Information Sebastian Sünkler Dirk Lewandowski INHALT Folie 1 1. Einleitung 2. Identifizierung von SEO-Indikatoren - Halbautomatische Analysemethoden zur Bewertung der SEO-Wahrscheinlichkeit - Identifizierung von Plugins und Tools - Kategorisierung der Seite anhand bekannter Domains - Analyse der Indikatoren 3. Regelbasierte Klassifikation der SEO-Wahrscheinlichkeit 4. Suchmaschinenoptimierung in kommerziellen Suchmaschinen - Studiendesign - Beschreibung der Datensätze - Ergebnisse 5. Fazit und weiteres Vorgehen 6. Quellen
  • 4. Department Information Sebastian Sünkler Dirk Lewandowski 1. EINLEITUNG Folie 3 Relevanz von Suchmaschinen für Inhaltsanbieter • Suchmaschinen sind der wichtigste Zugang zu Inhalten im Web • Inhaltsanbieter brauchen Top-Positionen in Suchmaschinen, insbesondere von Google • Google ist klarer Marktführer (87% in den USA und 93% in Europa) (Statcounter 2020a, Statcounter 2020b) Suchmaschinenmarketing • SEA (Search Engine Advertising) • SEO (Search Engine Optimization) SEO-Branche • Hohe Relevanz der SEO-Branche durch die Abhängigkeit der Inhaltsanbieter • Vorhersage des Umsatzes der SEO-Branche in den USA bei 80 Milliarden Dollar (McCue 2018) Forschungsfrage • Wie viel Einfluss haben SEO-Maßnahmen auf die „Manipulierung“ der Ergebnislisten in Suchmaschinen?
  • 5. 2 IDENTIFIZIERUNG VON SEO-INDIKATOREN
  • 6. Department Information Sebastian Sünkler Dirk Lewandowski 2. IDENTIFIZIERUNG VON SEO-INDIKATOREN HALBAUTOMATISCHE ANALYSEMETHODEN ZUR BEWERTUNG DER SEO-WAHRSCHEINLICHKEIT Folie 5
  • 7. Department Information Sebastian Sünkler Dirk Lewandowski 2. IDENTIFIZIERUNG VON SEO-INDIKATOREN IDENTIFIZIERUNG VON PLUGINS UND TOOLS Folie 6 Relevanz von SEO-Plugins und Analytics Tools • SEO-Plugins sind ein eindeutiger Hinweis auf Suchmaschinenoptimierung • Analytics Tools sind ein sehr guter Indikator für ein kommerzielles Interesse Vorgehensweise zur Erfassung der Tools • Auswertung von 30.000 Webseiten, um SEO-Plugins und Analytics Tools zu identifizieren • Speichern der identifizierten Tools in Listen mit Wildcard-Suchmustern SEO-Plugin: Yoast SEO Plugin HTML-Code: <!--This site is optimized with the Yoast SEO plugin v12.4 - https://yoast.com/wordpress /plugins/seo/--> https://yoast.com/wordpress/plugins/seo/ Suchmuster: "*yoast seo*" Anzahl der identifizierten Plugins und Tools • SEO-Plugins: 58 • Analytics Tools: 54
  • 8. Department Information Sebastian Sünkler Dirk Lewandowski 2. IDENTIFIZIERUNG VON SEO-INDIKATOREN KATEGORISIERUNG DER SEITE ANHAND BEKANNTER DOMAINS Folie 7 Relevanz von kategorisierten Seiten für die Identifizierung von SEO • Relativ kleine Anzahl an verschiedenen Webseiten in den Suchergebnissen (Petrescu, 2014) • Manuelle Klassifikation dieser Seiten und Erfassung der Hauptdomains bietet eine einfache Möglichkeit, um die SEO-Wahrscheinlichkeit von anderen Dokumenten zu bestimmen Identifizierte Kategorien mit geschätzter Wahrscheinlichkeit für SEO Kategorie Anzahl der Domains SEO-Wahrscheinlichkeit Kunden von SEO-Agenturen 1.004 hoch Nachrichtenangebote 1.203 hoch Webseiten mit Werbung 325 hoch Online-Shops 178 mittel Unternehmensseiten 72 mittel Nicht optimierte Seiten 1 keine
  • 9. Department Information Sebastian Sünkler Dirk Lewandowski 2. IDENTIFIZIERUNG VON SEO-INDIKATOREN ANALYSE DER SEO-INDIKATOREN Folie 8 Zusammenstellung von technischen Indikatoren für SEO • Auswahl anhand von Experteninterviews und Fachliteratur (Schultheiß & Lewandowski, 2021; Enge, 2015 & Erlhofer, 2019) • Fokus auf Merkmale, die sich aus dem Quelltext und Metadaten einer URL ermitteln lassen. Viewport für responsives Design Seitentitel SEO-Plugin Canonical Link Open Graph Title Open Graph Description
  • 10. 3 REGELBASIERTE KLASSIFIKATION DER SEO-WAHRSCHEINLICHKEIT
  • 11. Department Information Sebastian Sünkler Dirk Lewandowski 3. REGELBASIERTE KLASSIFIKATION DER SEO-WAHRSCHEINLICHKEIT Folie 10 Entwicklung der Klassifikation • Analyse von Fachliteratur und Abstimmung mit Experten • Bildung von vier Klassen anhand der Wahrscheinlichkeit von SEO Klasse Regeln Höchstwahrscheinlich optimiert SEO-Plugin ODER Agenturkunde ODER Nachrichtenangebot ODER Werbeanzeigen ODER Microdata für SEO Wahrscheinlich optimiert NICHT höchstwahrscheinlich optimiert UND (Online Shop ODER Unternehmensseite ODER Analytics Tool ODER https ODER SEO in robots.txt ODER Sitemap vorhanden ODER Viewport definiert ODER Nofollow-Links ODER Canonical-Links ODER Ladegeschwindigkeit < 3s) Wahrscheinlich nicht optimiert NICHT höchstwahrscheinlich optimiert UND NICHT wahrscheinlich optimiert UND (NICHT Description ODER NICHT Title ODER NICHT Open Graph) Höchstwahrscheinlich nicht optimiert Nicht optimierte Domain
  • 13. Department Information Sebastian Sünkler Dirk Lewandowski 4. SUCHMASCHINENOPTIMIERUNG IN KOMMERZIELLEN SUCHMASCHINEN Folie 12 Studiendesign • Test unserer Software und Anwendung der regelbasierten Klassifikation • Erfassen von Suchergebnissen zu verschiedenen Themenschwerpunkten Methodik • Scraping von Suchergebnissen • Identifikation von technischen SEO-Indikatoren • Abgleich der Domains der Suchergebnisse mit unseren Listen • Klassifikation der Suchergebnisse anhand der Regeln, um die SEO-Wahrscheinlichkeit zu ermitteln
  • 14. Department Information Sebastian Sünkler Dirk Lewandowski 4. SUCHMASCHINENOPTIMIERUNG IN KOMMERZIELLEN SUCHMASCHINEN Folie 13 Beschreibung der Datensätze Datensatz Beschreibung Erhebungs- zeitraum Suchanfragen Suchergebnisse Google Trends Top-Suchanfragen von Google https://trends.google.de/trends/?geo=DE 03/20 – 06/20 1.478 244.985 Potenziell rechtsradikale Inhalte Suchanfragen in Kooperation mit der Landesmedienanstalt Hamburg Schleswig Holstein 03/20 82 13.403 Corona Top-Anfragen aus Microsoft Bing zum Thema Corona https://github.com/microsoft/BingCoronavi rusQuerySet 09/20 483 5.402
  • 15. Department Information Sebastian Sünkler Dirk Lewandowski 4. SUCHMASCHINENOPTIMIERUNG IN KOMMERZIELLEN SUCHMASCHINEN Folie 14 Populärste Domains im Datensatz Domain Anzahl der Dokumente mit dieser Domain in allen Datensätzen Anteil der Dokumente mit dieser Domain in allen Datensätzen in % books.google.de 5.724 12,13 de.wikipedia.org 2.442 5,18 youtube.com 2.122 4,50 t-online.de 2.075 4,40 focus.de 1.915 4,06 welt.de 1.814 3,85 spiegel.de 1.713 3,63 sueddeutsche.de 1.699 3,60 stern.de 1.622 3,44 rtl.de 1.535 3,25
  • 16. Department Information Sebastian Sünkler Dirk Lewandowski 4. SUCHMASCHINENOPTIMIERUNG IN KOMMERZIELLEN SUCHMASCHINEN Folie 15 Verteilung der SEO-Plugins und Analytics Tools Datensatz Anzahl an Dokumenten mit SEO-Plugins Anzahl an Dokumenten mit Analytics Tools Google Trends (244.985 Dokumente) 8% (19.515 Dokumente) 36% (87.175 Dokumente) Potenziell rechtsradikale Inhalte (13.403 Dokumente) 8% (1.206 Dokumente) 36% (4.765 Dokumente) Corona (5.402 Dokumente) 6% (332 Dokumente) 33% (1.793 Dokumente)
  • 17. Department Information Sebastian Sünkler Dirk Lewandowski 4. SUCHMASCHINENOPTIMIERUNG IN KOMMERZIELLEN SUCHMASCHINEN Folie 16 SEO-Wahrscheinlichkeit
  • 18. Department Information Sebastian Sünkler Dirk Lewandowski 4. SUCHMASCHINENOPTIMIERUNG IN KOMMERZIELLEN SUCHMASCHINEN Folie 17 Zusammenfassung und Diskussion (1 / 2) • Bis zu 9% (wahrscheinlich) nicht optimiert. • Bis zu 10% nutzen SEO-Plugins und ein Drittel aller Seiten nutzen Analytics Tools. • Nachrichtenangebote machten den größten Teil aller Quellen in den Datensätzen aus • Benachteiligung für Inhaltsanbieter durch Bevorzugung von Eigenangeboten von Suchmaschinentreibern (z. B. books.google.de und YouTube)
  • 19. Department Information Sebastian Sünkler Dirk Lewandowski 4. SUCHMASCHINENOPTIMIERUNG IN KOMMERZIELLEN SUCHMASCHINEN Folie 18 Zusammenfassung und Diskussion (2 / 2) • Keine Aussage darüber, ob der Einfluss der Suchmaschinenoptimierung sich positiv oder negativ auf die Ergebnisqualität auswirkt. • Suchmaschinenoptimierung hat unabhängig von den Themenbereichen einen Einfluss auf die Suchergebnisse. • Neben dem Einfluss der Suchmaschinenoptimierung auf die Ergebnisse sind auch Aspekte wie die Diversität der Domains und die Eigenangebote der Suchmaschinenbetreiber relevant für die Zusammensetzung der Suchergebnisse.
  • 20. 5 FAZIT UND WEITERES VORGEHEN
  • 21. Department Information Sebastian Sünkler Dirk Lewandowski 5. FAZIT UND WEITERES VORGEHEN Folie 20 • Entwicklung einer ersten Methodik zur Ermittlung der SEO-Wahrscheinlichkeit in Suchergebnissen • Bewährte Ansätze, um Suchergebnisse automatisiert zu speichern, relevante Merkmale zu extrahieren und eine Kategorisierung der URLs vorzunehmen. • Modell für die Klassifikation ist noch nicht vollständig und wird durch weitere Merkmale, Faktorenanalysen, Gewichtungen von Merkmalen und Merkmalsgruppen sowie Analysen mit Machine-Learning-Methoden aus dem unüberwachten Lernen (z. B. durch Clustering) erweitert. • Erste Ergebnisse in Studien zeigen, wie stark Suchergebnisse unabhängig von Themen optimiert sind. • In Zukunft werden wir weitere Studien durchführen und dabei den Einfluss der Eigenangebote und die Diversität von Quellen in Verbindung mit SEO näher untersuchen.
  • 23. Department Information Sebastian Sünkler Dirk Lewandowski 6. QUELLEN Literatur der Folien Enge, E., Spencer, S., Stricchiola, J. (2015). The Art of SEO: Mastering Search Engine Optimization. O’Reilly, Sebastopol, CA Erlhofer, S. (2019). Suchmaschinen-Optimierung: Das umfassende Handbuch. Rheinwerk Verlag, Bonn McCue, T. (2018). SEO Industry Approaching $80 Billion But All You Want Is More Web Traffic. forbes.com. https://www.forbes.com/sites/tjmccue/2018/07/30/seo-industry-approaching-80-billion-but-all-you-want-is-more-web-traffic/ Schultheiß, S., Lewandowski, D.: Expert interviews with stakeholder groups in the context of commercial search engines within the SEO Effect project. (2021). https://osf.io/y3d6t/ StatCounter (2020a). StatCounter: Search Engine Market Share United States Of America | StatCounter Global Stats. StatCounter (2020b). StatCounter: Search Engine Market Share Europe | StatCounter Global Stats. Petrescu, P. (2014). Google Organic Click-Through Rates in 2014. https://moz.com/blog/google-organic-click-through-rates-in-2014 Forschungsdaten https://osf.io/rvx54/ Folie 22
  • 24. VIELEN DANK FÜR IHRE AUFMERKSAMKEIT!