3. Introduzione dell’Update
• Rilasciato per la prima volta nel
febbraio 2011 per le ricerche in inglese
nella versione americana di Google
(http://bit.ly/LFZpfw)
• Esteso ad altre localizzazioni di Google
(solo per le ricerche in inglese) in marzo
2011
• Esteso a tutte le lingue del mondo
(tranne Cinese, Giapponese e
Coreano) nell’agosto 2011
(http://bit.ly/LnlywZ)
• Successivi aggiornamenti (ultimo:
Panda Update 3.7 - 8 giugno 2012)
4. Finalità dell’Update
• Aggiornamento dell’algoritmo di Google finalizzato
a migliorare l’esperienza degli utenti alla ricerca di
informazioni precise e di qualità
• Interessa quasi esclusivamente i contenuti testuali
dei siti
• Obiettivi ricercati:
o Ridurre la visibilità sui motori di ricerca di siti con contenuti di bassa qualità
o Premiare in termini di miglior posizionamento i siti con contenuti di qualità
5. Portata del fenomeno
• Lingua inglese: 12% di ricerche interessate da
questo aggiornamento
• Altre lingue: 6% - 9% di ricerche interessate da
questo aggiornamento
Considerazioni
• Content farm/contenuti di bassa qualità presenti in
maggior misura in inglese?
• Minore «efficienza» del Panda Update
nell’individuare contenuti di bassa qualità per
lingue diverse dall’inglese?
6. Contenuti di bassa qualità
Siti con contenuti che offrono valore scarso o nullo al
visitatore che vi si reca dai motori di ricerca con la
query di riferimento, ripubblicando materiale
proveniente da altre fonti o ospitando informazioni
generiche e di scarsa rilevanza
• «Scraper site»
• «Content farm»
7. Scraper site
• Siti che ripubblicano integralmente o parzialmente i
contenuti prelevati da altri siti tramite procedure di
web scraping, il più delle volte senza autorizzazione
e con l’obiettivo di monetizzare il traffico ottenuto
dai motori di ricerca
• Esempi: Autoblog, Made for Adsense/MFA
8. Content farm
• Siti comprensivi di elevate quantità di contenuti
testuali di qualità modesta o bassa, formulati quasi
esclusivamente per presidiare i risultati dei motori di
ricerca per il maggior numero di keyword possibili
• Frequentemente impiegati utenti della rete in
qualità di copywriter freelance per massimizzare la
produzione di articoli e contenuti
• Esempi: Demand Media (eHow), Associated
Content, About.com, Ezine Articles
9. Altri siti colpiti
• Siti di e-commerce «minori», con elevata presenza
di pagine di prodotto scarsamente rilevanti
• Forum impostati per generare grandi quantità di
contenuti duplicati a partire dai nuovi thread degli
utenti
• Directory e siti affiliati con esigua riconoscibilità di
marca e segnali di scarsa interazione degli utenti
11. Contenuti di alta qualità
• Requisiti essenziali dei contenuti testuali di un sito:
o Originalità
o Tematizzazione
o Freschezza
o Qualità
• Google non comunica gli effettivi segnali di
posizionamento utilizzati nei suoi algoritmi, ma offre
linee guida da seguire per valutare la «qualità» di
una pagina o di un articolo
12. Linee guida
• Ritenete attendibili le informazioni presentate nell'articolo?
• L'articolo è stato scritto da un esperto o un appassionato che conosce bene l'argomento o è
più superficiale?
• Il sito contiene articoli duplicati, che si accavallano o sono ridondanti in merito ad argomenti
uguali o simili, solo con parole chiave leggermente diverse?
• Fornireste tranquillamente i dati della vostra carta di credito su questo sito?
• L'articolo contiene errori ortografici, stilistici o false informazioni?
• Gli argomenti sono basati sui reali interessi dei lettori del sito oppure il sito genera i contenuti in
base ai presunti argomenti che potrebbero ottenere un buon posizionamento nei motori di
ricerca?
• Il sito è considerato un'autorità riconosciuta in merito all'argomento che tratta?
• L'articolo è stato scritto bene o sembra essere stato redatto senza alcuna cura o in modo
sbrigativo?
• Si tratta del tipo di pagina che aggiungereste ai segnalibri, condividereste con un amico o
consigliereste?
• Nell'articolo ci sono troppi annunci che distolgono l'attenzione dai contenuti principali o
interferiscono con essi?
• Vi aspettereste di trovare l'articolo in una rivista, un'enciclopedia o un libro cartacei?
• Gli articoli sono corti, inconsistenti o comunque privi di informazioni specifiche utili?
• Gli utenti si lamenterebbero trovando pagine provenienti da questo sito?
N.B. L’elenco completo è disponibile all’indirizzo http://bit.ly/IrtkDU
13. Caratteristiche Update
• Il Panda update è solo uno degli oltre 200 fattori
considerati da Google per determinare il
posizionamento di una risorsa
• Il Panda update è un filtro applicato
periodicamente: ad ogni ciclo, siti e contenuti sono
rivalutati
• Il Panda Update interessa i siti, non le singole
pagine:
o Contenuti di bassa qualità presenti in alcune parti di un sito web possono
incidere sui posizionamenti dell'intero sito
14. Altri fattori negativi
• Tra gli altri fattori che possono incidere
negativamente sul posizionamento di un sito, a
seguito dell’introduzione di Google Panda:
o Esigua presenza di contenuti originali, non duplicati da altri siti
o Elevata presenza di contenuti con errori ortografici/grammaticali
o dalla scarsa leggibilità
o Basso tempo di visita per pagina
o Elevato bounce rate per pagina
o Eccessiva presenza di advertising per pagina
o Elevata quantità di «boilerplate content»
o Esiguo numero di backlink diretti ad una pagina o ad un sito
15. Strategie di recovery
• Per recuperare posizionamenti e traffico dopo essere
stati «colpiti» dal Panda Update può essere opportuno:
o Rimuovere pagine duplicate o di scarsa qualità (es. eHow ha rimosso
oltre 300.000 articoli), unire o migliorare i contenuti di pagine
generiche e poco rilevanti per renderle più utili
o Correggere contenuti con errori ortografici/grammaticali, apportare
modifiche volte a migliorare la leggibilità degli articoli
o Intervenire per incrementare il tempo di visita per pagina e ridurre il
bounce rate
o Costruire segnali di fiducia («trust signals») indicativi del
coinvolgimento degli utenti nel sito
o Ridurre la quantità di advertising per pagina (specie «above the
fold»)
o Migliorare gli aspetti coinvolti nell’usabilità del sito (es. velocità di
caricamento)
17. Introduzione dell’Update
• Rilasciato per la prima volta
nell’aprile 2012 per le ricerche in
tutte le lingue (http://bit.ly/I9SQn3)
• Successivi aggiornamenti (ultimo:
Penguin Update 1.1 - 26 maggio
2012)
• Preceduto dal Page Layout
Algorithm (http://bit.ly/KDUoTc), con
cui spesso viene confuso, che
introduce come variabile
fondamentale la quantità di testo
«above the fold»
18. Finalità dell’Update
• Aggiornamento dell’algoritmo di Google finalizzato
a ridurre la visibilità sul motore delle pagine che
impiegano tecniche di webspam (come keyword
stuffing e schemi di link) per manipolare i
posizionamenti
• Interessa sia i contenuti testuali dei siti, sia i fattori off-
site (backlink)
19. Portata del fenomeno
• Lingua inglese: 3,1% di ricerche interessate da
questo aggiornamento
• Altre lingue: 3% di ricerche in media, variabile a
seconda della lingua di riferimento (es. 3% tedesco,
cinese e arabo, 5% polacco)
20. Esempi di webspam
Testi «spun» e schemi di link (http://bit.ly/unP5N2)
Keyword stuffing
(http://bit.ly/xsWBOm)
21. Segnali da considerare
I siti «penalizzati» dal Penguin Update condividono
alcune caratteristiche, sul fronte dei fattori on-site
(contenuti testuali) e/o dei fattori off-site (link in
entrata)
• Penalizzate le pagine con contenuti sovraottimizzati
e con profilo di linking innaturale
• Maggiore importanza attribuita all’autorevolezza
dei siti ed ai segnali «Social» (like, tweet, ecc.)
22. Fattori on-site: best practices
• Evitare fenomeni «sovraottimizzazione» dei contenuti testuali
presenti nelle diverse pagine del sito:
o Inserire la parola chiave di riferimento nel corpo del testo
1-2 volte (preferibilmente above the fold), in modo naturale e non forzato
o Contemplare l’introduzione di varianti della parola chiave nel corpo del
testo (LSI keywords)
o Evitare «keyword stuffing» (es. ricorso alla stessa parola chiave
contemporaneamente nel title tag, meta tag description, meta tag
keywords, tag di intestazione, anchor text, ecc.)
• Incrementare la quantità di testo «above the fold» (rispetto ad
advertising, immagini, altri contenuti), facendo affidamento a
tool come http://bit.ly/7tXRTS
23. Fattori off-site: best practices
• Assicurarsi che gli anchor text dei link in entrata al sito siano
sensibilmente diversificati, non limitandosi a contenere le keyword di
riferimento:
o 1-5% dei link in entrata Exact-match anchor text
o 20-30% dei link in entrata LSI anchor text
o 70% dei link in entrata branded anchors, naked URLs, junk/universal anchors
• Puntare su un profilo di linking diversificato e naturale:
o Varietà nella tipologia di backlink (a diversi livelli: anchor text, classe C, TLD, tipo di
sito come blog, forum o news, posizione del link nella pagina, deeplink ratio, link
singoli/sitewide, nofollow/follow, ecc.)
o Link provenienti da siti rilevanti e di qualità, assenza di link da risorse spam (es. blog
networks, siti bannati forum profiles, comment spam), assenza di contenuti
considerati «spam» nei siti che offrono i link (es. contenuti «spun»)
o Segnali di popolarità sui social media (Facebook shares, like e commenti, Google
“+1”, tweets, ecc.)
o Trend di crescita dei link in entrata al sito costante (evitando «picchi» concentrati in
periodi di tempo specifici)
o Limitare scambio link, evitare pratiche (palesi) di acquisto link
24. Strategie di recovery
• Per recuperare posizionamenti e traffico dopo essere
stati «colpiti» dal Penguin Update può essere opportuno:
o Revisionare gli aspetti on-site delle pagine penalizzate, correggendo
eventuali casi di sovraottimizzazione (rimuovere keyword in eccesso,
introdurre varianti LSI) e incrementando, laddove possibile la quantità
di contenuti testuali «above the fold»
o Revisionare gli aspetti off-site delle pagine penalizzate, operando al
fine di stabilire/ripristinare un profilo di linking naturale e non artificioso
(agevolando la creazione di link diversificati e di qualità, chiedendo
la rimozione di link di scarsa qualità, ricercando segnali di popolarità
sui Social Media).
o In caso di falsi positivi, ricorrere al modulo ad hoc predisposto da
Google presso http://bit.ly/JqoQRV(non trattandosi di penalizzazione
di tipo manuale, la richiesta di riconsiderazione su GWT non ha,
invece, alcun effetto)