Nội dung trùng lặp thường đề cập đến nội dung của khối nội dung bên trong hoặc trên các tên miền hoặc là hoàn toàn phù hợp với các nội dung khác hoặc là đáng tương tự
3. • Nội dung trùng lặp thường đề cập đến nội dung của khối nội
dung bên trong hoặc trên các tên miền hoặc là hoàn toàn phù
hợp với các nội dung khác hoặc là đáng tương tự. Chủ yếu,
điều này không phải là lừa đảo có nguồn gốc. Ví dụ về các
nội dung trùng lặp không độc hại có thể bao gồm:
• Diễn đàn thảo luận có thể tạo ra các trang thường xuyên và
tước xuống nhắm mục tiêu vào các thiết bị di động
Các cửa hàng được hiển thị hoặc liên kết thông qua nhiều
URL khác nhau
Máy in chỉ có các phiên bản của các trang web
• Nếu trang web của bạn có chứa nhiều trang với nội dung chủ
yếu là giống hệt nhau, có một số cách bạn có thể chỉ URL ưa
thích của bạn với Google. (Điều này được gọi là
"canonicalization"). Thông tin về canonicalization.
4. • Tuy nhiên, trong một số trường hợp, nội dung là cố ý trùng lặp trên các lĩnh vực
trong một nỗ lực để thao tác bảng xếp hạng công cụ tìm kiếm hoặc giành chiến
thắng giao thông nhiều hơn. Hành vi lừa đảo như thế này có thể dẫn đến một
trải nghiệm người dùng kém, khi khách truy cập thấy đáng kể cùng một nội dung
lặp đi lặp lại trong một tập hợp các kết quả tìm kiếm.
• Google cố gắng để chỉ mục và hiển thị các thiết kế web trên trang web có thông
tin riêng biệt. Điều này có nghĩa là lọc, ví dụ, nếu các thiết kế web trang web của
bạn có một "thường xuyên" và "máy in" phiên bản của mỗi bài viết, và không
phải của các bị chặn với một thẻ meta ngăn lập chỉ mục, chúng tôi sẽ chọn một
trong số họ vào danh sách. Trong những trường hợp hiếm gặp trong đó Google
nhận thấy rằng nội dung trùng lặp có thể được hiển thị với mục đích thao tác
bảng xếp hạng của chúng tôi và đánh lừa người dùng của chúng tôi, chúng tôi
cũng sẽ có những điều chỉnh thích hợp trong việc lập chỉ mục và xếp hạng của
các các thiết kế web trang web có liên quan. Kết quả là, thứ hạng của các thiết kế
web trên trang web có thể bị ảnh hưởng, hoặc các thiết kế web trang web có thể
được xoá hoàn toàn khỏi chỉ mục của Google, trong trường hợp nó sẽ không còn
xuất hiện trong kết quả tìm kiếm.
5. • Có một số bước bạn có thể làm để chủ động giải quyết các vấn đề nội dung trùng lặp, và
đảm bảo rằng khách truy cập xem nội dung bạn muốn họ.
• Sử dụng 301s: Nếu bạn đã cơ cấu lại trang web của bạn, sử dụng chuyển hướng 301
("RedirectPermanent") trong tập tin htaccess của bạn để chuyển hướng người dùng thông
minh, Googlebot, và nhện khác. (Trong Apache, bạn có thể làm điều này với một tập tin
htaccess; trong IIS, bạn có thể làm điều này thông qua giao diện điều khiển hành chính).
• Hãy nhất quán: Cố gắng giữ liên kết nội bộ của bạn nhất quán. Ví dụ, không liên kết với
http://www.example.com/page/ và http://www.example.com/page và
http://www.example.com/page/index.htm.
• Sử dụng tên miền cấp cao: Để giúp chúng tôi phục vụ phiên bản thích hợp nhất của một
tài liệu, sử dụng tên miền cấp cao nhất bất cứ khi nào có thể để xử lý các nội dung cụ thể
của quốc gia. Chúng tôi có nhiều khả năng để biết http://www.example.de có chứa Đức tập
trung vào nội dung, ví dụ, hơn http://www.example.com/de hoặc http://de.example.com.
• Syndicate cẩn thận: Nếu bạn cung cấp thông nội dung của bạn trên các trang web
khác, Google sẽ luôn luôn hiển thị phiên bản chúng tôi nghĩ là thích hợp nhất cho người sử
dụng trong mỗi lần tìm kiếm nhất định, mà có thể hoặc có thể không phải là phiên bản mà
bạn muốn. Tuy nhiên, nó là hữu ích để đảm bảo rằng mỗi trang web mà nội dung của bạn
được cung cấp thông tin bao gồm một liên kết đến bài viết ban đầu của bạn. Bạn cũng có
thể yêu cầu những người sử dụng các tài liệu cung cấp thông tin của bạn để sử dụng thẻ
meta ngăn lập chỉ mục để ngăn chặn các công cụ tìm kiếm lập chỉ mục phiên bản của họ
về nội dung.
6. • Sử dụng Công cụ quản trị trang web để cho chúng tôi biết cách bạn muốn
trang web của bạn được lập chỉ mục: Bạn có thể nói Google tên miền ưa
thích của bạn (ví dụ, http://www.example.com hoặc http://example.com).
• Giảm thiểu sự lặp lại boilerplate: Ví dụ, thay vì bao gồm cả văn bản bản
quyền kéo dài trên dưới cùng của mỗi trang, bao gồm một bản tóm tắt rất
ngắn gọn và sau đó liên kết đến một trang với các chi tiết hơn. Ngoài
ra, bạn có thể sử dụng công cụ xử lý thông số để xác định cách mà bạn
muốn Google để điều trị các tham số URL.
• Tránh khai xuất bản: Người sử dụng không thích nhìn thấy các trang "trống
rỗng", do đó, tránh giữ chỗ nếu có thể. Ví dụ, không xuất bản các trang mà
bạn không có nội dung thực sự. Nếu bạn tạo các trang giữ chỗ, sử dụng
thẻ meta ngăn lập chỉ mục để chặn các trang được lập chỉ mục.
• Hiểu hệ thống quản lý nội dung của bạn: Hãy chắc chắn rằng bạn đã quen
thuộc với nội dung được hiển thị trên trang web của bạn. Blog, diễn đàn, và
các hệ thống liên quan thường hiển thị cùng một nội dung trong nhiều định
dạng. Ví dụ, một blog entry có thể xuất hiện trên trang chủ của một
blog, trong một trang lưu trữ, và trong một trang mục khác với cùng một
nhãn hiệu.
7. • Giảm thiểu nội dung tương tự: Nếu bạn có nhiều trang tương tự, hãy xem xét mở rộng mỗi
trang hoặc củng cố các trang thành một. Ví dụ, nếu bạn có một trong các mẫu thiết kế web
trên trang web du lịch với các trang riêng biệt cho hai thành phố, nhưng thông tin tương tự
trên cả hai trang, bạn có thể hợp nhất các trang vào một trang về cả hai thành phố hoặc
bạn có thể mở rộng mỗi trang chứa nội dung độc đáo về mỗi thành phố.
• Google không khuyến nghị trình thu thập dữ liệu truy cập chặn trùng lặp nội dung trên
trang web của bạn, cho dù với một tập tin robots.txt hoặc các phương pháp khác. Nếu
công cụ tìm kiếm không thể thu thập dữ liệu các trang có nội dung trùng lặp, họ có thể
không tự động phát hiện rằng các URL trỏ đến cùng một nội dung và do đó sẽ có hiệu quả
phải đối xử với họ như là riêng biệt, trang duy nhất. Một giải pháp tốt hơn là để cho phép
các công cụ tìm kiếm thu thập dữ liệu các URL, nhưng đánh dấu chúng là bản sao bằng
cách sử dụng các rel chuyển hướng = "canonical" liên kết phần tử, công cụ xử lý tham số
URL, hoặc 301. Trong trường hợp nội dung trùng lặp dẫn đến chúng ta bò quá nhiều trang
web của bạn, bạn cũng có thể điều chỉnh các thiết lập tốc độ thu thập dữ liệu trong Công
cụ Quản trị Trang web.
• Nội dung trùng lặp trên một thiết kế web trên trang web không phải là căn cứ cho hành
động trên trang web đó, trừ khi nó xuất hiện rằng ý định của nội dung trùng lặp là lừa đảo
và thao tác kết quả công cụ tìm kiếm. Nếu trang web của bạn bị các vấn đề nội dung trùng
lặp, và bạn không làm theo những lời khuyên được liệt kê ở trên, chúng tôi làm tốt công
việc của việc lựa chọn một phiên bản của nội dung hiển thị trong kết quả tìm kiếm của
chúng tôi.
8. • Tuy nhiên, nếu xem xét của chúng tôi chỉ ra rằng bạn tham gia vào
các hành vi lừa đảo và trang web của bạn đã được gỡ bỏ từ các kết
quả tìm kiếm của chúng tôi, xem xét trang web của bạn một cách
cẩn thận. Nếu trang web của bạn đã được gỡ bỏ từ các kết quả tìm
kiếm của chúng tôi, xem xét Hướng dẫn quản trị thiết kế web trên
trang web của chúng tôi để biết thêm thông tin. Một khi bạn đã thực
hiện thay đổi của bạn và tự tin rằng trang web của bạn không còn vi
phạm nguyên tắc của chúng tôi, gửi trang web của bạn để xem xét
lại.
• Trong tình huống hiếm hoi, thuật toán của chúng tôi có thể chọn một
địa chỉ từ một trang web bên ngoài được lưu trữ nội dung của bạn
mà không có sự cho phép của bạn. Nếu bạn tin rằng một trang web
khác phải nhân đôi nội dung của bạn vi phạm luật bản quyền, bạn
có thể liên lạc với máy chủ của trang web để yêu cầu loại bỏ. Ngoài
ra, bạn có thể yêu cầu Google loại bỏ các trang vi phạm khỏi các kết
quả tìm kiếm của chúng tôi bằng cách nộp đơn yêu cầu theo Đạo
luật Bản quyền Kỹ thuật số Thiên niên kỷ.