SlideShare uma empresa Scribd logo
1 de 8
Nội dung trùng lặp
• Nội dung trùng lặp thường đề cập đến nội dung của khối nội
  dung bên trong hoặc trên các tên miền hoặc là hoàn toàn phù
  hợp với các nội dung khác hoặc là đáng tương tự. Chủ yếu,
  điều này không phải là lừa đảo có nguồn gốc. Ví dụ về các
  nội dung trùng lặp không độc hại có thể bao gồm:
• Diễn đàn thảo luận có thể tạo ra các trang thường xuyên và
  tước xuống nhắm mục tiêu vào các thiết bị di động
  Các cửa hàng được hiển thị hoặc liên kết thông qua nhiều
  URL khác nhau
  Máy in chỉ có các phiên bản của các trang web
• Nếu trang web của bạn có chứa nhiều trang với nội dung chủ
  yếu là giống hệt nhau, có một số cách bạn có thể chỉ URL ưa
  thích của bạn với Google. (Điều này được gọi là
  "canonicalization"). Thông tin về canonicalization.
•   Tuy nhiên, trong một số trường hợp, nội dung là cố ý trùng lặp trên các lĩnh vực
    trong một nỗ lực để thao tác bảng xếp hạng công cụ tìm kiếm hoặc giành chiến
    thắng giao thông nhiều hơn. Hành vi lừa đảo như thế này có thể dẫn đến một
    trải nghiệm người dùng kém, khi khách truy cập thấy đáng kể cùng một nội dung
    lặp đi lặp lại trong một tập hợp các kết quả tìm kiếm.
•   Google cố gắng để chỉ mục và hiển thị các thiết kế web trên trang web có thông
    tin riêng biệt. Điều này có nghĩa là lọc, ví dụ, nếu các thiết kế web trang web của
    bạn có một "thường xuyên" và "máy in" phiên bản của mỗi bài viết, và không
    phải của các bị chặn với một thẻ meta ngăn lập chỉ mục, chúng tôi sẽ chọn một
    trong số họ vào danh sách. Trong những trường hợp hiếm gặp trong đó Google
    nhận thấy rằng nội dung trùng lặp có thể được hiển thị với mục đích thao tác
    bảng xếp hạng của chúng tôi và đánh lừa người dùng của chúng tôi, chúng tôi
    cũng sẽ có những điều chỉnh thích hợp trong việc lập chỉ mục và xếp hạng của
    các các thiết kế web trang web có liên quan. Kết quả là, thứ hạng của các thiết kế
    web trên trang web có thể bị ảnh hưởng, hoặc các thiết kế web trang web có thể
    được xoá hoàn toàn khỏi chỉ mục của Google, trong trường hợp nó sẽ không còn
    xuất hiện trong kết quả tìm kiếm.
•   Có một số bước bạn có thể làm để chủ động giải quyết các vấn đề nội dung trùng lặp, và
    đảm bảo rằng khách truy cập xem nội dung bạn muốn họ.
•   Sử dụng 301s: Nếu bạn đã cơ cấu lại trang web của bạn, sử dụng chuyển hướng 301
    ("RedirectPermanent") trong tập tin htaccess của bạn để chuyển hướng người dùng thông
    minh, Googlebot, và nhện khác. (Trong Apache, bạn có thể làm điều này với một tập tin
    htaccess; trong IIS, bạn có thể làm điều này thông qua giao diện điều khiển hành chính).
•   Hãy nhất quán: Cố gắng giữ liên kết nội bộ của bạn nhất quán. Ví dụ, không liên kết với
    http://www.example.com/page/ và http://www.example.com/page và
    http://www.example.com/page/index.htm.
•   Sử dụng tên miền cấp cao: Để giúp chúng tôi phục vụ phiên bản thích hợp nhất của một
    tài liệu, sử dụng tên miền cấp cao nhất bất cứ khi nào có thể để xử lý các nội dung cụ thể
    của quốc gia. Chúng tôi có nhiều khả năng để biết http://www.example.de có chứa Đức tập
    trung vào nội dung, ví dụ, hơn http://www.example.com/de hoặc http://de.example.com.
•   Syndicate cẩn thận: Nếu bạn cung cấp thông nội dung của bạn trên các trang web
    khác, Google sẽ luôn luôn hiển thị phiên bản chúng tôi nghĩ là thích hợp nhất cho người sử
    dụng trong mỗi lần tìm kiếm nhất định, mà có thể hoặc có thể không phải là phiên bản mà
    bạn muốn. Tuy nhiên, nó là hữu ích để đảm bảo rằng mỗi trang web mà nội dung của bạn
    được cung cấp thông tin bao gồm một liên kết đến bài viết ban đầu của bạn. Bạn cũng có
    thể yêu cầu những người sử dụng các tài liệu cung cấp thông tin của bạn để sử dụng thẻ
    meta ngăn lập chỉ mục để ngăn chặn các công cụ tìm kiếm lập chỉ mục phiên bản của họ
    về nội dung.
•   Sử dụng Công cụ quản trị trang web để cho chúng tôi biết cách bạn muốn
    trang web của bạn được lập chỉ mục: Bạn có thể nói Google tên miền ưa
    thích của bạn (ví dụ, http://www.example.com hoặc http://example.com).
•   Giảm thiểu sự lặp lại boilerplate: Ví dụ, thay vì bao gồm cả văn bản bản
    quyền kéo dài trên dưới cùng của mỗi trang, bao gồm một bản tóm tắt rất
    ngắn gọn và sau đó liên kết đến một trang với các chi tiết hơn. Ngoài
    ra, bạn có thể sử dụng công cụ xử lý thông số để xác định cách mà bạn
    muốn Google để điều trị các tham số URL.
•   Tránh khai xuất bản: Người sử dụng không thích nhìn thấy các trang "trống
    rỗng", do đó, tránh giữ chỗ nếu có thể. Ví dụ, không xuất bản các trang mà
    bạn không có nội dung thực sự. Nếu bạn tạo các trang giữ chỗ, sử dụng
    thẻ meta ngăn lập chỉ mục để chặn các trang được lập chỉ mục.
•   Hiểu hệ thống quản lý nội dung của bạn: Hãy chắc chắn rằng bạn đã quen
    thuộc với nội dung được hiển thị trên trang web của bạn. Blog, diễn đàn, và
    các hệ thống liên quan thường hiển thị cùng một nội dung trong nhiều định
    dạng. Ví dụ, một blog entry có thể xuất hiện trên trang chủ của một
    blog, trong một trang lưu trữ, và trong một trang mục khác với cùng một
    nhãn hiệu.
•   Giảm thiểu nội dung tương tự: Nếu bạn có nhiều trang tương tự, hãy xem xét mở rộng mỗi
    trang hoặc củng cố các trang thành một. Ví dụ, nếu bạn có một trong các mẫu thiết kế web
    trên trang web du lịch với các trang riêng biệt cho hai thành phố, nhưng thông tin tương tự
    trên cả hai trang, bạn có thể hợp nhất các trang vào một trang về cả hai thành phố hoặc
    bạn có thể mở rộng mỗi trang chứa nội dung độc đáo về mỗi thành phố.
•   Google không khuyến nghị trình thu thập dữ liệu truy cập chặn trùng lặp nội dung trên
    trang web của bạn, cho dù với một tập tin robots.txt hoặc các phương pháp khác. Nếu
    công cụ tìm kiếm không thể thu thập dữ liệu các trang có nội dung trùng lặp, họ có thể
    không tự động phát hiện rằng các URL trỏ đến cùng một nội dung và do đó sẽ có hiệu quả
    phải đối xử với họ như là riêng biệt, trang duy nhất. Một giải pháp tốt hơn là để cho phép
    các công cụ tìm kiếm thu thập dữ liệu các URL, nhưng đánh dấu chúng là bản sao bằng
    cách sử dụng các rel chuyển hướng = "canonical" liên kết phần tử, công cụ xử lý tham số
    URL, hoặc 301. Trong trường hợp nội dung trùng lặp dẫn đến chúng ta bò quá nhiều trang
    web của bạn, bạn cũng có thể điều chỉnh các thiết lập tốc độ thu thập dữ liệu trong Công
    cụ Quản trị Trang web.
•   Nội dung trùng lặp trên một thiết kế web trên trang web không phải là căn cứ cho hành
    động trên trang web đó, trừ khi nó xuất hiện rằng ý định của nội dung trùng lặp là lừa đảo
    và thao tác kết quả công cụ tìm kiếm. Nếu trang web của bạn bị các vấn đề nội dung trùng
    lặp, và bạn không làm theo những lời khuyên được liệt kê ở trên, chúng tôi làm tốt công
    việc của việc lựa chọn một phiên bản của nội dung hiển thị trong kết quả tìm kiếm của
    chúng tôi.
• Tuy nhiên, nếu xem xét của chúng tôi chỉ ra rằng bạn tham gia vào
  các hành vi lừa đảo và trang web của bạn đã được gỡ bỏ từ các kết
  quả tìm kiếm của chúng tôi, xem xét trang web của bạn một cách
  cẩn thận. Nếu trang web của bạn đã được gỡ bỏ từ các kết quả tìm
  kiếm của chúng tôi, xem xét Hướng dẫn quản trị thiết kế web trên
  trang web của chúng tôi để biết thêm thông tin. Một khi bạn đã thực
  hiện thay đổi của bạn và tự tin rằng trang web của bạn không còn vi
  phạm nguyên tắc của chúng tôi, gửi trang web của bạn để xem xét
  lại.
• Trong tình huống hiếm hoi, thuật toán của chúng tôi có thể chọn một
  địa chỉ từ một trang web bên ngoài được lưu trữ nội dung của bạn
  mà không có sự cho phép của bạn. Nếu bạn tin rằng một trang web
  khác phải nhân đôi nội dung của bạn vi phạm luật bản quyền, bạn
  có thể liên lạc với máy chủ của trang web để yêu cầu loại bỏ. Ngoài
  ra, bạn có thể yêu cầu Google loại bỏ các trang vi phạm khỏi các kết
  quả tìm kiếm của chúng tôi bằng cách nộp đơn yêu cầu theo Đạo
  luật Bản quyền Kỹ thuật số Thiên niên kỷ.

Mais conteúdo relacionado

Mais de brian4282

21 bước làm seo cho người mới bắt
21 bước làm seo cho người mới bắt21 bước làm seo cho người mới bắt
21 bước làm seo cho người mới bắtbrian4282
 
Qui trình làm seo cho website
Qui trình làm seo cho websiteQui trình làm seo cho website
Qui trình làm seo cho websitebrian4282
 
51 mẹo nhỏ để cải thiện thứ hạng
51 mẹo nhỏ để cải thiện thứ hạng51 mẹo nhỏ để cải thiện thứ hạng
51 mẹo nhỏ để cải thiện thứ hạngbrian4282
 
Tac gia thong tin trong cac ket qua tim kiem1
Tac gia thong tin trong cac ket qua tim kiem1Tac gia thong tin trong cac ket qua tim kiem1
Tac gia thong tin trong cac ket qua tim kiem1brian4282
 
Trang web không làm tốt trong lĩnh vực tìm kiếm
Trang web không làm tốt trong lĩnh vực tìm kiếmTrang web không làm tốt trong lĩnh vực tìm kiếm
Trang web không làm tốt trong lĩnh vực tìm kiếmbrian4282
 
Cấu trúc dữ liệu
Cấu trúc dữ liệuCấu trúc dữ liệu
Cấu trúc dữ liệubrian4282
 
Tạo sơ đồ trang web
Tạo sơ đồ trang webTạo sơ đồ trang web
Tạo sơ đồ trang webbrian4282
 

Mais de brian4282 (8)

21 bước làm seo cho người mới bắt
21 bước làm seo cho người mới bắt21 bước làm seo cho người mới bắt
21 bước làm seo cho người mới bắt
 
Qui trình làm seo cho website
Qui trình làm seo cho websiteQui trình làm seo cho website
Qui trình làm seo cho website
 
51 mẹo nhỏ để cải thiện thứ hạng
51 mẹo nhỏ để cải thiện thứ hạng51 mẹo nhỏ để cải thiện thứ hạng
51 mẹo nhỏ để cải thiện thứ hạng
 
Tac gia thong tin trong cac ket qua tim kiem1
Tac gia thong tin trong cac ket qua tim kiem1Tac gia thong tin trong cac ket qua tim kiem1
Tac gia thong tin trong cac ket qua tim kiem1
 
Trang web không làm tốt trong lĩnh vực tìm kiếm
Trang web không làm tốt trong lĩnh vực tìm kiếmTrang web không làm tốt trong lĩnh vực tìm kiếm
Trang web không làm tốt trong lĩnh vực tìm kiếm
 
Url builder
Url builderUrl builder
Url builder
 
Cấu trúc dữ liệu
Cấu trúc dữ liệuCấu trúc dữ liệu
Cấu trúc dữ liệu
 
Tạo sơ đồ trang web
Tạo sơ đồ trang webTạo sơ đồ trang web
Tạo sơ đồ trang web
 

Noi dung trung lap

  • 2.
  • 3. • Nội dung trùng lặp thường đề cập đến nội dung của khối nội dung bên trong hoặc trên các tên miền hoặc là hoàn toàn phù hợp với các nội dung khác hoặc là đáng tương tự. Chủ yếu, điều này không phải là lừa đảo có nguồn gốc. Ví dụ về các nội dung trùng lặp không độc hại có thể bao gồm: • Diễn đàn thảo luận có thể tạo ra các trang thường xuyên và tước xuống nhắm mục tiêu vào các thiết bị di động Các cửa hàng được hiển thị hoặc liên kết thông qua nhiều URL khác nhau Máy in chỉ có các phiên bản của các trang web • Nếu trang web của bạn có chứa nhiều trang với nội dung chủ yếu là giống hệt nhau, có một số cách bạn có thể chỉ URL ưa thích của bạn với Google. (Điều này được gọi là "canonicalization"). Thông tin về canonicalization.
  • 4. Tuy nhiên, trong một số trường hợp, nội dung là cố ý trùng lặp trên các lĩnh vực trong một nỗ lực để thao tác bảng xếp hạng công cụ tìm kiếm hoặc giành chiến thắng giao thông nhiều hơn. Hành vi lừa đảo như thế này có thể dẫn đến một trải nghiệm người dùng kém, khi khách truy cập thấy đáng kể cùng một nội dung lặp đi lặp lại trong một tập hợp các kết quả tìm kiếm. • Google cố gắng để chỉ mục và hiển thị các thiết kế web trên trang web có thông tin riêng biệt. Điều này có nghĩa là lọc, ví dụ, nếu các thiết kế web trang web của bạn có một "thường xuyên" và "máy in" phiên bản của mỗi bài viết, và không phải của các bị chặn với một thẻ meta ngăn lập chỉ mục, chúng tôi sẽ chọn một trong số họ vào danh sách. Trong những trường hợp hiếm gặp trong đó Google nhận thấy rằng nội dung trùng lặp có thể được hiển thị với mục đích thao tác bảng xếp hạng của chúng tôi và đánh lừa người dùng của chúng tôi, chúng tôi cũng sẽ có những điều chỉnh thích hợp trong việc lập chỉ mục và xếp hạng của các các thiết kế web trang web có liên quan. Kết quả là, thứ hạng của các thiết kế web trên trang web có thể bị ảnh hưởng, hoặc các thiết kế web trang web có thể được xoá hoàn toàn khỏi chỉ mục của Google, trong trường hợp nó sẽ không còn xuất hiện trong kết quả tìm kiếm.
  • 5. Có một số bước bạn có thể làm để chủ động giải quyết các vấn đề nội dung trùng lặp, và đảm bảo rằng khách truy cập xem nội dung bạn muốn họ. • Sử dụng 301s: Nếu bạn đã cơ cấu lại trang web của bạn, sử dụng chuyển hướng 301 ("RedirectPermanent") trong tập tin htaccess của bạn để chuyển hướng người dùng thông minh, Googlebot, và nhện khác. (Trong Apache, bạn có thể làm điều này với một tập tin htaccess; trong IIS, bạn có thể làm điều này thông qua giao diện điều khiển hành chính). • Hãy nhất quán: Cố gắng giữ liên kết nội bộ của bạn nhất quán. Ví dụ, không liên kết với http://www.example.com/page/ và http://www.example.com/page và http://www.example.com/page/index.htm. • Sử dụng tên miền cấp cao: Để giúp chúng tôi phục vụ phiên bản thích hợp nhất của một tài liệu, sử dụng tên miền cấp cao nhất bất cứ khi nào có thể để xử lý các nội dung cụ thể của quốc gia. Chúng tôi có nhiều khả năng để biết http://www.example.de có chứa Đức tập trung vào nội dung, ví dụ, hơn http://www.example.com/de hoặc http://de.example.com. • Syndicate cẩn thận: Nếu bạn cung cấp thông nội dung của bạn trên các trang web khác, Google sẽ luôn luôn hiển thị phiên bản chúng tôi nghĩ là thích hợp nhất cho người sử dụng trong mỗi lần tìm kiếm nhất định, mà có thể hoặc có thể không phải là phiên bản mà bạn muốn. Tuy nhiên, nó là hữu ích để đảm bảo rằng mỗi trang web mà nội dung của bạn được cung cấp thông tin bao gồm một liên kết đến bài viết ban đầu của bạn. Bạn cũng có thể yêu cầu những người sử dụng các tài liệu cung cấp thông tin của bạn để sử dụng thẻ meta ngăn lập chỉ mục để ngăn chặn các công cụ tìm kiếm lập chỉ mục phiên bản của họ về nội dung.
  • 6. Sử dụng Công cụ quản trị trang web để cho chúng tôi biết cách bạn muốn trang web của bạn được lập chỉ mục: Bạn có thể nói Google tên miền ưa thích của bạn (ví dụ, http://www.example.com hoặc http://example.com). • Giảm thiểu sự lặp lại boilerplate: Ví dụ, thay vì bao gồm cả văn bản bản quyền kéo dài trên dưới cùng của mỗi trang, bao gồm một bản tóm tắt rất ngắn gọn và sau đó liên kết đến một trang với các chi tiết hơn. Ngoài ra, bạn có thể sử dụng công cụ xử lý thông số để xác định cách mà bạn muốn Google để điều trị các tham số URL. • Tránh khai xuất bản: Người sử dụng không thích nhìn thấy các trang "trống rỗng", do đó, tránh giữ chỗ nếu có thể. Ví dụ, không xuất bản các trang mà bạn không có nội dung thực sự. Nếu bạn tạo các trang giữ chỗ, sử dụng thẻ meta ngăn lập chỉ mục để chặn các trang được lập chỉ mục. • Hiểu hệ thống quản lý nội dung của bạn: Hãy chắc chắn rằng bạn đã quen thuộc với nội dung được hiển thị trên trang web của bạn. Blog, diễn đàn, và các hệ thống liên quan thường hiển thị cùng một nội dung trong nhiều định dạng. Ví dụ, một blog entry có thể xuất hiện trên trang chủ của một blog, trong một trang lưu trữ, và trong một trang mục khác với cùng một nhãn hiệu.
  • 7. Giảm thiểu nội dung tương tự: Nếu bạn có nhiều trang tương tự, hãy xem xét mở rộng mỗi trang hoặc củng cố các trang thành một. Ví dụ, nếu bạn có một trong các mẫu thiết kế web trên trang web du lịch với các trang riêng biệt cho hai thành phố, nhưng thông tin tương tự trên cả hai trang, bạn có thể hợp nhất các trang vào một trang về cả hai thành phố hoặc bạn có thể mở rộng mỗi trang chứa nội dung độc đáo về mỗi thành phố. • Google không khuyến nghị trình thu thập dữ liệu truy cập chặn trùng lặp nội dung trên trang web của bạn, cho dù với một tập tin robots.txt hoặc các phương pháp khác. Nếu công cụ tìm kiếm không thể thu thập dữ liệu các trang có nội dung trùng lặp, họ có thể không tự động phát hiện rằng các URL trỏ đến cùng một nội dung và do đó sẽ có hiệu quả phải đối xử với họ như là riêng biệt, trang duy nhất. Một giải pháp tốt hơn là để cho phép các công cụ tìm kiếm thu thập dữ liệu các URL, nhưng đánh dấu chúng là bản sao bằng cách sử dụng các rel chuyển hướng = "canonical" liên kết phần tử, công cụ xử lý tham số URL, hoặc 301. Trong trường hợp nội dung trùng lặp dẫn đến chúng ta bò quá nhiều trang web của bạn, bạn cũng có thể điều chỉnh các thiết lập tốc độ thu thập dữ liệu trong Công cụ Quản trị Trang web. • Nội dung trùng lặp trên một thiết kế web trên trang web không phải là căn cứ cho hành động trên trang web đó, trừ khi nó xuất hiện rằng ý định của nội dung trùng lặp là lừa đảo và thao tác kết quả công cụ tìm kiếm. Nếu trang web của bạn bị các vấn đề nội dung trùng lặp, và bạn không làm theo những lời khuyên được liệt kê ở trên, chúng tôi làm tốt công việc của việc lựa chọn một phiên bản của nội dung hiển thị trong kết quả tìm kiếm của chúng tôi.
  • 8. • Tuy nhiên, nếu xem xét của chúng tôi chỉ ra rằng bạn tham gia vào các hành vi lừa đảo và trang web của bạn đã được gỡ bỏ từ các kết quả tìm kiếm của chúng tôi, xem xét trang web của bạn một cách cẩn thận. Nếu trang web của bạn đã được gỡ bỏ từ các kết quả tìm kiếm của chúng tôi, xem xét Hướng dẫn quản trị thiết kế web trên trang web của chúng tôi để biết thêm thông tin. Một khi bạn đã thực hiện thay đổi của bạn và tự tin rằng trang web của bạn không còn vi phạm nguyên tắc của chúng tôi, gửi trang web của bạn để xem xét lại. • Trong tình huống hiếm hoi, thuật toán của chúng tôi có thể chọn một địa chỉ từ một trang web bên ngoài được lưu trữ nội dung của bạn mà không có sự cho phép của bạn. Nếu bạn tin rằng một trang web khác phải nhân đôi nội dung của bạn vi phạm luật bản quyền, bạn có thể liên lạc với máy chủ của trang web để yêu cầu loại bỏ. Ngoài ra, bạn có thể yêu cầu Google loại bỏ các trang vi phạm khỏi các kết quả tìm kiếm của chúng tôi bằng cách nộp đơn yêu cầu theo Đạo luật Bản quyền Kỹ thuật số Thiên niên kỷ.