Khi bạn ngồi xuống máy tính của bạn và làm một tìm kiếm Google, bạn gần như ngay lập tức trình bày với một danh sách các kết quả từ tất cả các nơi trên web. Làm cách nào để Google tìm các trang web phù hợp với truy vấn của bạn, và xác định thứ tự của kết quả tìm kiếm?
3. • Tìm hiểu cách Google phát hiện, thu thập, và
phục vụ các thiết kế web của trang web
Khi bạn ngồi xuống máy tính của bạn và làm
một tìm kiếm Google, bạn gần như ngay lập
tức trình bày với một danh sách các kết quả
từ tất cả các nơi trên web. Làm cách nào để
Google tìm các trang web phù hợp với truy
vấn của bạn, và xác định thứ tự của kết quả
tìm kiếm?
4.
5. • Trong thuật ngữ đơn giản, bạn có thể tìm
kiếm trên web như tìm kiếm trong một
cuốn sách rất lớn với một chỉ số ấn tượng
cho bạn biết chính xác nơi tất cả mọi thứ
đang nằm. Khi bạn thực hiện một tìm kiếm
của Google, chương trình của chúng tôi
kiểm tra chỉ mục của chúng tôi để xác định
các kết quả tìm kiếm có liên quan nhất
được trả lại ("phục vụ") cho bạn.
6.
7. • Ba quy trình quan trọng trong việc cung
cấp các kết quả tìm kiếm cho bạn là:
Crawling: Google biết về trang web của
bạn? Chúng ta có thể tìm thấy nó?
Lập chỉ mục: Google lập chỉ mục trang
web của bạn?
Phục vụ: các trang web có nội dung tốt và
hữu ích đó là liên quan đến tìm kiếm của
người dùng?
8.
9. • Thu thập dữ liệu
Thu thập thông tin là quá trình mà
Googlebot phát hiện ra trang mới và cập
nhật được thêm vào chỉ mục của Google.
Chúng tôi sử dụng một tập lớn các máy
tính để lấy (hoặc "thu thập dữ liệu") tỷ
trang trên web.
10.
11. • Chương trình mà không lấy được gọi là
Googlebot (còn được biết đến như là một
robot, bot, hoặc nhện). Googlebot sử dụng
một quá trình thuật toán: chương trình
máy tính xác định các trang web để thu
thập dữ liệu, thường xuyên như thế nào,
và bao nhiêu trang để tìm nạp từ mỗi trang
web.
12. • Quá trình thu thập dữ liệu của Google bắt đầu với
một danh sách các URL của trang web, tạo ra từ
các quá trình thu thập dữ liệu trước đó, và tăng
cường với sơ đồ dữ liệu được cung cấp bởi quản
trị web. Khi Googlebot ghé thăm mỗi người trong
số các thiết kế web trang web này phát hiện các
liên kết trên mỗi trang và thêm chúng vào danh
sách của các trang để thu thập dữ liệu. Các thiết
kế web trang web mới, thay đổi các thiết kế web
trang web hiện, và các liên kết chết được ghi nhận
và được sử dụng để cập nhật chỉ mục của
Google.
13.
14. Google không chấp nhận thanh toán để thu
thập dữ liệu một thiết kế web trang web
thường xuyên hơn, và chúng tôi giữ bên tìm
kiếm kinh doanh của chúng tôi tách biệt với
dịch vụ tạo doanh thu AdWords của chúng
tôi.
15. • Lập chỉ mục
Googlebot xử lý mỗi trang mà nó thu thập dữ liệu
để biên dịch một chỉ số lớn của tất cả các từ nó
thấy và vị trí của họ trên mỗi trang. Ngoài ra,
chúng tôi xử lý thông tin bao gồm trong các thẻ nội
dung chính và các thuộc tính, chẳng hạn như thẻ
tiêu đề và thuộc tính ALT. Googlebot có thể xử lý
nhiều, nhưng không phải tất cả, các loại nội dung.
Ví dụ, chúng tôi không thể xử lý nội dung của một
số tập tin đa phương tiện hoặc các trang động.
16. • Kết quả được cung cấp
Khi người dùng nhập một truy vấn, máy móc
của chúng tôi tìm kiếm các chỉ số cho các
trang phù hợp và trả lại kết quả chúng tôi cho
là phù hợp nhất cho người sử dụng. Độ phù
hợp được xác định bởi hơn 200 yếu tố, một
trong số đó là PageRank cho một trang nhất
định. PageRank là thước đo về tầm quan
trọng của một trang dựa vào các liên kết đến
từ các trang khác.
17. • Trong thuật ngữ đơn giản, mỗi liên kết đến
một trang trên thiết kế web trang web của
bạn từ một thiết kế web trang web khác thêm
vào PageRank của trang web của bạn.
Không phải tất cả các liên kết bằng nhau:
Google làm việc chăm chỉ để cải thiện trải
nghiệm người dùng bằng cách xác định các
liên kết thư rác và các hoạt động mà các tác
động tiêu cực đến kết quả tìm kiếm. Những
loại tốt nhất của các liên kết là những người
được đưa ra dựa trên chất lượng nội dung
của bạn.
18. • Để cho trang web của bạn để xếp hạng tốt
trong các trang kết quả tìm kiếm, điều
quan trọng là để đảm bảo rằng Google có
thể thu thập dữ liệu và chỉ mục thiết kế
web trang web của bạn một cách chính
xác. Hướng dẫn quản trị trang web của
chúng tôi phác thảo một số thực hành tốt
nhất có thể giúp bạn tránh những cạm bẫy
phổ biến và cải thiện thứ hạng thiết kế
web trang web của bạn.
19. Google bạn có nghĩa là và các tính năng
của Google Autocomplete được thiết kế để
giúp người dùng tiết kiệm thời gian bằng
cách hiển thị các điều khoản liên quan, lỗi
chính tả phổ biến, và truy vấn phổ biến.
20. • Giống như các kết quả tìm kiếm google.com
của chúng tôi, các từ khóa được sử dụng bởi
các tính năng này sẽ tự động được tạo ra bởi
trình thu thập web của chúng tôi và các thuật
toán tìm kiếm. Chúng tôi hiển thị các dự đoán
chỉ khi chúng ta nghĩ rằng họ có thể tiết kiệm
thời gian người dùng. Nếu một trang web xếp
hạng tốt cho một từ khóa, đó là vì chúng tôi
đã thuật toán xác định rằng nội dung của nó
có liên quan đến truy vấn của người dùng.