SlideShare uma empresa Scribd logo
1 de 11
Национальный аэрокосмический университет
им. Н.Е.Жуковского «ХАИ»
ОСНОВЫ РАБОТЫ В ИНТЕРНЕТ.
ЛЕКЦИЯ №5.
Поисковые системы.
Принцип работы поисковой системы.
Фурманов Алексей Аркадиевич
Популярные поисковые системы
Англоязычные:
1. http://google.com
2. http:// yahoo.com
3. http:// bing.com (msn.com)
4. первая была – http://altavista.com
Русскоязычные:
1. http:// yandex.ru
2. http:// rambler.ru
Украиноязычные:
1. http:// meta.ua
Поисковые системы FTP
Англоязычные:
1. http://globalfilesearch.com
2. http://www.filesearching.com/
Русскоязычные:
1. http://www.mmnt.ru
2. http://files.ru
Структурируемые тематические
каталоги
Каталог — «собрание сайтов,
сгруппированных по различным тематикам,
вся информация в каталогах
обрабатывается вручную. Для добавления
нового сайта в раздел каталога необходимо
отправить заявку, после обработки которой
сотрудник решает вопрос о его добавлении
в каталог.
Поисковая система
Поисковая система — полностью
автоматизированная структура, состоящая
из поисковой машины (робот, паук) и базы
данных ссылок.
Основные понятия поисковых систем
Индексация — это процесс сбора
информации в интернете поисковой
машиной, путём перехода между ссылками,
указывающими на сайты.
Релевантность – это уровень логического
соответствия каждой найденной страницы
поисковому запросу.
Недостатки поисковых систем
Основной недостаток — частое нахождение
информации неверное по логическому
смыслу. Этот недостаток связан с
автоматизированным подходом к
вычислению релевантности.
Регистрация в поисковых машинах
У большинства поисковых систем существует
страница добавления сайта на индексацию.
Срок индексации зависит от поисковой машины
(Яндекс ~ 1 неделя).
Google не позволяет добавлять сайт на
идексацию, а начинает индексировать сайт
только при условии, что на него есть хотя бы
одна ссылка на сайте, присутствующем в базе
данных сайтов.
Устройство ПС Google
Алгоритм работы ПС Google : 1
I. Сбор информации
1) Роботы сканируют содержимое
сайтов в Интернет (1)
2) И затем размещают собранную
информацию на серверах
индексов (2)…
3) и серверах документов (3)
Алгоритм работы ПС Google : 2
I. Выдача результатов поискового запроса
1) Web-клиент посылает запрос на один из Web-
серверов Google (4)
2) Web-сервер трансформирует запрос в вид,
пригодный для сервера индекса и посылает его (5)
3) Сервер индексов формирует запрос для сервера
документов пользуясь алгоритмами вычисления
релевантности и собственными базами индексов
4) По полученным результатам сервер индексов
обращается к серверам документов (6) для
получения фрагментов документов, после чего
отдаёт готовый результат Web-серверу (7)
5) Web-сервер отдаёт результат Web-клиенту (8)

Mais conteúdo relacionado

Mais de Alexey Furmanov

Лекция 4. Почтовая система. Outlook.
Лекция 4. Почтовая система. Outlook.Лекция 4. Почтовая система. Outlook.
Лекция 4. Почтовая система. Outlook.Alexey Furmanov
 
Лекция 2. IP-адресация.
Лекция 2. IP-адресация.Лекция 2. IP-адресация.
Лекция 2. IP-адресация.Alexey Furmanov
 
Лекция 3. Браузеры (2009)
Лекция 3. Браузеры (2009)Лекция 3. Браузеры (2009)
Лекция 3. Браузеры (2009)Alexey Furmanov
 
Лекция 10. Основы CSS.
Лекция 10. Основы CSS.Лекция 10. Основы CSS.
Лекция 10. Основы CSS.Alexey Furmanov
 
Лекция 1. Модель OSI.
Лекция 1. Модель OSI.Лекция 1. Модель OSI.
Лекция 1. Модель OSI.Alexey Furmanov
 
Lecture 6. ADO.NET Overview.
Lecture 6. ADO.NET Overview.Lecture 6. ADO.NET Overview.
Lecture 6. ADO.NET Overview.Alexey Furmanov
 
Lecture 4. MS SQL. DML Triggers
Lecture 4. MS SQL. DML TriggersLecture 4. MS SQL. DML Triggers
Lecture 4. MS SQL. DML TriggersAlexey Furmanov
 
Lecture 3. MS SQL. Cursors.
Lecture 3. MS SQL. Cursors.Lecture 3. MS SQL. Cursors.
Lecture 3. MS SQL. Cursors.Alexey Furmanov
 
Lecture 2. MS SQL. Stored procedures.
Lecture 2. MS SQL. Stored procedures.Lecture 2. MS SQL. Stored procedures.
Lecture 2. MS SQL. Stored procedures.Alexey Furmanov
 
Lecture 5. MS SQL. Transactions
Lecture 5. MS SQL. TransactionsLecture 5. MS SQL. Transactions
Lecture 5. MS SQL. TransactionsAlexey Furmanov
 

Mais de Alexey Furmanov (10)

Лекция 4. Почтовая система. Outlook.
Лекция 4. Почтовая система. Outlook.Лекция 4. Почтовая система. Outlook.
Лекция 4. Почтовая система. Outlook.
 
Лекция 2. IP-адресация.
Лекция 2. IP-адресация.Лекция 2. IP-адресация.
Лекция 2. IP-адресация.
 
Лекция 3. Браузеры (2009)
Лекция 3. Браузеры (2009)Лекция 3. Браузеры (2009)
Лекция 3. Браузеры (2009)
 
Лекция 10. Основы CSS.
Лекция 10. Основы CSS.Лекция 10. Основы CSS.
Лекция 10. Основы CSS.
 
Лекция 1. Модель OSI.
Лекция 1. Модель OSI.Лекция 1. Модель OSI.
Лекция 1. Модель OSI.
 
Lecture 6. ADO.NET Overview.
Lecture 6. ADO.NET Overview.Lecture 6. ADO.NET Overview.
Lecture 6. ADO.NET Overview.
 
Lecture 4. MS SQL. DML Triggers
Lecture 4. MS SQL. DML TriggersLecture 4. MS SQL. DML Triggers
Lecture 4. MS SQL. DML Triggers
 
Lecture 3. MS SQL. Cursors.
Lecture 3. MS SQL. Cursors.Lecture 3. MS SQL. Cursors.
Lecture 3. MS SQL. Cursors.
 
Lecture 2. MS SQL. Stored procedures.
Lecture 2. MS SQL. Stored procedures.Lecture 2. MS SQL. Stored procedures.
Lecture 2. MS SQL. Stored procedures.
 
Lecture 5. MS SQL. Transactions
Lecture 5. MS SQL. TransactionsLecture 5. MS SQL. Transactions
Lecture 5. MS SQL. Transactions
 

Лекция 5. Поисковые системы.

  • 1. Национальный аэрокосмический университет им. Н.Е.Жуковского «ХАИ» ОСНОВЫ РАБОТЫ В ИНТЕРНЕТ. ЛЕКЦИЯ №5. Поисковые системы. Принцип работы поисковой системы. Фурманов Алексей Аркадиевич
  • 2. Популярные поисковые системы Англоязычные: 1. http://google.com 2. http:// yahoo.com 3. http:// bing.com (msn.com) 4. первая была – http://altavista.com Русскоязычные: 1. http:// yandex.ru 2. http:// rambler.ru Украиноязычные: 1. http:// meta.ua
  • 3. Поисковые системы FTP Англоязычные: 1. http://globalfilesearch.com 2. http://www.filesearching.com/ Русскоязычные: 1. http://www.mmnt.ru 2. http://files.ru
  • 4. Структурируемые тематические каталоги Каталог — «собрание сайтов, сгруппированных по различным тематикам, вся информация в каталогах обрабатывается вручную. Для добавления нового сайта в раздел каталога необходимо отправить заявку, после обработки которой сотрудник решает вопрос о его добавлении в каталог.
  • 5. Поисковая система Поисковая система — полностью автоматизированная структура, состоящая из поисковой машины (робот, паук) и базы данных ссылок.
  • 6. Основные понятия поисковых систем Индексация — это процесс сбора информации в интернете поисковой машиной, путём перехода между ссылками, указывающими на сайты. Релевантность – это уровень логического соответствия каждой найденной страницы поисковому запросу.
  • 7. Недостатки поисковых систем Основной недостаток — частое нахождение информации неверное по логическому смыслу. Этот недостаток связан с автоматизированным подходом к вычислению релевантности.
  • 8. Регистрация в поисковых машинах У большинства поисковых систем существует страница добавления сайта на индексацию. Срок индексации зависит от поисковой машины (Яндекс ~ 1 неделя). Google не позволяет добавлять сайт на идексацию, а начинает индексировать сайт только при условии, что на него есть хотя бы одна ссылка на сайте, присутствующем в базе данных сайтов.
  • 10. Алгоритм работы ПС Google : 1 I. Сбор информации 1) Роботы сканируют содержимое сайтов в Интернет (1) 2) И затем размещают собранную информацию на серверах индексов (2)… 3) и серверах документов (3)
  • 11. Алгоритм работы ПС Google : 2 I. Выдача результатов поискового запроса 1) Web-клиент посылает запрос на один из Web- серверов Google (4) 2) Web-сервер трансформирует запрос в вид, пригодный для сервера индекса и посылает его (5) 3) Сервер индексов формирует запрос для сервера документов пользуясь алгоритмами вычисления релевантности и собственными базами индексов 4) По полученным результатам сервер индексов обращается к серверам документов (6) для получения фрагментов документов, после чего отдаёт готовый результат Web-серверу (7) 5) Web-сервер отдаёт результат Web-клиенту (8)