Вики-учебник для подготовки к ЕГЭ/Информатика/Телекоммуникационные технологии/Поиск информации в Интернет

Материал из Letopisi.Ru — «Время вернуться домой»
Перейти к: навигация, поиск

Шаблон:Campus

Содержание

Содержательное обобщение изученного материала

Поиск информации (документов, файлов, людей)

Сеть Интернет растет очень быстрыми темпами, и найти нужную информацию среди сотен миллионов Web-страниц и файлов становится все сложнее. Для поиска информации используются специальные поисковые серверы, которые содержат более или менее полную и постоянно обновляемую информацию о Web-страницах, файлах и других документах, хранящихся на десятках миллионов серверов Интернета. Различные поисковые серверы могут использовать различные механизмы поиска, хранения и предоставления пользователю информации. Поисковые серверы Интернета можно разделить на две группы:

  • поисковые системы общего назначения;
  • специализированные поисковые системы.

Поисковые системы общего назначения являются базами данных, содержащими тематически сгруппированную информацию об информационных ресурсах Всемирной паутины. Такие поисковые системы позволяют находить Web-сайты или Web-страницы по ключевым словам в базе данных или путем поиска в иерархической системе каталогов. Заполнение баз данных осуществляется с помощью специальных программ-роботов, которые периодически «обходят» Web-сервера Интернета. Программы-роботы читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных, содержащую URL-адреса документов. Так как информация в Интернете постоянно меняется (создаются новые Web-сайты и страницы, удаляются старые, меняются их URL-адреса и т.д.), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поисковой системы, может отличаться от реального состояния Интернета, и тогда пользователь в результате поиска может получить адрес уже не существующего или перемещенного документа. В целях обеспечения большего соответствия между содержанием базы данных поисковой системы и реальным состоянием Интернета большинство поисковых систем разрешают автору нового или перемещенного Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчик сайта вносит URL-сайта, его название, краткое описание содер¬жания сайта, а также ключевые слова, по которым легче всего будет найти сайт. Интерфейс таких поисковых систем общего назначения содержит список разделов каталога и поле поиска. В поле поиска пользователь может ввести ключевые слова для поиска документа, а в каталоге выбрать определенный раздел, что сужает поле поиска и таким образом ускоряет его. Простой запрос содержит в поле поиска одно или несколько ключевых слов, которые, по вашему мнению, являются главными для этого документа. Можно также делать сложные запросы, использующие логические операции, шаблоны и т.д. Через некоторое время после отправки запроса поисковая система вернет аннотированный список URL-адресов документов, в которых были найдены указанные вами ключевые слова. Для просмотра этого документа в браузере достаточно активизировать указывающую на него ссылку. Если ключевые слова были выбраны неудачно, то список URL-адресов документов может быть слишком большим (может содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться каталогом поисковой системы. Web-сайты в базе данных поисковой системы группируются в тематические каталоги - аналоги тематического указателя в библиотеке. Тематические разделы верхнего уровня, например, «Интернет», «Компьютеры», «Культура и искусство» и т.д., содержат вложенные каталоги. Например, каталог «Интернет» может содержать подкаталоги «Провайдеры», «Поиск», «Общение» и др. Поиск информации сводится к выбору определенного каталога, после чего пользователю будет представлен список ссылок на URL-адреса наиболее посещаемых и важных Web-сайтов и Web-страниц. Каждая ссылка обычно аннотирована, т.е. содержит короткий комментарий к содержанию документа. Специализированные поисковые системы позволяют искать информацию в других информационных «слоях» Интернета: серверах файловых архивов, почтовых серверах и др. Для поиска файлов на серверах файловых архивов существуют специализированные поисковые системы двух типов: поисковые системы на основе использования баз данных и каталоги файлов. Для поиска файла в системе с использованием базы данных достаточно ввести имя файла в поле поиска, и поисковая система выдаст URL-адреса мест хранения данного файла. Для поиска необходимых файлов можно использовать систему серверов Archie, которые собирают и хранят поисковую информацию о содержимом FTP-серверов на узлах Интернета. Специализированные поисковые системы позволяют искать адрес электронной почты по имени человека или, наоборот, имя человека, хозяина определённого адреса электронной почты. Примером такой системы может служить поисковая система WhoWhere? (КтоГде?), расположенная по адресу: http://www.whowhere.com. Найти Web-страницу или файл в Интернете можно с помощью универсального указателя ресурсов (адреса Web-страницы). Универсальный указатель ресурсов (URL - Universal Resource Locator) включает в себя протокол доступа к документу, доменное имя или IP-адрес сервера, на котором находится документ, а также путь к файлу и собственно имя файла. Например: http://schools.keldysh.ru/info2000/index.htm состоит из трех частей: http:// - протокол доступа; schools.keldysh.ru - имя сервера; /info2000/index.htm - путь к файлу и имя файла.

Материал для изучения

Рекомендуемые ссылки

Список литературы

Назад к разделу Вики-учебник для подготовки к ЕГЭ/Информатика/Телекоммуникационные технологии

Назад к разделу Вики-учебник для подготовки к ЕГЭ/Раздел Информатика

Персональные инструменты
Инструменты