Возможности поисковых систем Веряев Анатолий Алексеевич van@uni-altai.ru.

Презентация:



Advertisements
Похожие презентации
Проверка домашнего задания. Ответьте на вопросы: 1.Что такое компьютерная сеть? Система компьютеров, связанных каналами передачи информации, называются.
Advertisements

Поиск информации в Интернете. Поисковые системы содержат тематически сгруппированную информацию об информационных ресурсах Всемирной паутины в базах данных.
Кто ищет - тот находит! Способы поиска в Интернете Три способа поиска Поисковые серверы Язык запросов поисковой системы МУНИЦИПАЛЬНОЕ ОБЩЕОРАЗОВАТЕЛЬНОЕ.
Интернет Интернет – это … … сеть, которая включает в себя …, … и … сети и объединяет миллионы … по всему миру.
Поисковые системы Интернет Тайны Всемирной паутины.
Учитель математики, информатики и ВТ Земскова В.Х п. Кушокы.
Поиск информации в ИНТЕРНЕТЕ Для слушателей курсов. ХалкечеваЛ.В.
Поисковые системы Интернет. Количество информации в мире растет: Калифорнийский университет подсчитал, что в 2002 году в мире произведено терабайт.
Интернет служба World Wide Web. Способы поиска информации в Интернете В интернете есть все? Пространство Web быстрее наполняется или систематизируется?
БИЦ (библиотечно- информационный центр) МОУ гимназия 28 г. Костромы Поиск информации в Интернете. Поисковая система Яндекс.
Поиск информации. Утенков С.А. Гимназия 1 г.Рузы Поисковые системы Интернет.
Составитель: А.Л.Распутина Учитель информатики и ИКТ.
Работу выполнил: Булыкин А.А. Содержание Поиск информации Основные способы поиска информации Поисковые серверы
Поиск информации с использованием компьютера. Поиск папок и файлов на компьютере Если пользователь не помнит, в каком именно месте он сохранил папку или.
Разработка учителя информатики и ИКТ МОУ «Майская гимназия Белгородского района» Токарь Татьяны Васильевны Разработка учителя информатики и ИКТ МОУ «Майская.
Поиск информации в Интернете. Для поиска информации используются специальные поисковые системы, которые содержат постоянно обновляемую информацию о местонахождении.
П ОИСК ИНФОРМАЦИИ В И НТЕРНЕТЕ Работу выполнила: Забавина Татьяна.
ОРГАНИЗАЦИЯ ПОИСКА ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ Использование поисковых каталогов Навигация по перекрестным ссылкам Обращение к поисковому серверу ИНФОРМАЦИЯ.
Что такое Internet?. Internet самая большая и самая известная в мире сеть, объединяющая миллионы компьютеров в огромную сеть сетей, предоставляющая неограниченный.
Инструментальные средства создания Web-сайтов
Транксрипт:

Возможности поисковых систем Веряев Анатолий Алексеевич

Этапы информационного поиска. 1.Определение вопроса 2.Формулировка запроса 3.Выполнение поиска 4.Оценка результатов поиска

Определение вопроса oВопрос – это то, на что вы хотите получить ответ. oЗапрос – это то, что вы вводите в компьютер.

Формулировка запроса. Определив свой вопрос и выбрав ресурсы для поиска, вы должны сформулировать запрос, т.е. выразить вопрос на языке понятном машине. В текстовом поле окна поисковой машины, которое обычно располагается в верхней части страницы, нужно ввести ключевые слова.

Формулировка запроса. Правила составления ключевых слов I. В запросах старайтесь использовать строчные буквы. Набирайте с прописной буквы только имена собственные (фамилии, имена и отчества, географические названия и т.д.)

Формулировка запроса. Правила составления ключевых слов II. Пробел между словами означает, что оба слова, разделенные пробелом, должны входить в искомый документ. Например, задание слов деревья береза даст документы, в которых одновременно имеются слова деревья и береза.

Формулировка запроса. Правила составления ключевых слов III. Вместо пробела можно использовать знак «+», который означает логическое И. Например, слова деревья + береза будут равносильны рассмотренным выше деревья береза

Формулировка запроса. Правила составления ключевых слов IV. Если нужно исключить из поиска какое-либо слово, применяется знак «-», который означает логическое НЕ. Например, условие деревья + береза – осина будет задавать поиск ресурсов, имеющих слова деревья и береза, но не содержащих слов осина.

Формулировка запроса. Правила составления ключевых слов V. Если требуется найти документы с любым из указанных слов, используется знак «|», заменяющий логическое ИЛИ. Например, ключевые слова деревья береза | осина в результате поиска дадут страницы, содержащие слово деревья и любое из слов береза или осина (либо оба одновременно)

Формулировка запроса. Правила составления ключевых слов VI. Фразы в ключевых словах заключаются в кавычки. Например, при задании названия фильма «Терминатор-2. Судный день» будет произведен поиск этих слов именно в такой форме ив таком порядке.

Учет особенностей естественного языка при составлении запроса Полисемия-наличие различных,но связанных смыслов слова. Наличие омонимов-разных,но одинаково звучащих и пишущихся слов(ключ, коса). Наличие омографов – слов, произносящихся по разному, но совпадающих при написании.(замок, атлас, ирис). Наличие омоформ – слов, совпадающих в написании в определенных формах. (существительное «печь» и глагол «печь»)

Выполнение поиска Существует 4 вида поиска: Простой поиск Расширенный поиск Контекстный поиск Специальный поиск

Выполнение поиска Простой поиск При простом поиске в поле запроса вводится одно или несколько слов, которые могут характеризовать содержание документа. Если это слово одно, то, как правило, в ответ выдается такое большое количество ссылок, с которым не понятно, что делать. Если вводится несколько слов, то результат зависит от того, как эти слова введены, а это, в свою очередь, зависит от конкретной используемой системы. ! Приемы простого поиска в разных поисковых системах свои.

Выполнение поиска Расширенный поиск Расширенный поиск всегда подразумевает запрос из группы слов. При расширенном поиске в большинстве случаев разрешается связывать ключевые слова логическими операторами И, ИЛИ, НЕ и другими. Основное достоинство расширенного поиска состоит в том, что, как правило, записи ключевых слов и логических операторов в разных системах либо одинаковы, либо очень похожи. Поэтому, усвоив один раз приемы расширенного поиска, можно ими пользоваться где угодно. Надо только предварительно переключить систему в нужный режим.

Выполнение поиска Контекстный поиск Это очень полезный вид поиска, который, к сожалению, реализован не во всех поисковых системах. Системы, которые его поддерживают, следует ценить особо. При контекстном поиске требуется точное совпадение фразы или группы слов, например «Все смешалось в доме Облонских». В большинстве поисковых систем, включающих этот метод, ключевая фраза должна быть заключена в кавычки: «Все смешалось в доме Облонских».

Выполнение поиска Специальный поиск С помощью команд специального поиска разыскивают дополнительную информацию. Например, такие команды позволяют определить, как часто в Сети встречаются гиперссылки, указывающие на какой-либо ресурс, с их помощью можно найти ключевые слова, входящие в заголовки Web-страниц и т.п. Как правило, команды специального поиска в различных поисковых системах свои.

Язык запросов Запрос состоит из поисковых лексем (слов и чисел), связанных операторами. Запрос может включать буквы русского и латинского языка. Интерпретация слов: Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка, например, если задано слово «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д. Если в запросе указано слово с большой буквы, то будут найдены только слова с большой буквы(если это слово не первое в предложении), в противном случае Синтаксис языка запросов различных поисковых систем имеет отличия. Будем рассматривать язык запроса Яндекса

Язык запросов ОператорЧто означает операторПример пробел или & логическое И (в пределах предложения) лечебная физкультура &&логическое И (в пределах документа) рецепты && (плавленый сыр) |логическое ИЛИфото | фотография | снимок | +обязательное наличие слова в найденном документе +быть или +не быть ( )группирование слов(культура|история)(США|Китая) ~Оператор НЕ (в пределах предложения) банк ~ налоги ~~ или -бинарный оператор И НЕ (в пределах документа) путеводитель по Парижу ~~ (агентство | тур) /(n m)расстояние в словах (-назад +вперед) поставщики /2 кофе " поиск фразы"красная шапочка" Операторы языка запросов

Язык запросов ОператорЧто означает операторПример запроса $title (выражение)поиск в заголовке$title (CompTek) $anchor (выражение)поиск в тексте ссылок$anchor (CompTek | Dialogic) #keywords=(выражение)поиск в ключевых словах#keywords=(поисковая система) #abstract=(выражение)поиск в описании#abstract=(искалка | поиск) #image="значение"поиск файла изображения#image="tort*" #hint=(выражение)поиск в подписях к изображениям #hint=(lenin | ленин) #url="значение"поиск на заданном сайте (странице) #url=" Поиск в определенных элементах гипертекстового документа

Оценка результатов поиска Это необходимый критический этап поиска, которым часто пренебрегают. Вот некоторые полезные критерии для оценки достаточности поиска: Просмотрите результаты своего поиска, чтобы понять, почему выбраны эти элементы, и какую часть составляют нужные, т.е. был ли поиск «прицельным». Не забывайте, что ошибки могли быть допущены на любой стадии поиска. Оценка достаточности зависит от того, для каких целей будут использованы результаты поиска. Если вам уже известны некоторые из найденных ссылок, но результаты поиска отрицательны, следует предположить наличие ошибки в стратегии. Если вы нашли слишком много или слишком мало, то считайте это первым сигналом о неэффективности поиска.

Оценка результатов поиска После обработки запроса информационно-поисковой системой на информационно-поисковом пространстве выделяются два множества документов выданные и релевантные. В общем случае эти множества являются пересекаемыми, но не совпадающими. Такое деление позволяет ввести некоторые характеристики результатов поиска.

Модель запроса Релевантные документы Выданные документы Выданные релевантные документы

Полнота результатов поиска Полнота = Число выданных релевантных Число релевантных Множестворелевантныхдокументов Выданные релевантные документы

Факторы, влияющие на полноту «Качество» составления запроса Возможности информационно- поисковой системы Выбор информационно-поискового пространства

Точность результатов поиска Точность Число выданных релевантных Число выданных Выданныерелевантныхдокументов Выданныедокументы

Факторы, влияющие на точность «Качество» составления запроса Особенности функционирования информационно-поисковой системы

Факторы, влияющие на скорость получения результатов поиска Характеристика каналов связи Объективные технические характеристики Временное состояние канала Особенности функционирования информационно-поисковой системы «Качество» построения запроса

Итог Знание информационных пространств Internet Знание особенностей информационно- поисковых систем Умение составлять запрос

Примечание Не делайте скоропалительных выводов, если ничего не найдено. Часто это не является свидетельством отсутствия информации. Обычно доказать отрицательный результат (т.е. доказать отсутствие литературы по этой теме) непросто. Прежде чем прийти к такому заключению, надо попробовать несколько других подходов.

Поисковые системы Интернета 1. Каталог – систематизированный набор ссылок на ресурсы в Интернете, составляемый вручную. Некоторые каталоги имеют встроенное средство поиска, обеспечивающее быстрый выход на нужную информацию. Самый крупный каталог Интернета – Yahoo! ( В нем работают более 150 квалифицированных редакторов. Это большая организация, но ее усилий хватает лишь на то, чтобы поддерживать каталог на уровне примерно 1 млн. ресурсов.

Поисковые системы Интернета 2. Указатели – это автоматизированные системы. Они способны функционировать без участия человека, и потому их знание о подлинных ресурсах Сети намного больше. Работа поискового указателя происходит в три этапа:

Поисковые системы Интернета I.Поисковый указатель собирает информацию из WWW. II.Индексация. III.Обработка запроса клиента и выдача ему результатов поиска в виде списка гиперссылок.

Поисковые системы Интернета 3. Порталы – узел в Интернете, который вместе с услугами поисковой машины предлагает собственный информационный континент. На таком узле могут предоставляться дополнительные услуги: бесплатные адреса электронной почты, места для размещения Web-сайтов и др. Порталы содержат, как правило, собственный каталог часто посещаемых ресурсов.

Что такое каталог? Каталоги ресурсов (глобальные, локальные, специализированные) - представляют собой размещаемые в Сети базы данных с адресами ресурсов. Они характеризуются масштабами накопленной информации и охватом тематик.

Устройство каталогов Все каталоги Интернет построены по принципу «от общего – к частному» и обладают древовидной структурой. Зайдя на титульную страничку любого каталога, вы сразу же увидите перечень основных категорий – «Компьютеры», «Музыка», «Наука» и так далее. Щелкните по любой ссылке и вы окажетесь на новой странице, которая, в свою очередь, предложит вам список подразделов. Так, постепенно сужая тему, вы и сможете добраться до странички с перечнем ссылок на интересующие вас сайты.

Пример структуры каталога Развлечения Игры … Ролевые игры … Коды, советы Универсальные …

Каталог List.ru (Mail.ru)

Поиск по каталогу Существует и более простой способ поиска информации в каталоге – по ключевым словам или фразам. Зайдя на титульную страничку каталога, обратите внимание на пустую строку. Снабженную кнопкой с надписью типа «Find» (Найти), «Go» (Перейти) и так далее. В этой строке вы можете набрать свой запрос, состоящий из слов или сочетаний, которые по вашему мнению, должны присутствовать на искомой странице.

Виды каталогов Каталоги бывают общие и специализированные – посвященные, определенной теме (туризму), группе лиц (детям, женщинам) и так далее.

Общие каталоги 1. List.ru - ( ) В 2001 году этот каталог утратил свою независимость, войдя в состав мощного информационного портала Mail.ru. Количество ссылок здесь превышает 100 тысяч. Его создатели подходят к отбору кандидатов очень строго.

Общие каталоги 2. Narod.ru - ( Портал Narod.ru, входящий в систему поисковика Яndex, бесплатно предоставляет всем желающим место для размещения «домашних страничек». Здесь хранится подавляющее большинство персональных сайтов России. В данном каталоге, включающем около 12 тысяч записей, вы найдете информацию о лучших страничках, размещенных на этом сервере.

Общие каталоги 3. Яndex.ru ( Каталог доступен также с главной страницы Яндекса. Один из самых больших каталогов на сегодняшний день. В каталоге описаны десятки тысяч ресурсов. Ежемесячно с каталогом работают более двух миллионов пользователей. Автоматическая система регулярно проверяет ссылки на предмет доступности и снимает с публикации те, которые уже не действуют. В каталоге также можно хранить Закладки - каталог ваших любимых ссылок, доступный в любом месте, где есть интернет.

Общие каталоги 4. Yahoo – ( Лучший мировой каталог сетевых ресурсов. Работать с базой данных Yаhoo, включающей несколько миллионов страниц, можно в трех основных режимах – подробнее…подробнее…

Yahoo – ( Два из них – с помощью запроса через строку поиска и с помощью путешествия по «дереву» категорий. Воспользовавшись обычной поисковой строкой – помимо списка страниц, Yahoo предлагает вам также список тематических категорий, разделов, в которых может находиться нужная вам страница! Третий режим работы каталога – некоторые тематические разделы базы данных могут функционировать в качестве совершенно автономных каталогов с собственным интерфейсом и инфраструктурой! И таких самостоятельных каталогов в Yahoо не менее полутора сотен.

Специализированные каталоги Примером специализированных каталогов могут служить различные каталоги научных ресурсов. Обратите внимание на каталог Search Kit ( Этот каталог содержит ссылки более чем на 150 мировых и 50 русскоязычных поисковиков, рейтингов и каталогов – при этом отправить запрос на любой из них вы можете через форму, расположенную прямо на странице каталога. Также вам может быть полезен каталог студентов (

Ftp-поисковики На Ftp-серверах находится множество полезных файлов, но отыскать нужный бывает очень непросто. При поиске нужного файла на Ftp- серверах пользователь должен обязательно знать хотя бы несколько символов, находящихся в имени нужного файла

Поиск файлов Аналогично тому, как в WWW существуют и интенсивно трудятся поисковые машины и поисковые каталоги, в мире FTP также активно используются специальные поисковые серверы.

Один из самых популярных российских Ftp-поисковиков – FTPindexer.ru ( В его базе данных сейчас свыше полутора тысяч FTP- серверов.

FileSearch.ru ( Он позволяет проводить поиск файлов определенного типа – изображений, видео- и МР3- файлов, - а также указывать регион поиска. В базе данных этой ИПС числится свыше 77 млн. файлов общим объемом почти 34 Тбайт.

Существуют, конечно, и другие поисковые сервера: Rambler FTP Search ( FreeWare FTP Search ( Napalm FTP Indexer ( Oth.Net ( ).

Поиск рефератов – Московская коллекция рефератов – Центральный Банк Российских Рефератов – Российская коллекция рефератов

Служба "Яндекс.Картинки" автоматически собирает картинки находящиеся в Рунете в стандартных графических форматах: Jpeg gif png Поиск рисунков

Материалом для текстового поиска служат : подписи к картинкам и ссылки на них; тексты коротких документов, обрамляющих одиночную картинку; имена файлов и скриптов, в том числе с учетом упрощенного подстрочного перевода.

При поиске существует возможность задать желательный размер картинки.

Картинки группируются по площади: " Мелочь" до 1000 квадратных пикселей "Маленькие" от 1000 до квадратных пикселей "Средние" от до квадратных пикселей "Большие" от до квадратных пикселей "Огромные" свыше квадратных пикселей

Из базы "Яндекс.Картинки" по возможности исключаются баннеры и копии (одинаковые изображения). В результатах поиска выдается не более одной картинки от одного сайта, остальные доступны по ссылке "еще с сайта". Также по ссылке доступна расширенная информация о картинке

Поиск информации на своей собственной машине Средствами Windows Специализированными программами

Литература В.П. Леонтьев «Новейшая энциклопедия Интернет» - М. «Олма – Пресс», М. Хэлворсон. Эффективная работа с Microsoft Office. Санкт-Петербург: Питер, Байков В.Д.,Предтеченский А.Г. Интернет: первые шаги в России.- М.:Изд-во Буковского, с. Байков В.Д. Интернет от к WWW в примерах.-Спб.:BHV-Санкт- Петербург, с.:ил.