Технологии поиска с помощью ИПС Google. Поиск в Google – выполняется поиск в Web, выдается 10 адресов на первой странице результатов поиска, остальные.

Презентация:



Advertisements
Похожие презентации
Социальный поиск Максим Постников, руководитель проектов
Advertisements

БИЦ (библиотечно- информационный центр) МОУ гимназия 28 г. Костромы Поиск информации в Интернете. Поисковая система Яндекс.
Сервис Интернет Коммуникационные и информационные службы.
Что такое Internet?. Internet самая большая и самая известная в мире сеть, объединяющая миллионы компьютеров в огромную сеть сетей, предоставляющая неограниченный.
:15 Возможности Интернета 1. Безграничные возможности Интернета Internet - всемирная система объединённых компьютерных сетей, которая образует.
Назначение и струкутура сети Интернет Компьютерные телекоммуникации.
Наиболее популярные ресурсы Интернета это Всемирная паутина Электронная почта Файловые архивы Общение в Интернете Мобильный Интернет.
Практическая работа. В Интернете существуют десятки тысяч конференций или групп новостей (news), каждая из которых посвящена обсуждению какой- либо проблемы.
Тест по информатике. 1. Что называется файлом? 1.программа, которая переводит язык программирования в машинный код 2.программа, которая служит для подключения.
Разработка учителя информатики и ИКТ МОУ «Майская гимназия Белгородского района» Токарь Татьяны Васильевны Разработка учителя информатики и ИКТ МОУ «Майская.
Учитель математики, информатики и ВТ Земскова В.Х п. Кушокы.
МОУ Павловск ая СОШ 3 Ученица 10 «А» класса Василенко Оля Руководитель Пинчукова М.В года.
© Сидорова Л.В., БГУ Интернет и всемирная паутина.
Сервис Интернет Коммуникационные и информационные службы Уланкина Татьяна.
Демонстрационный материал к уроку"Электронная почта и другие услуги сетей" Электронная почта и другие сервисы компьютерных сетей Назначение электронной.
И н т е р н е т Выполнил студент 1 курса, группа С-12, Курбетьев Александр.
С Е Р В И С Ы ИНТЕРНЕТ. Глобальная сеть Интернет привлекает пользователей своими информационными ресурсами и услугами Глобальная сеть Интернет привлекает.
World Wide Web WWW. Популярнейшая служба Интернета - World Wide Web (сокращенно WWW или Web), еще называют Всемирной паутиной. Представление информации.
Поиск информации с использованием компьютера. Поиск папок и файлов на компьютере Если пользователь не помнит, в каком именно месте он сохранил папку или.
Поиск в русскоязычном Интернете. Поисковая система Я ндекс.
Транксрипт:

Технологии поиска с помощью ИПС Google

Поиск в Google – выполняется поиск в Web, выдается 10 адресов на первой странице результатов поиска, остальные на следующих страницах

Мне повезет! – выдается только один результат – самый релевантный сайт, по мнению Google, соответствующий запросу Запрос: проектирование информационных систем Загрузка сайта: Запрос: АлтГУ Загрузка сайта:

Анализ результатов поиска по запросу проектирование информационных систем Google учитывает скорость собственной обработки запроса и не учитывает задержки серверa провайдера и низкую скорость связи Модем и обычная телефонная линия - скорость загрузки 2-3 Кбайт/с, весь документ появится на на мониторе через с.

Из БД Google загрузится снимок экрана страницы, сделанный при индексировании снимок экрана страницы «+» Страница загружается быстрее При этом каждое слово запроса отображается на отдельном цветном фоне, что позволяет быстро найти среди документов страницы нужный. «-» С момента сохранения она может измениться, и нужная информация может быть недоступна

После щелчка на ссылке Похожие страницы, Google предложит посетить страницы посвященные похожим темам.

Рекомендации по поиску в Google Поиск выполняется БЕЗ учета регистра - все буквы, рассматриваются как строчные. Например, результаты по запросам владимир набоков, Владимир Набоков и вЛаДиМир НаБоКоВ будут совпадать. Оператор «and» между словами запроса вводить не нужно. Порядок расположения слов влияет на результаты поиска. Для сужения области поиска, нужно задавать дополнительные условия. Игнорируются: общие слова и символы на некоторых языках («где» и «как»), некоторые одиночные цифры и буквы (они замедляют поиск и не влияют на качество результатов). При необходимости общее слово его можно включить в условие поиска: -поставив перед ним пробел и затем знак «+» -использовать это слово в словосочетании, -поместить два или более слов в кавычки. Для исключения слова из запроса (условие поиска имеет несколько значений) можно поставив знак минус «-» перед исключаемым словом Поиск по словоформам (морфологический поиск)

Расширенный поиск Расширенный поиск – поиск с расширенными возможностями по повышению релевантности результатов с помощью графического интерфейса. С помощью расширенного поиска можно искать только те страницы, которые: содержат ВСЕ введенные условия поиска; содержат точное словосочетание; содержат хотя бы одного из введенных слов; НЕ содержат ни одно из введенных слов; написаны на определенном языке; созданы в определенном формате; были изменены в определенный период времени; содержат числа из определенного диапазона; находятся на определенном домене или веб-сайте; не содержат материалов, предназначенных только для взрослых.

Безопасный фильтр удаляет из результатов поиска сайты, содержащие материалы непристойных сайтов. Уровени настройки Безопасного поиска: Умеренная фильтрация - настройка задана по умолчанию - удаляет большинство непристойных изображений из результатов поиска Картинок и не влияет на обычные результаты веб-поиска. Строгая фильтрация - применяется ко всем результатам поиска (включая поиск картинок и обычный веб-поиск). Показывать всё - фильтр Безопасного поиска полностью отключен. Установленные настройки не выполнятся, если обозреватель не принимает cookies

Для ограничения или запрета загрузки файлов cookies на компьютер или ограничения наиболее агрессивных из них, разрешив загрузку остальных в браузере нужно изменить уровень конфиденциальности: В Internet Explorer выполнить команду Сервис, Свойства обозревателя, Конфиденциальность. Установить Средний уровень или Умеренно высокий. Если уровень конфиденциальности Высокий, то сделанные настройки действовать не будут

Поиск изображений После ввода запроса и щелчка на кнопке Поиск в Google выполняется загрузка миниатюр – уменьшенных копий найденных изображений (по умолчанию первых 10)

Если запрос введен на русском языке, то большинство ссылок будет указывать на русскоязычные сайты. Для увеличения количества ссылок в результатах поиска, предмет поиска и слова-исключения нужно указывать еще и на английском языке

Поиск с помощью каталога

Каталог Google относится к категории Открытый каталог. Его формированием занимается большое количество энтузиастов всего мира, в нем мало ссылок на несуществующие сайты. При ранжировании ссылок каталога Google использует собственный механизм PageRank. PageRank - рекурсивно определяет важность данной страницы на основе информации о ссылающихся на нее страниц вычисляется один раз глобально для всех страниц в индексе

Темы каталога Google отличаются от рубрик библиотечной классификации, принятой в России, и от рубрик УДК (универсальной десятичной классификации).

Рядом со ссылкой на каждый сайт указывается его адрес или одну из Web-страниц и кратко описывается содержимое включенного в каталог ресурса. Количество ссылок на релевантные документы будет больше на более высоком уровне подрубрики. Web-узлы на заданную тему перечисляются в порядке их значимости (с точки зрения редакторов каталога). Возможна сортировка по посещаемости, дате открытия и другим критериям

Отбор ресурсов Internet в каталоге, ведут редакторы, это сказывается на объективности ранжирования сайтов Некоторые сайты не упоминаются в каталогах из-за их неприличности - степень субъективно определяет редактор каталога Обновление каталогов происходит достаточно медленно

Поиск в группах новостей Группы новостей | сетевые конференции | телеконференции | конференции | новости Категорию новости Google обозначил - Группы. Сервис Usenet доступен через почтовые программы, а многие конференции через Web- страницы. Такие конференции стали называть форумы или доски объявлений. Варианты для поиска нужной конференции : от коллег, единомышленников, друзей и др. по имени конференции

Используя Usenet, можно получить доступ к десяткам тысяч новостей, ни одна Web- страница не предоставляет такой сервис. Участвуя в группе новостей, можно загрузить на свой компьютер архив сообщений, при необходимости вторично прочитать некоторые из них, а потом уже отправлять в группу новостей свою статью (так называют письма или сообщения, публикуемые в сетевой конференции).

Во многих группах новостей соблюдают правила сетевого этикета: запрещены реклама и ненормативная лексика, нельзя оскорблять собеседников и занимать их время пустой болтовней (флейм). За соблюдением правил следит модератор группы новостей, причем некоторые дополнительные правила могут действовать только в конкретной конференции.

Распространение сообщений телеконференций осуществляют специальные серверы новостей. Они работают с использованием протокола NNTP, их часто называют NNTP- серверы. Сервер новостей провайдера периодически получает сообщения телеконференций с других NNTP-серверов и передает на них сообщения от пользователей, участвующих в телеконференциях через сервер данного провайдера. Каждый поставщик услуг Internet сам решает, какие телеконференции будет поддерживать его NNTP-сервер Из более чем 70 тысяч телеконференций, существующих в мире, провайдер поддерживает обычно 1-8 тысяч.

Распространение сообщений телеконференций осуществляют специальные серверы новостей. Они работают с использованием протокола NNTP, их часто называют NNTP- серверы. Сервер новостей провайдера периодически получает сообщения телеконференций с других NNTP-серверов и передает на них сообщения от пользователей, участвующих в телеконференциях через сервер данного провайдера. Каждый поставщик услуг Internet сам решает, какие телеконференции будет поддерживать его NNTP-сервер Из более чем 70 тысяч телеконференций, существующих в мире, провайдер поддерживает обычно 1-8 тысяч.

Имя конференции состоит из нескольких частей, разделенных точками: первая часть имени указывает категорию конференции, остальные ее конкретизируют. alt – наиболее популярные группы новостей,свободны в публикуемых высказываниях и в лексике. сalt, binaries – могут содержать двоичные файлы (программы, аудиофайлы и рисунки) доменное имя страны –конференции проводятся соответственно в масштабах указанной страны.

Многие русскоязычные группы новостей начинаются с префикса relcom (их поддержку первоначально обеспечивала отечественная сеть Релком) fido7 (сеть Фидонет не является частью Internet и работает совершенно по другим принципам) – около 3 тыс. конференций. В группах новостей fido следят за соблюдением правил сетевого этикета, кроме pvt.

По названию конференции часто можно определить регионее участников: fido7.mo - Москва и окрестности, fido7.spb -Санкт-Петербург, fido7. ru - общероссийская конференция, fido7. su - СНГ. Например, меломаны могут участвовать в русскоязычных конференциях fido7.su.music, fido7.su.music.news, fido7.su.music.chainik и ряде зарубежных.

Для новичков, рекомендуются конференции, название которой содержит слова chainik newbies newuser. Часто в конференции даже для опытных участников публикуют файлы с названием FAQ (часто задаваемые вопросы) или, в русскоязычных конференциях, ЧаВо (ЧАстые ВОпросы).

В архиве Google хранится (по состоянию на середину 2005 г.) около 900 млн сообщений конференций, опубликованных с момента создания последних

Тематический поиск / / Под тематическим поиском понимается поиск документов определенного вида – текстов, изображений, телепрограмм, спутниковых карт и т.д. – и в определенных местах, например, в базах данных, на FTP-серверах, группах новостей и т.д.

Категории тематического поиска Google

Страница новостей Google для поиска новостей просматривает около 4500 ресурсов

Поиск для ученых и учащихся Проект Google Scholar предназначен для учащихся, для американских и западноевропейских ученых, представлен в виде бета-версии Google Scholarhttp://scholar.google.com Цель проекта - поиск учебной и научной литературы, статей, тезисов, книг, рефератов и технических отчетов по всем областям знаний.

Google Maps – – предоставление карт в онлайн-режиме, действует только для США, Канады и Великобритании. Например, по запросу pizzain San Jose (пицца в Сан-Хосе, США, шт. Калифорния) на карте будут обозначены пиццерии и даже указаны их телефоны.

Спутниковые фотографии Для просмотра определенного района нужно ввести его название в строке поиска. Для того чтобы найти спутниковую карту, например Москвы, нужно на странице отыскать ссылку Satellite и на открывшейся странице ввести запрос Moscow, Russia (или даже просто Moscow)

Фотографии Луны Проект запущен 20 июля 2005 года, спустя ровно 36 лет после первой посадки человека на Луну. Проект представляет систему навигации по космическому снимку лунной поверхности, выполненную на базе картографического сервиса компании GoogleбMaps.

Специальный поиск Поиск информации, необходимой только специалистам или группам людей определенного рода занятий Например, абитуриентам, выбирающим учебное заведение, в котором они хотят продолжить учебу

Поиск университетов (University Search) Представлены в алфавитном порядке названия университетов, список ссылок на их сайты Поиск программ различных читаемых в университетах (институтах, колледжах) курсов, условия поступления и оплаты учебы и т.д.

Правительство США Поиск документов на Web-узлах правительственного уровня, уровня штатов и муниципального уровня в доменах gov, mil, com Индексируются все сайты, имеющие отношение к правительству, политике, законам и т.д.

Компьютеры и программирование Предназначены для специалистов по информационным технологиям, студентов и для интересующихся различными платформами и программированием для них.

Общественные услуги Некоммерческим и образовательным учреждениям всего мира Google позволяет бесплатно использовать свою технологию SiteSearch для того, чтобы пользователи могли находить их сайты в Internet, и технологию WebSearch для того, чтобы их посетители могли проводить поиск в Internet.

Телефонная книга Тем, кто хотел бы найти знакомых, родственников либо деловых партнеров в США, может помочь служба PhoneBook. Чтобы узнать телефон какой-либо фирмы, нужно ввести в поле запроса ее название, а также название города или штата, где она расположена. Поиск может осуществляться также по названию фирмы и ее почтовому индексу (zip-коду). Возможен и обратный поиск: по номеру телефона и коду города можно получить сведения о фирме. Чтобы узнать чей-либо адрес в США, нужно ввести в поле запроса данные в одной из следующих комбинаций. Первое имя (или первый инициал), фамилия, город (опционально еще и штат). Первое имя (или первый инициал), фамилия, штат. Первое имя (или первый инициал), фамилия, телефонный код города (местности). Первое имя (или первый инициал), фамилия, zip-код. Номер телефона с кодом города (местности). Фамилия, город, штат. Фамилия, zip-код.

Поиск по номеру В основном эта служба интересна жителям США, например, введя в поле запроса номер посылки, которая была отправлена почтой или одной из служб срочной доставки, можно узнать, где в данный момент находится посылка. Возможен поиск и по другим номерам. Например, по номеру авиарейса можно узнать, отложен он или нет. Для ученых, инженеров и изобретателей стран СНГ эта служба интересна тем, что может найти патент (или какую-то информацию о нем) по номеру патента. Перед номером патента следует ввести слово patent: patent

Другие сервисы: –Проверка орфографии –Карта города –Летайте самолетами... –Ссылки на ваш сайт –Погода... но только в США

Поиск людей - интернет-коллекция сведений о людях России « Всероссийское Генеалогическое Древо» >> - База данных лица России

- поиск людей - информационно- поискового портала Адресное.ру - бюро находок Гуманитарный проект «Поиск 24» разработан и запущен в 2001 г. фирмой K&D (Hannover), специализирующейся на этническом маркетинге в русскоязычном сегменте Германии

- поиск одноклассников - проект был запущен в начале марта 2006 года и рассчитан на самую широкую русскоязычную аудиторию, как в России, так и за ее пределами, количество пользователей

- биографии и жизнь Людей

– информация об известных людях

Социальный поиск на mail.ru Современные проблемы поисковых систем Нежелательные результаты в выдаче Неполнота выдачи Неестественный язык запросов Общение с машиной, а не с живым человеком –Часто нужна информация, которой вообще нет на сайтах. Нужно спросить совета, или попросить кого-то поделиться опытом. Иногда нужно найти знающих людей.

Механизм социального поиска Пользователь может: Задать вопрос, поместив его в общую базу данных. Просмотреть существующие вопросы, распределенные по категориям. Ответить на любой открытый вопрос. Оценить вопросы и ответы других пользователей. Лично пообщаться с любым пользователем

Необходимые условия работы Критическая масса пользователей Система индикаторов доверия Сообщество постоянных пользователей с высокими показателями Механизм мотивации пользователей почти 24 миллиона пользователей Mail.Ru сбалансированная система КПД десятки тысяч продвинутых участников с высоким рейтингом система баллов и рейтингов

Типы пользователей социального поиска Обычные пользователи Отвечают на вопросы с главной страницы и на вопросы легких категорий. Качество ответов – среднее. Среднее время появления ответа – несколько секунд. Специалисты Предпочитают отвечать в своих сферах компетенции. Качество ответов – высокое. Среднее время появления ответа – несколько минут. Профессионалы Отвечают только в «своих» категориях. Качество ответов – очень высокое. Среднее время появления ответа – часов минут.

Типы пользователей

Типы поисковых запросов Навигационные (~30%) пользователь ищет конкретный сайт (к примеру, сайт компании). Примеры: Samsung, Конференция по оптимизации, Райффайзенбанк, Sting. Информационные (~50%) пользователь ищет просто информацию о чем-то. Эта информация может быть представлена на разных сайтах. Сам сайт в данном случае не играет роли. Примеры: Приколы, рецепты десертов, фотографии бабочек Транзакционные (~20%) пользователь сообщает поисковой машине, что хочет найти сайты содержащие конкретные объекты и возможность произвести с этими объектами конкретные действия: Примеры: Музыка mp3, купить книгу, скачать программу, загрузить заставку для рабочего стола.

Навигационные и транзакционные запросы Навигационные запросы Здесь машинный поиск справляется, безусловно, лучше за очень редким исключением. Например, с запросом «официальный сайт BMW» русские поисковики справились плохо. Транзакционные вопросы Социальный поиск дает доступ к опыту других пользователей. Социальный поиск дает более чистые результаты Например запросу «где бесплатно скачать MP3». В выдаче машинного поиска пользователь станет жертвой борьбы оптимизаторов за трафик. Социальный поиск даст реальные результаты.

Информационные запросы Преимущества социального поиска: Можно сформулировать запрос максимально точно на понятном языке Нет необходимости переходить на другие сайты Есть возможность связаться напрямую с человеком, ответившим на вопрос Пользователи сообщают даже больше чем нужно Реальные примеры запросов с проекта Что с машиной: стреляет в карбюратор? Что такое коллаген? Как быстро вылечить насморк? Почему человек хочет спать? На сколько процентов человек состоит из воды?

Человеческие запросы Реальные примеры с проекта А кто работает курьером, и расскажите, как вам работается? Какое соотношения ват к амперам, если аппарат потребляет 1000вт. сколько это ампер? Скажите, как выставить диафрагму и выдержку для съемки дома днем, и для съемки дома вечером при включенном свете? Какие витамины, и как часто вы употребляете и какие улучшения заметили? Кто был зимой в Хургаде? Там холодно? Ветрено? Купаться можно? Темнеет рано?

Услуга «Тематические эксперты» Эксперт: получает уведомления о всех вопросах своей категории. имеет право отвечать неограниченное количество раз. имеет право упоминать свои товары и услуги, если они соответствуют вопросу. К ответам экспертов добавляется: –ссылки на сайт (не закрываемые тегами NOINDEX и NOFOLLOW). –короткий рекламный текст. –логотип.

Сейчас на проекте Более 900 тысяч вопросов (из них 16 тысяч открыты и ждут ваших ответов). Более 8 млн. ответов. Более 1,5 млн. зарегистрированных пользователей. Каждый день на проекте задается более 17 тысяч вопросов и дается около 160 тысяч ответов.