Канн С.К. Информационный поиск в Интернете: ресурсы, технология, возможности (Екатеринбург, 2013)

Презентация:



Advertisements
Похожие презентации
П О И С К О В Ы Е П О И С К О В Ы Е СИСТЕМЫ СИСТЕМЫ.
Advertisements

Информационно- поисковые машины и системы.. Поисковая машина комплекс программ, предназначенный для поиска информации. Обычно является частью поисковой.
Поиск информации в сети Интернет Катерина Ефимова «Информационная эвристика» НБ УрГУ.
Учитель математики, информатики и ВТ Земскова В.Х п. Кушокы.
Поиск информации в Интернет (web). Способы поиска информации в web Поиск информации – одна из самых востребованных на практике задач, которую приходится.
Презентация разработана Студенткой группы ПИ-1 Гукасовой А.С.
Поиско́вая систе́ма программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. В просторечии.
1 Сервисы для читателей научной периодики на платформе eLIBRARY.RU Минск, октябрь 2012.
Электронные журналы и газеты. Подписка на электронные газеты и журналы (2011 год) 1. Научная электронная библиотека (НЭБ) (elibrary.ru) – 122 журнала.
Средства поиска информации в Internet С точки зрения пользователя, поисковая система это обычный сайт на главной странице которого находятся разбитые по.
Пополнение информационных ресурсов Интернета происходит высокими темпами, и найти необходимую информацию становиться всё труднее.
Программная система «Портал научной группы» (разработано в рамках ПНР-5) 24 марта 2011 г. Челябинск Южно-Уральский государственный университет 1.
Глобальная сеть Интернет и её информационные сервисы: Авторы: ученик 10 «А» класса Близняков Александр ученица 10 «А» класса Тихомирова Анна ученик 10.
1 Международный Информационный Центр для библиотек, издательств и книжной торговли представляет систему: EBSCOhost ® Electronic Journals Service (EJS)
ОСНОВНЫЕ ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ И ИХ РЕАЛИЗАЦИЯ С ПОМОЩЬЮ КОМПЬЮТЕРА 1 часть - поиск информации.
по всемирной паутине ИНФОРМАЦИЯ И ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ.
Система поиска и оценки научно-технической информации Зуев Иван К.б.н., доцент кафедры водных и наземных экосистем СФУ.
Продвижение сайта Контекстные переходы оплата за переходы на сайт рекламодателя формат: текстово-графический блок Контекстные показы оплата за показы.
Электронная почта Определение Электронная почта ( - electronic mail) - средство обмена информацией, подготовленной в электронном виде, между людьми,
ИНТЕРНЕТ как ресурс образовательной деятельности.
Транксрипт:

Информационный поиск в Интернете Ресурсы технология возможности

2 Классификация веб-ресурсов (разные подходы) По форме: а) текст б) графика в) мультимедиа По содержанию: а) справочные материалы б) библиография в) полные тексты г) мультимедийные материалы По доступу: а) свободный (free) б) условно-доступный (trial, shareware) -> регистрация в) закрытый (login/password = имя/пароль)

3 Техническое представление веб-ресурсов а) в виде текстов, списков и указателей (одной или ряда статических html- страниц), а также б) веб-ориентированных и обычных баз данных ( динамические ресурсы) Технически веб-ресурсы могут быть представлены в двух основных видах:

4 Смешанный контент nauka.relis.ru Большинство сайтов, особенно российских, представляют информацию, сочетающую различные формы представления и преимущества мультимедиа

5 Разное представление веб-ресурсов Например, на сайте старых газет находятся издания формата HTML и DjVu (плагин ДежаВю доступен только для обозревателя MSIE) Формат DjVu сочетает достоинства других, более старых форматов oldgazette.ru

6 Технология поиска компьютерной и веб-информации 2 основных типа (способа) поиска информации: a) browse (пролистывание или просмотр ссылок) b) search (поиск с помощью окна – «search box») 3 основных уровня поиска: а) глобальный (по www) б) корпоративный (по сайту) в) локальный (по файлу)

7 Инструменты поиска веб-информации Каталоги и коллекции ссылок List.Ru --- list.mail.ru Апорт Yahoo! Поисковые машины Google Rambler Yandex Специализированные и мета-машины Scirus MetaBot.Ru com.ua MetaSearch --- search.freeland.ru Топ-листы и рейтинги Rambler's Top top100.rambler.ru/top100

8 Типология поисковых машин «Движки» (engines) – классические поисковые машины: Google, AltaVista, AllTheWeb Мета-поисковые машины – объединяют в едином поиске результаты нескольких «движков»: MetaCrawler, SearchAllinone Порталы – мощные узлы, совмещающие «движок» с веб-каталогом и другими сервисами Специализированные машины (по отраслям знаний)

9 Программы-роботы Поисковые сервисы ("движки") основаны на использовании большого числа индексирующих программ-роботов и составлении много миллионных словарей (индексов) Поисковые системы регистрируют своих роботов и их свойства в специальных справочниках (The Web Robots Pages)

10 Как действуют роботы У каждой крупной поисковой машины есть десятки роботов В результате индексировани я формируются словари и хранилище документов Поведением робота можно управлять с помощью особого файла robots.txt на сервере

11 AltaVista - передовые технологии AltaVista - пионер на рынке интернет-поиска. Компания была основана в 1995 году фирмой Digital Equipment (Пало Альто). Компания первой разработала полнотекстовый поиск Поисковик - крупнейший патентовладелец поисковых технологий, которые базируются на 57 патентах Лидер в многоязычных технологиях В июле 2002 запущен мощный вспомогательный инструмент - AltaVista Prisma (запрос фокусируется на наиболее подходящих "топиках")

12 Поисковые результаты Весной 2005 г. компании Did-it, Enquiro и Eyetools провели уникальное психо- физиологическое исследование, в результате которого определились зоны наибольшей концентрации внимания посетителей поисковых машин С помощью веб-камеры и программного обеспечения Eyetools, способного следить за движениями глаз, был обнаружен "золотой треугольник" в результатах поиска Первые 3 строчки фокусируют взгляд всех пользователей (100%), 4-я - 85%, 5-я - 60%, 6-я и 7-я - 50%, а 10-я - только 20%. Эти данные ставят проблему редизайна сайтов

13 " Поисковая машина всех времен и народов" Крупнейшая в мире поисковая система Google родилась 7 сентября 1998 г. Через 3 дня выпускники Стэнфорда Ларри Пейдж и Сергей Брин встретились с основателем Sun Microsystems Энди Бехтольшаймом и после недолгого разговора и демонстрации системы получили чек на 100 тыс.$ на имя Google Inc. Google ищет информацию на 100 языках, среди десятков миллиардов документов и изображений О нем говорят: «Google – это ближайшее место в Интернете, где можно найти ответ на любой вопрос»

14 Google - самый дорогой бренд мира Google лидирует в рейтинге 100 самых ценных брендов мира, опубликованном компанией Millward Brown Optimor третий год подряд Стоимость бренда Google - $86 млрд. (на 30% больше, чем в 2007 г.) На 2-м месте - General Electric - $71,4 млрд., на 3-м - Microsoft - $70,9 млрд. Российская МТС заняла 89-е место бренд (brand) - торговая марка, получившая известность на рынке

15 Инструменты поиска Google Поиск «Мне повезет» Поиск по указанному сайту Поиск «фраз» Поиск в блогах Поиск картинок Сервис перевода Другие средства

16 Поиск в Google Гугл «любит» сайты простые, но индексирует любые типы файлов - pdf, asp, jsp, html, shtml, xml, cfm, doc, xls, ppt, rtf, wks, lwp, wri, swf, cfm и php поиск нечувствителен к регистру (т.е. к ПРОПИСНЫМ или строчным буквам) различные формы слова, или усечение «звездочкой» (*), Гугл не поддерживает основа технологии Гугла – PageRank – ранг страницы (алгоритм расчета ее авторитетности и показатель в численном выражении)

17 Что может Google Мониторинг наиболее популярных запросов: zeitgeist.html Поиск изображений (картинок) самого разного вида – по размеру, цветности, типу файла Перевод файлов разного типа в HTML Сохранение архивных копий страниц Расширенный поиск – по типам файлов, только по определенному домену

18 Расширенный поиск в Google Расширенный поиск позволяет вводить запрос по одному или многим словам, а также по фразе, не задумываясь о синтаксисе Можно искать разные типы файлов или указывать место расположения термина в определенной части документа (напр., в заголовке) Поиск можно ограничить определенным доменом

19 « Хитрости» поиска в Google Фраза пишется как в кавычках, так и связкой всех слов дефисом: хитрости- поиска-в-Google можно также употреблять точки и двоеточие: хитрости.поиска.в.Google хитрости:поиска:в:Google поиск с использованием выдаст результаты, которые включают массив цифр: 2000, 2001, 2002 и так далее до 2007

20 Мета-поисковые машины Мета-поисковые машины используют «движки» для сбора информации, после чего выдают обобщенный результат, представленный в той или иной форме MetaCrawler Dogpile Vivisimo vivisimo.com Kartoo Mamma SurfWax

21 Российский мета-поиск Отечественные мета-машины кроме известных мировых «движков» (Google, Yahoo, MSN) используют также российские Апорт, Рэмблер MetaBot com.ua Punto punto.ru

22 Специализированные поисковые машины Специализированный поиск по научным публикациям (включая электронные) с января 1948 г. можно провести на сайте журнала "Science". Свободно доступны рефераты Наиболее мощным средством поиска научной информации является поисковая машина "Scirus", поддержкой которой занимается издательство Elsevier

23 Поиск иллюстраций и видео Особые поисковые средства позволяют искать в Интернете «картинки» и видеоклипы Популярность этих средств обращает на них внимание рекламы Многие зарубежные компании создают русскоязычные «зеркала» своих баз данных

24 Поиск видеоклипов и видеофрагментов Работа с сайтами, распространяющими видео (как и бесплатную музыку) должна быть предельно осторожной Как правило, именно подобные сайты распространяют вирусы и другие запрещенные материалы

25 Другие виды поиска Варез (англ. warez сленговая версия «wares», сокращённого множественного числа от «software» «программное обеспечение») коммерческая программа, распространяемая бесплатно (реже на носителях за символическую плату) незаконным путем без разрешения автора. Обязательно содержит изменения и/или дополнения, позволяющие использовать ее бесплатно Warez-поиск Поиск программного обеспечения (софта), компьютерных игр, фильмов и пр.)

26 Персональный поиск На сайте «Одноклассники.Ру» можно найти контактную и другую информацию о друзьях, знакомых и незнакомых людях

27 Другие типы поисковых ресурсов Энциклопедии поисковых систем Компьютерные и интернет- журналы Ленты новостей (технология RSS) Рассылки Блоги (ЖЖ)

28 Проект «Плюс 7» Согласно идее проекта предлагается внедрить адресную нотацию, где идентификаторами пользователей могут быть номера их телефонов (городских или мобильных) в этой системе адрес служебной веб- страницы Отделения ГПНТБ СО РАН представлен как

29 Энциклопедии поисковых систем Searchenginewatch searchenginewatch.com SearchList searchlist.hut.ru SearchEngines SeoNews Содержат обзоры, пресс- релизы, новости о развитии средств поиска и навигации в Интернете. Среди них – немало любительских (недостаточно профессиональных)

30 Компьютерные и интернет-журналы КомпьютерПресс Cnews F13 (Новосибирск) f-13.ru Публикуют новости, статьи о новых информационных технологиях