Исследование строения и динамики развития научного веб-пространства на примере СО РАН Клименко О.А. Петров И.С. Новосибирск, 30 ноября - 3 декабря 2010.

Презентация:



Advertisements
Похожие презентации
Российская академия наук Карельский научный центр Институт прикладных математических исследований Развитие программных сервисов и контента ЭБ КарНЦ РАН.
Advertisements

Спецкурс СДМ 01 «Технологии специализированных баз данных для вебометрических исследований» Лектор: Печников Андрей Анатольевич, ведущий научный сотрудник.
Вебометрические индикаторы и ранжирование сайтов Группа Cybermetrics Lab.Cybermetrics Lab Cайт Webometrics Ranking of World Universities.Webometrics Ranking.
Моделирование как метод познания Моделирование это метод познания, состоящий в создании и исследовании моделей.
Индивидуальный отчёт о научной деятельности в 2010 году Гуськов Андрей Евгеньевич К.т.н., н.с. Лаборатория информационных ресурсов.
Поиск информации в Интернет (web). Способы поиска информации в web Поиск информации – одна из самых востребованных на практике задач, которую приходится.
База данных внешних гиперссылок Гостевой вход: guest/guest.
Инструментальные средства создания Web-сайтов
Научно-практическая конференция в МОУ СОШ 3 г. Черепаново Учебно-исследовательская работа учащихся Учитель иностранного языка Попова Елена Харисовна.
ИНФОРМАЦИОННЫЕ КОМПЬЮТЕРНЫЕ СЕТИ 9 КЛАСС. КОМПЬЮТЕРНАЯ СЕТЬ (англ. Net) – это совокупность компьютеров и других устройств, соединенных линиями связи и.
Учитель информатики Артеменко Т.В. Поиск информации в Интернет.
Тема. ПОИСК ИНФОРМАЦИИ И ПОИСКОВЫЕ СИСТЕМЫ Поиск информации в интернете. Типы поисковых систем. История развития. Работа поисковой системы.
1 Системный подход в моделировании. 2 Система является совокупностью взаимосвязанных объектов, которые называются элементами системы. Состояние системы.
Системный подход в моделировании. Типы информационных моделей. Цель урока: Сформировать понятия системы и ее состояния. Выделить основные типы информационных.
Поиск и просмотр информации в Интернет Служба World Wide Web предназначена для доступа к электронным документам особого рода, которые называются Web-документами.
Алгоритм Page Rank Тверь, 2012г.. Page Rank был представлен и опубликован Сергеем Брином и Ларри Пейджем на 7ой международной конференции World Wide Web.
Система управления электронными библиотеками Захаров А.А., Филиппов В.С. Вычислительный центр им. Дородницина РАН г. Москва.
Канн С.К. Модели развития библиотечных сайтов в свете вебометрики (Томск, 2018)
Структура создания слайда. Ключевые слова структура сайта навигация оформление сайта шаблон страницы сайта хостинг.
Основные понятия World Wide Web (W W W). WWW это сеть документов, связанных между собой гиперссылками. Каждый отдельный документ, имеющий собственный.
Транксрипт:

Исследование строения и динамики развития научного веб-пространства на примере СО РАН Клименко О.А. Петров И.С. Новосибирск, 30 ноября - 3 декабря 2010 г. XIII РОССИЙСКАЯ КОНФЕРЕНЦИЯ С УЧАСТИЕМ ИНОСТРАННЫХ УЧЕНЫХ "РАСПРЕДЕЛЕННЫЕ ИНФОРМАЦИОННЫЕ И ВЫЧИСЛИТЕЛЬНЫЕ РЕСУРСЫ" (DICR'2010)

Введение Проблема исследования научного веб- пространства является актуальной в связи со стремительным развитием сети интернет и научных ресурсов. В частности, эти исследования позволяют определить научные связи организации, ресурсы, которые наиболее интересны в научном сообществе, направления перспективных исследований.

Веб-пространство Под веб-пространством мы понимаем совокупность документов, представленных в сети Интернет и соединенных ссылками. Веб-пространство - новый тип информационной системы без централизованного контроля, без координированного индексирования содержания. Однако веб-пространство - не хаотическая система, в нем происходит самоорганизация в группы. Связи между документами устанавливаются с помощью ссылок. Изучение этих ссылок позволяет определить устройство веб-пространства.

Обзор текущих исследований Исследования веб-пространства ведутся лабораторией Cybermetrics Lab, которая принадлежит Consejio Superior de Investigaciones Cientificas – крупнейшему исследовательскому центру Испании. Другим центром исследования веб–пространства является Statistical Cybermetrics Research Group, на базе научной школы информационных технологий Вулвергемптонского университета, Великобритания. В России исследования проводятся в Институте прикладных математических исследований Карельского научного центра РАН.

Методы исследования веб-пространства Первый подход заключается в использовании возможностей поисковых машин, таких как Google, Yahoo, и др. Второй подход состоит в анализе данных с помощью методов вебометрики. Третий подход связан с написанием своей программы- крауера, которая путём обхода и анализа всех страниц на заданном множестве сайтов, выявляет связи между элементами множества.

Результаты работы В процессе работы было написано несколько версий краулера. Сначала однопоточная версия, потом многопоточная, где одновременно обрабатываются все сайты. Была разработана структура хранения данных на основе файлов, для экономии ресурсов системы. В последней версии программы учитываются только уникальные гиперссылки. Программа имеет большую точность работы. Краулер находится в стадии тестирования, но уже сейчас им удобно пользоваться, и его может использовать любой исследователь.

Результаты работы На основе собранных данных был построен ориентированный граф взаимосвязей. В этом графе G (V, E) узлы соответствуют организациям. Дуга (u, v) E; u, v V, если существует страница на сайте организации u, на которой находится гиперссылка на сайт организации v. На множестве дуг графа G также определено отображение N E : E N +.

Результаты работы Построены графы взаимосвязей: Всех организаций СО РАН Отдельные графы для каждого из научных центров СО РАН Отдельные графы для каждого из направлений научной деятельности Отдельные графы для интеграционных проектов СО РАН Было выявлено, что некоторые организации взаимно ссылаются друг на друга, другие организации имеют множество исходящих ссылок, третьи изолированы, а четвертые имеют много входящих ссылок, что говорит о ценности информации, размещенной на сайте.

Результаты работы Дополнительную информацию можно извлечь, используя поиск по ключевым словам, которые присутствуют в ссылках и заголовках страниц. На графах ясно видно какие сайты хорошо представлены в сети интернет, а какие слабо. Более того, наглядно видно как сайты различных организаций взаимодействуют друг с другом, и на основе этого можно сделать выводы, что в данный момент взаимодействие организаций СО РАН достаточно слабое.

0

Публикации Клименко О.А., Петров И.С. Исследование строения и динамики развития научного Веб- пространства на примере СО РАН // Труды XVI Байкальской Всеросийской конференции "Информационные и матетматические технологии в науке и управлении". Часть III. - Иркутск: ИСЭМ СО РАН, с.