Вебометрические исследования научных сайтов Печников Андрей Анатольевич к.ф.-м.н., ст.н.с. лаборатории телекоммуникационных систем ИПМИ КарНЦ РАН Выступление.

Презентация:



Advertisements
Похожие презентации
Вебометрические индикаторы и ранжирование сайтов Группа Cybermetrics Lab.Cybermetrics Lab Cайт Webometrics Ranking of World Universities.Webometrics Ranking.
Advertisements

Исследование строения и динамики развития научного веб-пространства на примере СО РАН Клименко О.А. Петров И.С. Новосибирск, 30 ноября - 3 декабря 2010.
Спецкурс СДМ 01 «Технологии специализированных баз данных для вебометрических исследований» Лектор: Печников Андрей Анатольевич, ведущий научный сотрудник.
База данных внешних гиперссылок Гостевой вход: guest/guest.
Являются ли сайты конференций RCDL научными веб-коммуникаторами? Печников Андрей Анатольевич Луговая Наталья Борисовна Институт прикладных математических.
Рейтинговое оценивание университетов Мировой и Европейский стандарт.
Исследование регламентируемых фрагментов российского Веба Печников Андрей Анатольевич, к.ф.-м.н., ст.н.с. Институт прикладных математических исследований.
Научные публикации в общедоступном Интернете Н.Н. Литвинова ведущий научный сотрудник управления комплектования фондов ФГУ РГБ.
Методология вебометрического ранжирования университетов Московкин Владимир Михайлович, д.г.н., проф. кафедры мировой экономики БелГУ; Крымский Илья Александрович,
Поиск данных. Постановка, организация, последовательность поиска МОУ СОШ 2 городского округа город Буй Костромской области.
Всеми́рная паути́на (англ. World Wide Web) это система (сеть), обеспечивающая доступ к информационным объектам, связанным между собой гиперссылками и.
Базы данных База данных – это информационная модель, позволяющая в упорядоченном виде хранить данные о группе объектов, обладающих одинаковым набором.
Сайт ВУЗа как образовательный интернет-проект: инструмент продвижения или научной и учебной работы? Москва, 2010.
ИНФОРМАЦИОННАЯ ЧУВСТВИТЕЛЬНОСТЬ КОМПЬЮТЕРНЫХ АЛГОРИТМОВ И ЕЁ КОЛИЧЕСТВЕННЫЕ МЕРЫ д.т.н., профессор М.В. Ульянов Кафедра «Управление разработкой программного.
Математические модели согласованного поведения малых Интернет-сообществ Печников А.А., Чуйко Ю.В. Институт прикладных математических исследований Карельского.
«Создание информационной системы, обеспечивающей разработку типологии субъектов Российской Федерации для целей проведения образовательной политики с учетом.
РОССИЙСКИЕ ВУЗЫ В МИРОВОМ ОБРАЗОВАТЕЛЬНОМ ПРОСТРАНСТВЕ ПО ОЦЕНКЕ РЕЙТИНГА «WEBOMETRICS» (июль 2007 – июль 2012) М.Д. Бершадская НИУ ВШЭ III международная.
1 Science Index: путь к успеху Как добиться объективного отражения публикаций организации в базах данных научного цитирования Смирнова Яна Юрьевна НАУЧНАЯ.
Докладчик: Денис Ванеев SEM-SEO.ru - Поисковая оптимизация сайтов.
Система поиска и оценки научно-технической информации Зуев Иван К.б.н., доцент кафедры водных и наземных экосистем СФУ.
Транксрипт:

Вебометрические исследования научных сайтов Печников Андрей Анатольевич к.ф.-м.н., ст.н.с. лаборатории телекоммуникационных систем ИПМИ КарНЦ РАН Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Вебометрика 1. Интернет глобальная телекоммуникационная сеть информационных и вычислительных ресурсов. 2. Веб (World Wide Web, WWW, Web, Всемирная паутина) глобальное информационное пространство, основанное на физической инфраструктуре Интернета, протоколе передачи данных HTTP и языке HTML. 3. Вебометрика (webometrics) раздел информационных технологий, в рамках которого исследуются количественные аспекты конструирования и использования информационных ресурсов, структур и технологий применительно к Вебу. Термин был введен Томасом Алминдом и Петером Ингверсеном (Tomas C. Almind and Peter Ingwersen) в 1997 году в работе "Informetric analyses on the World Wide Web: Methodological approaches to «webometrics»". Journal of Documentation 53 (4): 404–426.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Вебометрика На сегодня считается, что вебометрика включает в себя как минимум четыре основных направления исследований: Веб-индикаторы (индексы цитирования, размеры, «научность», видимость [visibility] сайтов, ранжирование сайтов …), Поиск и сбор данных в Вебе (информационный поиск, поисковые машины, роботы, краулеры, черви, пауки…), Социальные феномены в Вебе (социальные сети, сообщества сайтов, форумы, самоорганизация …), Анализ гиперссылок (связи между сайтами, мотивация ссылок, структура фрагментов Веба...). Peter Ingwersen, «Webometrics – Ten Years of Expansion», Invited Plenary talk. The International Workshop on Webometrics, Informetrics and Scientometrics, May, 2006, Nancy (France)

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Вебометрика В Вебе много всего и хорошего, и не очень. Многие исследователи отмечают одновременное наличие в Вебе как хаоса, так и порядка, при этом если хаос носит разносторонний и всеобъемлющий характер, то признаки порядка проявляются на некоторых его частях. Но Веб велик. Яндекс ведет поиск по страницам. Нами отсканировано страниц российского сегмента научного Веба, то есть лишь 0,03% от Яндекса. Поэтому внимание и ресурсы концентрируются на узких сегментах Веба с расчетом дальнейших обобщений и переноса результатов. Нами были проведены различные вебометрические исследования в следующих сегментах: A. официальные сайты классических университетов России, научных учреждений РАН, университетов Финляндии, российских конференций по информационным технологиям; B. экологические и юридические сайты; C. весь российский сегмент (на основе данных Яндекса). В работе по вебометрическим исследованиям принимает участие целая группа: ИПМИ КарНЦ (В.В.Мазалов, Н.Б.Луговая, Ю.В.Чуйко) и ПетрГУ (И.Э. Косинец, О.Г. Илюкевич). Сайт

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Вебометрика Обратим внимание на то, что все рассмотренные сегменты Веба пункта А. состоят из т.н. регламентируемых сайтов (в предположении того, что у них меньше хаоса). Регламентируемый сайт – существует официальный документ, определяющий цели, задачи, структуру, правила наполнения контентом и т.д. (Лучше сказать – «может/должен существовать документ…»). Далее речь пойдет о регламентируемых сайтах. Рассмотрим 4 темы: измерительные устройства и роботы (что измеряют, чем измеряют и что еще можно узнать о сайте), рейтинги научных сайтов (на примере северо-западных учреждений РАН), структура научного Веба (кусочек исследований по гранту РФФИ), некоторые оптимизационные модели.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Измерительные устройства и роботы Измерения с помощью поисковых машин Используются многими исследователями. Введено, по-видимому, испанской группой Cybermetrics Lab ( Что измеряют: размер сайта (S - size) - общее количество страниц, обнаруживаемых на сайте поисковыми машинами; видимость сайта (V - visibility) – общее количество обнаруживаемых уникальных гипертекстовых ссылок с других веб-ресурсов; количество полнотекстовых файлов (R - rich files) - суммарное количество файлов с расширениями PDF, DOC, PS и PPT; научность сайта (Sc - "scholar") – количество обнаруживаемых Google Scholar ссылок на сайт. Также измеряют PR (Page Rank Google) и тИЦ (тематический Индекс Цитирования Яндекса). Чем измеряют: Испанцы (да и все кроме россиян) используют Google, Yahoo, Yahoo Search, Live Search, Exalead и Google Scholar. Мы, естественно, добавляем в этот список Яндекс (и может быть Ramler).

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Измерительные устройства и роботы Измерения с помощью поисковых машин Когда измеряют Значения индикаторов могут существенно изменяться в зависимости от даты измерений. Примеры, приведенные далее – на середину января 2009 года. Как измеряют: Поисковые машины имеют соответствующие сервисы. Например, для измерения V в Google надо ввести в строке поиска link:mathem.krc.karelia.ru. Результат: «… 229 связанных с mathem.krc.karelia.ru». Хорошо ли измеряют: Много критических работ по самым разным поводам. Пример. Сайт КарНЦ РАН ( S Яндекс =30000, S Google =5670, а S Yahoo =18. (На самом деле не менее страниц.) V Яндекс =215, V Google =189 и V Yahoo =1025. (Сколько на самом деле? – а где взять по другому!??)

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Измерительные устройства и роботы Специализированные роботы (Robots, Spiders, Crawlers) Что делают: Обходят постранично сайт и собирают требуемую информацию. Например, просто собирают страницы в хранилище для последующей обработки. Проблемы: глубина поиска, зацикливания и прочее. Тематические краулеры собирают страницы на заданную тему, спамовые краулеры собирают почтовые адреса и т.д. На сайте - большой список. Известные роботы: У каждой поисковой системы есть свой робот (например, Googlebot/2.1, YahooSeeker/1.1 и т.д.). SocSciBot – университет Вулверхэмптона, сайт SocSciBot собирает гиперссылки с заданного сайта на внешние сайты для последующего анализа.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Измерительные устройства и роботы Собственные разработки - робот LPR (Link, Page & Robot) и БД ВГ Необходимость разработки собственного поискового робота: закрытость кодов и отсутствие технической документации у «чужих», неустойчивые каналы связи у нас, разница в научных подходах и постановке задач, невозможность развития в требуемых направлениях, возникающих по мере проведения исследований. Основные идеи LPR: забраться как можно глубже, собрать как можно больше информации о гиперссылках в виде, записать информацию в специально разработанную Базу данных внешних гиперссылок (БД ВГ). Поскольку ссылок очень много, в БД ВГ реализованы две операции над множеством гиперссылок: УНИФИКАЦИЯ (убирает дубли на одном уровне) и МИНИМИЗАЦИЯ (оставляет дубль с наименьшим уровнем). Полученное множество ссылок называется далее уникальным. Полезные «побочные эффекты» работы LPR как измерительного устройства: может подсчитать количество страниц на сайте (т.е. S), «битых» ссылок и др.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Измерительные устройства и роботы Некоторые результаты работы LPR Сайты РАН Отсканировано сайтов на сайты количество РАН 1 отделения РАН (по областям науки) 4 Региональные отделения РАН 3 Региональные научные центры РАН 9 Научные центры отделений 15 Институты и научные учреждения РАН 229 ВСЕГО261 Отсканировано страниц, всего Найдено ссылок, всего Из них уникальных количество страниц на сайтах учреждений РАНсайтов в % до % до % до % до % до % свыше %

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Рейтинги научных сайтов Ранжирование сайтов научных организаций Проект испанской исследовательской группы Cybermetrics Lab «Ranking Web of World Research Centers» ( V измеряются Yahoo Search, Live Search и Exalead, нормируются по каждой поисковой машине и суммируются для каждого сайта, затем ранжируются; QV – место; S измеряются Google, Yahoo, Live Search и Exalead, нормируются по каждой поисковой машине, отбрасываются max и min и суммируются, затем ранжируются; QS – место; R – практически как S, QR – место; Sc - с помощью Google Scholar; QSc - место. WR=5 QV+2 QR+1.5 QR+1.5 QSc, затем ранжируются по WR. From TOP 2000 WORLD RANKRESEARCH CENTER 80 Russian Academy of Sciences Siberian Branch 120 Russian Academy of Sciences 246 State Institute of Information Technologies and Telecommunications 274 Joint Institute for Nuclear Research 335 Institute of Automation and Electrometry Russian Academy of Sciences 394 Space Research Institute Russian Academy of Sciences 417 Ural Branch Russian Academy of Sciences 467 Dorodnicyn Computing Centre Russian Academy of Sciences 546 Steklov Mathematical Institute Russian Academy of Sciences 564 Institute of Cytology and Genetics Russian Academy of Sciences

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Рейтинги научных сайтов Ранжирование сайтов научных организаций РАН Проект Института вычислительных технологий СО РАН «Рейтинг сайтов научных учреждений СО РАН» ( WShok = log 10 (V) + log 10 (S) + 2log 10 (R) + 1,5Sc 1 V = [V Яндекс +V Google +V Yahoo ]/3, S = [S Яндекс +S Google +S Yahoo ]/3 R = [R Яндекс +R Google +R Yahoo ]/3, Sc 1 = [log 10 (Sc Яндекс )+log 10 (Sc Google )]/2. Рейтинг от 11/12/ Портал Сибирского отделения РАН 2 Институт математики им. С.Л. Соболева CО РАН 3 Институт ядерной физики им. Г.И. Будкера СО РАН 4 Институт вычислительных технологий СО РАН 5 Президиум СО РАН 6 Институт цитологии и генетики СО РАН 7 Новосибирский институт органической химии им. Н.Н.Ворожцова СО РАН 8 Институт систем информатики имени А.П. Ершова СО РАН 9 Государственная публичная научно-техническая библиотека СО РАН 10 Институт философии и права СО РАН

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Рейтинги научных сайтов Ранжирование сайтов научных организаций РАН северо-запада России Мы взяли 40 сайтов: 3 сайта региональных научных центров (Санкт-Петербургский, Карельский и Кольский), 24 сайта институтов РАН, географически расположенных в Санкт-Петербурге и Ленинградской области (подчиняющихся Отделениям РАН по областям науки), 1 научное учреждение Санкт-Петербургского научного центра, 7 – Карельского научного центра и 5 – Кольского научного центра. ИНДИКАТОРЫ SE ДАННЫЕ LPR S V R (PDF, DOC, PPT) Sc NoНазвание S Яндекс S Google S Yahoo V Яндекс V Google V Yahoo R Яндекс R Google R Yahoo Sc Я ндекс Sc Google S LPR R LPR 1 Карельский научный центр РАН Кольский научный центр РАН Санкт-Петербургский научный центр РАН

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Рейтинги научных сайтов Ранжирование сайтов научных организаций РАН северо-запада России Формула для Wmod – это WShok и размеры сайтов S, измеренные LPR Попарные значения коэффициентов корреляции на множестве из 40 сайтов - свыше 0,7. Выводы: «большие» оказываются наверху, а «маленькие» внизу вне зависимости от методик, по-видимому, это сильно связано с большой разницей в количестве страниц, значительное влияние оказывает выбор «единицы анализа», например, использование в качестве единицы анализа не только доменного имени официального сайта ИПМИ КарНЦ РАН, но и всех его веб-ресурсов, известных авторам, изменяет положение в рейтинге с 34-го сразу на 16-е, побольше бы, например, полнотекстовых файлов. Место в рейтинге WR Место в рейтинге Wshok Место в рейтинге WMod Название 211 Физико-технический институт им. А.Ф. Иоффе РАН 122 Зоологический институт РАН 533 Институт проблем машиноведения РАН 449 Петербургский институт ядерной физики РАН 6516 Институт русской литературы РАН (Пушкинский дом) 765 Кольский научный центр РАН 376 Кунсткамера - Музей антропологии и этнографии РАН

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Целевое множество исследования Российская академия наук (1) - это 9 (4) отделений по областям науки, 3 (3) региональных отделения, 14 (9) региональных научных центров, 15 (15) научных центров региональных отделений и 470 (229) научных учреждений (институтов, центров, музеев, станций). В принципе, нас интересуют все официальные сайты, но не все институты их имеют (по крайней мере, с индивидуальным доменным именем). Мы знаем, что требуемых сайтов примерно (Красным в скобках – количество отсканированных) В случае наличия у учреждения нескольких сайтов в целевое множество включался тот из них, который удовлетворяет одному из следующих условий (приоритет сверху вниз): включен в перечень информационных систем научных учреждений РАН; указан в соответствующем перечне на сайте регионального отделения или регионального научного центра; указан в соответствующем перечне на сайте научного центра регионального отделения; на самом сайте сказано, что он является официальным сайтом учреждения.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Типология внешних ссылок уникальных гиперссылок распределяются примерно по типам. Некоторые из них: Название типа внешней ссылкиОписание внешней ссылки Вышестоящая организацияСсылка на веб-ресурс организации, структурным подразделением которой является организация-владелец сайта. ФондыСсылка на веб-ресурс организации, осуществляющей финансирование проектов. КоллегиСсылка на веб-ресурс организации, занимающейся видами деятельности, аналогичными с организацией-владельцем сайта. Публикации сотрудниковСсылка на опубликованную в Вебе статью или тезисы автора(ов), работающего в организации-владельце сайта. Научные труды организацииСсылка на веб-ресурс, на котором опубликован сборник, монография или материалы конференции организации. Новостные лентыСсылка на новостной веб-ресурс. Научное мероприятиеСсылка на веб-ресурс с информацией о проведении научной конференции, семинара, совещания и др. Доступ к базам данныхСсылка на онлайновые базы данных. Научные библиотекиСсылка на веб-ресурс научной библиотеки. Личные страницыСсылка на персональную страницу сотрудника, расположенную на другом веб-ресурсе. Рекламные ссылкиСсылки на информацию о товарах, услугах, развлекательных мероприятиях. Разработчики сайтаСсылка на сайт разработчиков сайта данной организации. СчётчикиСсылка на сайт разработчиков счетчика статистики. Гостевые ссылки (ссылки хостеров) Ссылки, не имеющие прямого отношения к содержанию сайта и сделанные с веб-ресурсов других организаций, размещенных на сайте организации-владельца.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Частота встречаемости внешних ссылок Очень предварительное исследование. «Вручную» обследованы уникальные ссылки 26 сайтов, выбранных произвольным образом. Приводятся результаты по агрегированным типам: 1 Организации29,1% 2 Публикации3,3% 3 Справочная информация32,9% 4 Персоналии1,5% 5 Реклама, счетчики, разработчики28,3% 6 Ссылки хостеров1,6% 7 Прочие3,2% Анализ ссылок «свои-чужие» «Свои ссылки» – уникальные ссылки на сайты целевого множества, «чужие ссылки» – все остальные уникальные ссылки. Соотношение «своих» к «чужим» сильно меняется от сайта к сайту, но в среднем по всем отсканированным сайтам равно 0,055.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Административный каркас. Структура РАН В Российской академии наук существуют два типа подчиненности: Административная подчиненность ( по Уставу РАН, 2007, примеры ): -Отделение математических наук входит в РАН, -Институт прикладной математики им. М. В. Келдыша РАН входит в Отделение математических наук РАН, -Сибирское отделение РАН входит в РАН, -ИМПМИ КарНЦ РАН входит в КарНЦ РАН, -Амурский научный центр ДВО РАН (в Уставе нет, используем термин «входит»). Научно-методическое руководство ( по Уставу, пример ): -Отделение математических наук осуществляет научно- методическое руководство ИПМИ КарНЦ РАН.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Административный каркас. Определения Из ссылок на организации выделим часть «своих ссылок», указывающих на сайт (ближайшей) вышестоящей (или подчиненной) организации. Будем говорить, что существует каркасная ссылка вверх, если существует хотя бы одна ссылка с данного сайта на сайт вышестоящей организации. Аналогично определяется каркасная ссылка вниз. Определим силу связности (FС ud - Force of Connectivity) между вышестоящим сайтом u и нижестоящим сайтом d: Соответственно, сила связности между вышестоящим сайтом u и всеми нижестоящими сайтами d D:

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Административный каркас. Исследования Административный каркас научного Веба - отражение административных и научно-методических отношений подчиненности. Мы можем судить, насколько он крепок, вычисляя FС ud. Примеры FС uD для отношения «входит»: u – РАН, D – научные отделения РАН: FС uD = 0.9, u – РАН, D – региональные научные центры РАН: FС uD = 0.778, u – СО РАН, D – научные центры СО РАН: FС uD = 0.583, u – КарНЦ РАН, D – институты КарНЦ РАН: FС uD = 1. А вот для научно-методических отношений FС uD практически равен нулю. (Всего две ссылки из 200 потенциально возможных). Поэтому далее мы это отношение подчиненности не рассматриваем.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Административный каркас. Структура и сила связности

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Связность научных подмножеств Научное подмножество – подмножество целевого множества, объединенное по некоторому содержательному признаку. Пример: сайты институтов Отделения химии и наук о материалах. Отделение химии и наук о материалах 95 Институт биохимической физики им. Н.М. Эмануэля РАН 101 Институт высокомолекулярных соединений РАН 161 Институт металлоорганической химии РАН 211 Институт проблем химической физики РАН 220 Институт синтетических полимерных материалов РАН 234 Институт структурной макрокинетики и ПМ РАН 272 Институт химии растворов РАН 277 Институт химической физики им. Н.Н. Семенова РАН 292 Институт элементоорганических соединений РАН 352 Центр фотохимии РАН В целом сила связности научных подмножеств очень низкая. В примере 0.17, это очень хороший результат. На сегодня обследовано 17 подмножеств, в среднем сила связности равна

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Ближайшее окружение научного сайта (окрестность, пучок) Окрестность - это веб-ресурсы организации или учреждения, не являющиеся официальным сайтом. Существуют, по крайней мере, два вида: размещены на доменном имени официального сайта на следующих уровнях (типа ddd.nnn.ss nnn.ss); доменные имена указаны прямым перечислением в разделе типа «Веб-ресурсы научного учреждения». Недостатки: в первом случае это не всегда элемент окрестности, во втором - списка может и не быть. По результатам обследования 40 сайтов можно предсказать, что около 13% уникальных ссылок являются пучковыми ( 10000).

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Научные веб-коммуникаторы Научным веб-коммуникатором называется сайт, имеющий отношение к научной деятельности, не являющийся официальным сайтом научного учреждения и/или организации РАН и имеющий входящие ссылки с и/или исходящие ссылки на множество официальных сайтов. «Имеющий отношение к научной деятельности» - небесспорный термин, но можно попытаться определить и прямым перечислением. Виды веб-коммуникаторов: посредник – много входящих, много исходящих, индуктор – мало входящих, много исходящих, коммутатор – много входящих, мало исходящих. Примеры: прекрасный посредник - MathNet.Ru (342 входящих с, 186 исходящих на), коммутатор – РФФИ (451 входящая), индуктор – Википедия (очень много исходящих на; почти шутка). Исследования только начались.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Научные веб-коммуникаторы группа сайтов-коммуникаторов обследовано коммуникаторов количество уникальных ссылок количество сайтов библиотеки вузы высокотехнологичные фирмы журналы26927 конференции2189 научные общества научные порталы поисковые системы и счетчики системы поиска публикаций федеральные органы власти фонды ВСЕГО Примерно 94 уникальных ссылки (или 20 сайтов) на 1 коммуникатор.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Схема научного Веба Схемой научного Веба называется ориентированный граф G=(V,E), где V – множество вершин, состоящее из следующих непересекающихся подмножеств: V k – вершины, соответствующие официальным научным сайтам, V bk – вершины, соответствующие сайтам окрестностей официальных сайтов, V com – вершины, соответствующие научным коммуникаторам. E – множество дуг, соответствующих гиперссылкам между сайтами, задающими множество вершин V; дуга e(i,j) существует тогда и только тогда, когда существует хотя бы одна гиперссылка с сайта i на сайт j; петель e(j,j) не существует.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Схема научного Веба

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Структура научного Веба Схема научного Веба Выводы и результаты: в модели представлен достаточно большой охват уникальных исходящих ссылок (прогноз: каркас и научные подмножества 4000, окрестности и коммуникаторы – не менее 40000, т.е. около 70% всего множества), сделана попытка минимальным количеством понятий описать структуру достаточно сложного сегмента Веба, очевидные возможности планирования дальнейшего развития, в том числе и с использованием административных возможностей.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Некоторые оптимизационные модели Задача размещения ссылок в сообществе (например, в научном подмножестве) n – количество участников, c i – значимость i -го участника, m i – максимально возможное количество прямых ссылок от i -го на других участников,. Матрица ссылок X={x ij }, x ij =1, если существует ссылка от i -го участника к j -му, и x ij =0, если ссылки не существует. Функция приращения значимости Ограничения,,,. Одна из возможных целевых функций: ( ) Содержательно: распределение ссылок должно привести в первую очередь к увеличению значимости наименее значимых ресурсов, при этом суммарный прирост значимости по всем участникам системы должен быть максимальным.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Некоторые оптимизационные модели Моделирование клик-сообществ - это вероятность нахождения i-го рядового сайта на j-й позиции в каталоге

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Некоторые оптимизационные модели Моделирование клик-сообществ Позиция i-го участника изменяется за один сеанс следующим образом: если пользователь переходит с i-го рядового сайта на головной сайт, то повышается; если пользователь попадает с головного сайта на i-го участника, то понижается; если пользователь за сеанс не делает перехода с головного сайта на рядовой (или наоборот), то позиции всех рядовых сайтов остаются прежними.

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Некоторые оптимизационные модели Моделирование клик-сообществ Здесь Система: Функция выигрыша для i-го рядового сайта

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Некоторые оптимизационные модели Моделирование клик-сообществ Результаты моделирования 1

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Некоторые оптимизационные модели Моделирование клик-сообществ Результаты моделирования LawDir (реальное клик-сообщество)

Вебометрические исследования научных сайтов Выступление на Ученом совете ИПМИ КарНЦ РАН. Март 2009 г. Заключение 1.Сформулированы основные направления исследований. 2.Созданы собственные программные средства для проведения исследований. 3.Исследованы задачи ранжирования научных сайтов, получен ряд результатов, сформулированы собственные подходы. 4.Предложены собственные подходы к моделированию научного сегмента Веба. 5.Построены и исследованы математические оптимизационные модели фрагментов Веба.