RuSSIR 2008 Russian Summer School in Information Retrieval 1-5 сентября 2008. Таганрог Как это было…

Презентация:



Advertisements
Похожие презентации
Классификация, кластеризация и поиск изображений на основе низкоуровневых характеристик Наталья Васильева Руководитель: Новиков Б. А.
Advertisements

Анализ тональности сообщений Лидия Михайловна Пивоварова Системы понимания текста.
ЗАДАЧИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ. 1.Что такое компьютерная лингвистика? 2. История. 3. Направления компьютерной лингвистики. 4. Заключение.
Анализ данных Введение в информационный поиск. План оставшихся лекций 1.Введение в информационный поиск 2.Нормализация и извлечение информации из текста.
Доклад «Теоретические аспекты информационного поиска» Автор Гречиц Алёна Анатольевна.
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция.
Информационный поиск Лидия Михайловна Пивоварова Системы понимания текста.
Нужны ли (и возможны ли) "честные" оценки лингвистических подходов и прикладных систем.
1 Средства автоматической интеграции разнородных онтологий Панасенко Алексей, 525 группа Научный руководитель Большакова Е.И.
3.1. Назначение онтологий. Информационный поиск..
ИНТЕГРАЦИЯ ЛИНГВИСТИЧЕСКИХ И СТАТИСТИЧЕСКИХ МЕТОДОВ ПОИСКА В ПОИСКОВОЙ МАШИНЕ «EXACTUS» к.т.н. Тихомиров Илья Александрович 14-я международная конференция.
Поиск и сбор информации о персонах и организациях в сети Интернет Хлестов Михаил, системный аналитик ООО «САЙТЭК»
Объектные СУБД Поисковые технологии Специализированные ИПС и Web-сервисы Лингвистический и семантический анализ текстов документов НПЦ «ИНТЕЛТЕК ПЛЮС»
Языконезависимое определение авторства текста на базе языковых моделей символьного уровня.
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
Text Mining. Анализ текстовой информации. Text Mining- методы анализа неструктурированного текста Обнаружение знаний в тексте Обнаружение знаний в тексте.
ИСИДА-Т Интеллектуальная система извлечения и анализа данных из текстов.
Информационно-поисковая система. Классификация информационно- поисковых систем.
ИЗВЛЕЧЕНИЕ ЗНАНИЙ ИЗ ТЕКСТОВОЙ ИНФОРМАЦИИ. KNOWLEDGE PROSPECTOR.NET Участники проекта (Knowledge.Net) Новиков Антон Владимирович Сигалин Максим Владимирович.
ПРОГРАММНАЯ СИСТЕМА ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТЕКСТОВ (ПС INEX) Исследовательский центр искусственного интеллекта Института программных систем РАН г. Переславль-Залесский.
Транксрипт:

RuSSIR 2008 Russian Summer School in Information Retrieval 1-5 сентября Таганрог Как это было…

Немного истории Идея проведения RuSSIRов принадлежит Павлу Браславскому Школы проводятся совместно с РОМИП Школы поддерживаются и спонсируются разными компаниями RuSSIR 2007 был первым и проходил в Екатеринбурге 5-12 сентября 2007

Немного статистики Таганрогский технологический институт Южного федерального университета 4 полных курса, 1 краткий и 1 лекция Конференция молодых ученых (7 докладов) 9 иностранных слушателей Все курсы по-английски 10 часов занятий в день (с перерывами) Всего 106 человек

Курс Text Mining, Information and Fact Extraction Marie-Francine Moens (Katholieke Universiteit Leuven), Belgium

Text Mining, Information and Fact Extraction Цель: извлечение конкретных фактов из текста на естественном языке Лексическая обработка: извлечение языковых свойств, токенизация, стемминг, POS- разметка, парсинг предложений В курсе делается широкий обзор методов машинного обучения и их применения к задаче информации из текстовых данных.

Text Mining, Information and Fact Extraction Методы классификации: SVM, Байес, принцип максимальной энтропии Контекстно-зависимая классификация: Hidden Markov Models, Conditional Random Field, Probabilistic Latent Semantic Analisys, Latent Dirichlet Allocation Приложения

Курс Поиск изображений по содержанию Наталья Васильева (HP Labs) Санкт-Петербург, Россия

Поиск изображений по содержанию 1)Задачи Image Retrieval: поиск изображений, похожих на заданный пример, поиск по заданной цветовой гамме, примерной форме и т.д. 2) Проблемы Image Retrieval: большой разрыв между представлением и семантикой(а интересно именно семантическое содержание) cубъективность восприятия изображений трудность визуализации

Поиск изображений по содержанию 3) Уровни свойств изображения Цвет(цветовые пространства, гистограммы) Текстура(статистические свойства, фильтры, вэйвлеты) Форма(методы выделения границы, кодирование формы) Семантический(применение fusion-методов)

Поиск изображений по содержанию 4) Сегментация 5) Многомерное индексирование Деревья(R, Quad, VP и тд) Locality Sensitive Hashing 6) Приложения IBM QBICK - search by image content Virage Visual SEEk

Data Structures in IR Максим Губин (Ask.com, США) Курс

Data Structures in IR Индексация, структуры хранения данных, методы сжатия, распараллеливание Поиск, слияние списков, отсечение, кэширование, построение кластера Языковая модель, PageRank Последовательно излагается процесс проектирования поисковой системы. На примерах возникающих проблем показывается применение классических структур данных и алгоритмов: Huffman and LZ coding, Map-Reduce, Bloom filter

Курс Hands-on Natural Language Processing for Information Access Applications Horacio Saggion (University of Sheffield)

Natural Language Processing for Information Access Извлечение информации из текста –выявление именованных сущностей –поиск связей между сущностями –определение значения сущностей Обзор технологий и средств анализа естественного языка на примере системы GATE

Natural Language Processing for Information Access Question Answering –получение ответа на запрос, сформулированный на естественном языке –3 типа вопросов: факт, перечисление, определение –индексация, анализ запроса, получение ответа Text Summarization –выжимка из текста смысловой сути –sentence summarization, article summarization, corpus summarization –методы оценки результатов

Короткий курс IR in Social Media Alexey Maykov, Microsoft LiveLabs Чем отличается Social Media от обычных СМИ? Обзор, применение и архитектура SM Сбор данных в SM, различные методы Обработка и анализ этих данных

Лекция. Темы дня в блогах: Как это работает Антон Волнухин Андрей Мищенко Что такое «темы дня» в яндекс.блогах? Как формируются «темы дня»? Особенности формирования

Конференция молодых ученых Константин Артемьев Метод вероятностного морфологического анализа для задач полнотекстового индексированного поиска Александр Сибиряков Извлечение мнений о товарах из форумов и блогов с учетом тональности Евгений Рабчевский Применение лексико-синтаксических шаблонов для автоматизации процесса построения онтологий Ольга Пустыльникова Автоматическая классификация текстов на основе их структурных признаков. Какую информацию о тексте отражает структура? Алексей Владыкин Автоматический метод оценки тематической содержательности документов Мстислав Масленников Самозагрузка правил для извлечения информации из текстов на естественном языке. Ольга Шамина Автоматический поиск научных статей в сети Интернет

Конференция молодых ученых

Неформальное Welcome Party

Неформальное Футбольный матч 12 – 0 в пользу студентов!

Неформальное RuSSIR Party

Неформальное Мафия по ночам

Неформальное Последствия мафии

А на самом деле:

Материалы Видеозаписи лекций скоро появятся на сайте Презентации вы можете почитать уже сейчас