Мультимедийные корпуса Семинар по идишу 06.09.14 Ольга Созинова.

Презентация:



Advertisements
Похожие презентации
Электронные корпуса Корпусная лингвистика. Корпусная лингвистика ? Корпусная лингвистика - наука, занимающаяся разработкой общих принципов построения.
Advertisements

Язык разметки гипертекста НТМL. С чего начать? 1 шаг 1. Запустить «Блокнот» (пуск-стандартные-блокнот) 2. Сохранить в своей папке документ с параметрами:
Лекция 9. Обзор корпусов. В.П. Захаров Санкт-Петербургский государственный университет.
Online коллекция оксфордских журналов поиск и расширенный поиск журналов.
Наиболее релевантные ключевые словосочетания: «Арабские танцы» «Школа арабских танцев»
КУРС «WEB-ДИЗАЙН». Что такое Web-страница? То, что мы видим в окне браузера, когда заходим на какой-либо сайт! Мы видим веб-страницу сайта – ее содержимое!
Подготовка к экзамену по английскому языку. Структура экзамена 1.Устное высказывание. 2.Чтение и написание реферирования / обсуждение прочитанного с преподавателем.
Всемирная паутина Компьютерные телекоммуникации. 2 World Wide Web Популярнейшая служба Интернета - World Wide Web (сокращенно WWW или Web), еще называют.
Создание Web-сайтов в программе Microsoft FrontPage.
Информационно-поисковые системы. Сычев А.В г. 1 Спамдексирование Воронежский государственный университет Факультет компьютерных наук Кафедра информационных.
1. WEB-страничка – это: 2. Нумерованный список на странице HTML-документа можно задать с помощью команды:
СОЗДАНИЕ ПРЕЗЕНТАЦИЙ В СРЕДЕ PowerPoint Специалист по мультимедийным технологиям Мухаммадиева Лилия Ринатовна тел.: (1083)
Понятие о базовых сетях. Способы создания сетей Глава 2 Исследуя Всемирную Паутину.
W W W World Wide Web Всемирная паутина первая по популярности служба, благодаря которой Интернет стал настолько распространенным. Сервис WWW служит для.
HyperText Markup Language (HTML) - язык разметки гипертекста Гипертекст - информационная структура, позволяющая устанавливать смысловые связи между элементами.
Мы познакомимся с простыми инструментами и методами разработки веб-страниц. На примере рассмотрим, как создать фрагмент сайта, содержащего репертуар кинотеатра.
это десятки миллионов Web-серверов Интернета, содержащих Web-страницы, в которых используется технология гипертекста. Технология WWW позволяет создавать.
БАЗЫ ДАННЫХ ЛЕКЦИЯ 14. тема: XML-ТЕХНОЛОГИИ В БАЗАХ ДАННЫХ.
Интернет и всемирная паутина yagod-sch.ucoz.ru (все уроки) Составил учитель ИКТ Фоломкин А.И.
Язык разметки гипертекста НТМL. С чего начать? 1 шаг 1. Запустить «Блокнот» (пуск-стандартные-блокнот) 2. Сохранить в своей папке документ с параметрами:
Транксрипт:

Мультимедийные корпуса Семинар по идишу Ольга Созинова

Список корпусов 1. НКРЯ, мультимедийный корпус 2. CHILDES Transcript Browser (Child Language Data Exchange System) 3. National Center for Sign Language and Gesture Resources (NCSLGR) corpushttp://secrets.rutgers.edu/dai/queryPages/querySelection.php 4. Corpus Project in Colloquial Japanese Sign Languagehttp://research.nii.ac.jp/jsl-corpus/en/ 5. Диалектологический корпус (Архангельская обл., д.Михалевская) 6. Scottish Corpus Of Texts & Speechhttp:// 7. BACKBONE Pedagogic corpora for content & language integrated learninghttp://webapps.ael.uni-tuebingen.de/backbone-search/faces/search.jsp 8. English Language Interview Corpus as a Second-Language Applicationhttp:// 9. Spanish Learner Language Oral Corporahttp:// French Learner Language Oral Corporahttp://

1. НКРЯ, мультимедийный корпус Написан на JavaScript Видео в формате *.flv, проигрыватель: Yandex Player Есть возможность скачать видео в *.mp4 Выдача большая: преконтекст, пост контекст Нет синхронизации видео с текстом Как и в основном корпусе НКРЯ – морфологическая разметка, мощный поиск

1. НКРЯ, мультимедийный корпус Возможность задать речевые действия и жесты: – количество говорящих в клипе; – социальная ситуация, отраженная в клипе; – типы речевых действий; – ориентация ладони; – направление движения; – многое другое

1. НКРЯ, мультимедийный корпус Запрос: ехать + речевое действие: вопрос к самому себе

2. CHILDES Transcript Browser Записи детской речи Есть материалы с аудио, видео и просто текст Материалы с видео: – Проигрыватель QuickTime Plug-in – Текст с пронумерованными строчками, синхронизация видео с текстом Поиск при помощи особого языка команд CLAN. Разработано именно для этого проекта.

2. CHILDES Transcript Browser Страница примера

3. National Center for Sign Language and Gesture Resources (NCSLGR) corpus Корпус жестов Поиск по разным свойствам жестов, чекбоксы В выдаче таблица с названиями жестов и именами людей, в пересечении – ссылка на видео с жестом и видео с контекстом Поисковая страница – PHP, также использован JavaScript Видео – JW Player (очень классный!)

3. National Center for Sign Language and Gesture Resources (NCSLGR) corpus Страница выдачи

3. National Center for Sign Language and Gesture Resources (NCSLGR) corpus Видео в всплывающем окне

4. Corpus Project in Colloquial Japanese Sign Language Безумно красивый сайт с Flash-вставками

4. Corpus Project in Colloquial Japanese Sign Language Но совсем нет никакого поиска – просто 2 базы данных жестов Страница «What is your sign for?»

4. Corpus Project in Colloquial Japanese Sign Language Видео в всплывающем окне с аннотацией Красиво, но написано на Flash -> долго грузится

5. Диалектологический корпус (Архангельская обл., д.Михалевская) Поиск с CQP-запросами Выдача аудио и текста (контекст + выделено цветом искомое) Синхронизации с текстом нет, аудио выдается только с контекстом PHP, XML

5. Диалектологический корпус (Архангельская обл., д.Михалевская) Страница выдачи

6. Scottish Corpus Of Texts & Speech Простой поиск (слово/фраза, автор, тип текста – устный или письменный, и т.д.) PHP, JavaScript Аудио – всплывающее окно в QuickTime, возможность синхронизации с текстом Возможность просмотреть только простой текст и скачать его; также можно скачать аудиофайл

6. Scottish Corpus Of Texts & Speech Страница выдачи

6. Scottish Corpus Of Texts & Speech Страница примера

6. Scottish Corpus Of Texts & Speech Всплывающее окно с аудио

7. BACKBONE Pedagogic corpora for content & language integrated learning search/faces/search.jsp search/faces/search.jsp Видео-интервью с носителями 6 языков Поиск по категориям (база данных), co- occurrence, concordance (но выдача только текстовая) Аудио и видео только скачивать (несмотря на надпись Play), формат *.wvx JavaScript

7. BACKBONE Pedagogic corpora for content & language integrated learning search/faces/search.jsp search/faces/search.jsp Страница выдачи

7. BACKBONE Pedagogic corpora for content & language integrated learning search/faces/search.jsp search/faces/search.jsp Всплывающее окно с аннотацией

8. English Language Interview Corpus as a Second-Language Application (ELISA) Интервью с носителями английского языка Похож на BACKBONE Для каждого интервью можно просмотреть простой текст, XML, частотные списки слов Видео только скачивать (формат *.smil)

8. English Language Interview Corpus as a Second-Language Application (ELISA) Страница с интервью

9, 10. Spanish Learner Language Oral Corpora French Learner Language Oral Corpora Корпуса для исследований французского и испанского языков как L2 Использованы технологии CHILDES (Child Language Data Exchange System) Поиск простой, по параметрам (корпус, тип задания – general chat, story recall, etc.) Аудио открывается в том же окне JavaScript

9, 10. Spanish Learner Language Oral Corpora French Learner Language Oral Corpora Страница выдачи