Когнитивная наука 2007/2008 Актуальные проблемы прикладной лингвистики.

Презентация:



Advertisements
Похожие презентации
© ElVisti Лекция 10 Основные сведения о нейронных сетях Дмитрий Владимирович ЛАНДЭ МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ.
Advertisements

Сеть поиска максимума (MAXNET) Сеть поиска максимума с прямыми связями – слогослойная нейронная сеть определяющая, какой из входных сигналов имеет.
Лекция 6. Нейронные сети Хопфилда и Хэмминга Среди различных конфигураций искусственных нейронных сетей (НС) встречаются такие, при классификации которых.
Вероятностная НС (Probability neural network) X 1 X n... Y 1 Y m Входной слой Скрытый слой (Радиальный) Выходной слой...
Нейросетевые технологии в обработке и защите данных Обработка данных искусственными нейронными сетями (ИНС). Лекция 5. Алгоритмы обучения искусственных.
Использование нейросимулятора при определении внешнего вида ребенка по параметрам родителей.
Когнитивная наука 2007/2008. Материалы к курсу М.В. Фаликман: http: // virtualcoglab.cs.msu.su.
Использование нейронных сетей для прогнозирования изменений на фондовом рынке Михаил Бондаренко 14 August
Тема 10. Архитектура и алгоритмы обучения НС Основные парадигмы нейронных сетей обучения с учителем Однослойный перцептрон f f f х1.
1. Cведения о нейронах и искусственных нейросетях.
Ассоциативная память. Ассоциативная сеть прямого распространения. 1 X 1 Y 1 X 2 Y 2 X i Y i X n Y n 2 i n... Y j = i=1 N w ij x i, j=1,M (*)
10. 3 Повносвязные нейронные сети со смешанным обучением Нейронная сеть Хопфилда ( Hopfield Net)
Кафедра фотоники и оптоинформатики Санкт-Петербургский государственный университет информационных технологий, механики и оптики А.В.Павлов Оптические Технологии.
10.2 Основные парадигмы нейронных сетей обучения без учителя Самоорганизующиеся карты признаков Кохонена (Self-organized map) Кохонена... Выходные.
1 Теория и применение искусственных нейронных сетей Тема 2 Т.Б. Шатовская Факультет компьютерных наук, Кафедра ПОЭВМ, ХНУРЭ ХНУРЭ, факультет КН, кафедра.
ВВЕДЕНИЕ В КОГНИТИВНУЮ НАУКУ 2006/2007. Материалы к курсу: http: // virtualcoglab.cs.msu.su / projects / mf_cogsci.html.
Автор: студент группы С-83 Потапенко Владимир Москва 2012 г.
Распознавание оптических образов (символов) с помощью однослойного персептрона Методические указания по дисциплинам «Системы искусственного интеллекта»,
ВВЕДЕНИЕ В КОГНИТИВНУЮ НАУКУ 2007/2008. Представление и приобретение знаний: есть ли альтернатива компьютерной метафоре?
Динамические нейронные сети и их аттракторы Резник Александр Михайлович Институт проблем математических машин и систем НАН Украины отдел Нейротехнологий.
Транксрипт:

Когнитивная наука 2007/2008 Актуальные проблемы прикладной лингвистики

МОДУЛЬНЫЙ ПОДХОД К ПОЗНАНИЮ (с) Леда Космидес, Джон Туби

МОДУЛЬНЫЙ ПОДХОД К ПОЗНАНИЮ СИСТЕМЫ БИОЛОГИЧЕСКОГО ОРГАНИЗМА

ОСНОВЫ МОДУЛЬНОГО ПОДХОДА К ПОЗНАНИЮ Ноэм Хомский (1988): врожденность языковой способности и ее независимость от других способностей -- язык как отдельный «умственный орган» Нейропсихология XIX века: речь может нарушаться при сохранности прочих функций (зона Брока, зона Вернике)

Языковая способность как отдельный модуль Ген FOXP2 хромосомы 7 Разница в усвоении L1 и L2 Трудности в обучении обезьян языку Грамматики устной речи vs языки глухонемых Креольские языки, создание языка жестов группой глухонемых детей

ОСНОВЫ МОДУЛЬНОГО ПОДХОДА К ПОЗНАНИЮ Идея модульности познания -- Дэвид Марр ( ): «Любой большой массив вычислений должен быть разбит и реализован как набор частей, независимых друг от друга настолько, насколько это допускает общая задача…» (1976)

РОЖДЕНИЕ МОДУЛЬНОГО ПОДХОДА К ПОЗНАНИЮ Джерри Фодор (1983): общая концепция «модульности»: познание как мозаика специализированных модулей Насколько этот принцип универсален?

МОДУЛЬНЫЙ ПОДХОД К ПОЗНАНИЮ Когнитивная архитектура: Модульные системы ввода Центральные системы: планирование, принятие решения ?

КРИТЕРИИ ВЫДЕЛЕНИЯ МОДУЛЕЙ Особая сфера влияния, или специализация ( domain specificity ): каждый модуль компетентен в обработке одного из видов информации или в решении одного из классов познавательных задач и не участвует в решении других классов задач

Насколько речь модульна? Недавнее появление в филогенезе Пластичность поведенческих проявлений Пластичность нервных механизмов Произвольность связей между обозначением и обозначаемым Элизабет Бейтс ( )

ГИПОТЕЗА ВСЕОБЩЕЙ МОДУЛЬНОСТИ Дэн Спербер: познание полностью модульно -- так же, как биологический организм. Неспециализированных систем переработки информации, использующих обобщенный «умственный лексикон», НЕТ.

КРИТИКА МОДУЛЬНОГО ПОДХОДА 1. Теоретическая : проблема обучения и пластичности познания; влияние культуры на «модульные» процессы (см. в частности пример зрения, top-down processing) проблема нисходящей (data-driven) регуляции решения познавательных задач.

А.Лентулов, Москва

ВЫВОД: познавательные процессы не обусловлены наследственностью настолько, как того хотелось бы представителям модульного подхода… Неспециализированная обучаемая система! Адекватная модель?

Представление и приобретение знаний: есть ли альтернатива компьютерной метафоре?

Нейронные сети: Мозг как компьютер vs. Компьютер как мозг

Мозг человека: преимущества перед компьютером нейронов, связей между нейронами. Частота импульсации Гц (современные персональные компьютеры -- до 10 9 Гц). NB! Медлительность и ненадежность отдельных нейронов компенсируется их количеством. Параллельная переработка информации (в компьютерах -- преимущественно последовательная). «Переход количества в качество»: богатство поведения. Нельзя сказать, что мозг исходно «готов к использованию»: велика роль обучения.

Нейросетевой подход: основные положения Процессы познания -- результат взаимодействия большого числа простых перерабатывающих элементов, связанных друг с другом и организованных в слои («модули»). «Переработка информации» -- определенный ответ элемента на воздействия извне. Знания, управляющие процессом переработки, хранятся в форме весовых коэффициентов связей между элементами сети. Главное -- не элементы, а связи между ними ( «субсимвольный подход» ). Обучение -- процесс изменения весовых коэффициентов связей между элементами сети (приспособления их к решению определенной задачи).

Классы задач, решаемых современными нейросетями: Классификация : распознавание образов, распознавание голосов, верификация подписей, постановка диагноза, анализ экспериментальных данных и т.д. Моделирование : поведение системы, поставленной в определенные условия. Прогноз : погода, ситуация на рынке ценных бумаг, бега, выборы и т.д. Комплексные задачи: управление принятие решений

Нейронные сети: рождение идеи (1943) Уоррен Маккаллох ( ) Уолтер Питтс ( ) «Логическое исчисление присуще нейронной активности» (1943)

Нейронные сети РЕАЛЬНЫЙ НЕЙРОН

Мозг человека содержит 1011 нейронов. Состав нейрона: аксон, дендритов, синапсы Состояние нейрона: возбуждение и торможение

Нейронные сети ФОРМАЛЬНЫЙ НЕЙРОН Элемент с пороговой логикой (TLU): преодоление порога -- 1, иначе -- 0.

Формальный нейрон Входные сигналы формируются в рецепторах (не входят нейрон). Далее эти сигналы умножаются на веса соответствующих синапсов (которые могут изменяться при обучении), затем результаты суммируются. На основе полученной суммы (NET) с помощью активационной функции вычисляется выходной сигнал нейрона (OUT).

Нейрон как компьютер Сигнал сумматора: n – количество синапсов i – индекс сигнала xi – входной сигнал NET – сигнал сумматора Активизационная функция: OUT = F(NET) Примеры активизационных функций: OUT = K*NET OUT=1, NET>T; OUT=0, NET T OUT=1/(1 + e-NET)

Искусственный нейрон: активационная функция (y)

Классическая модель нейрона (Маккалох и Питт)

Нейронная сеть Нейронная сеть – ориентированный ациклический граф, вершины которого нейроны разбиты на слои. Ребра – синапсы. Каждому ребру приписан свой вес и функция проводимости.

Три типа нейронов: входные (рецепторы) -- активируются извне; внутренние (центральные) -- активируются входными и прочими нейронами и активируют входные и прочие нейроны; выходные (эффекторы) -- получают импульсы от центральных и входных нейронов и отвечают за выполнение действия. Теоретическая концепция искусственной сети Маккаллоха и Питтса

Теоретическая концепция искусственной сети Маккаллоха и Питтса Правила функционирования сети: задержки в распространении активации одинаковы для всех нейронов сети; нейроны импульсируют не постоянно, а только в определенные моменты; каждый выходной синапс одного нейрона соответствует только одному входному синапсу следующего нейрона; на любом нейроне может сходиться несколько синапсов; входные синапсы вносят вклад в преодоление порога активации, при переходе через который (и только в этом случае) нейрон начинает передавать импульс.

Развитие нейронных сетей Фрэнк Розенблатт ( ), Корнельский университет, США -- перцептрон (1958)

Развитие нейронных сетей Фрэнк Розенблатт ( ), Корнельский университет, США «Принципы нейродинамики: перцептроны и теория мозговых механизмов»: интеграция данных компьютерного моделирования (включая перцептрон), нейрохирургии, регистрации активности отдельных нейронов и т.д.

Перцептрон Розенблатта

Однослойный персептрон характеризуется матрицей синаптических связей ||W|| от S- к A- элементам. Элемент матрицы отвечает связи, ведущей от i-го S-элемента (строки) к j-му A-элементу (столбцы).

Обучение нейронной сети Нейронная сеть обучается, чтобы для некоторого множества входных сигналов давать желаемое множество выходных сигналов. Каждое множество сигналов при этом рассматривается как вектор. Обучение осуществляется путем последовательного предъявления входных векторов с одновременной подстройкой весов в соответствии с определенной процедурой. В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор вырабатывал требуемый выходной вектор, используя правила, указанные выше.

Обучение перцептрона Обучение классической нейронной сети состоит в подстройке весовых коэффициентов каждого нейрона. Пусть имеется набор пар векторов {x a, y a }, a = 1..p, называемый обучающей выборкой, состоящей из p объектов. Вектор {x a } характеризует систему признаков конкретного объекта a обучающей выборки, зафиксированную S-элементами. Вектор {y a } характеризует картину возбуждения нейронов при предъявлении нейронной сети конкретного объекта a обучающей выборки:

Обучение перцептрона

Будем называть нейронную сеть обученной на данной обучающей выборке, если при подаче на вход сети вектора {x a } на выходе всегда получается соответствующий вектор {y a }, т.е. каждому набору признаков соответствуют определенные классы.

Обучение перцепторна Система связей между рецепторами S и A - элементами, так же как и пороги A - элементов выбираются некоторым случайным, но фиксированным образом Обучение – изменение коэффициентов ki. Задача: разделять два класса объектов: при предъявлении объектов первого класса выход перцептрона был положителен, а при предъявлении объектов второго класса – отрицательным. Начальные коэффициенты ki полагаем равными нулю.

Обучение перцептрона Предъявляем обучающую выборку: объекты (например, круги либо квадраты) с указанием класса, к которым они принадлежат. Показываем перцептрону объект первого класса. При этом некоторые A - элементы возбудятся. Значения возбуждений каждого нейрона образуют входной вектор. Коэффициенты ki, соответствующие этим возбужденным элементам, увеличиваем на 1. Предъявляем объект второго класса и коэффициенты ki тех A - элементов, которые возбудятся при этом показе, уменьшаем на 1. Процесс продолжим для всей обучающей выборки. В результате обучения сформируются значения весов связей ki. Значения пороговой функции – выходной вектор.

ОБУЧЕНИЕ НЕЙРОННОЙ СЕТИ Дональд Олдинг Хебб ( ) Итог -- образование «нейронного ансамбля», который все быстрее активируется при каждом очередном повторении входа. Правило Хебба (1949): между одновременно активированными нейронами сети пороги синаптической связи снижаются.

УПАДОК КОННЕКЦИОНИЗМА Марвин Минский, Сеймур Пейперт «Перцептроны»: приговор нейронным сетям?

РЕНЕССАНС КОННЕКЦИОНИЗМА Дэвид Румельхарт (Стэнфорд), Джеймс Макклелланд (Карнеги-Меллон) «Параллельно-распределенная переработка» ( PDP )

АРХИТЕКТУРА НЕЙРОННОЙ СЕТИ

Основные понятия: «Нейрон» ( unit, node ) -- элемент сети, который суммирует входные сигналы и, в случае превышения порога его активации, выдает выходной сигнал (1 или 0), выполняющий функцию активации или торможения в соответствии с весовым коэффициентом связи между ним и последующими нейронами. Функция связи между элементами сети («синапса») -- умножение сигнала на весовой коэффициент. Порог -- весовой коэффициент, связанный с постоянным входным сигналом, равным 1.

ОБУЧЕНИЕ НЕЙРОННОЙ СЕТИ: «Обучение с наставником»: задачи распознавания (заранее известен правильный ответ -> сеть настраивается на выдачу ответов, максимально близких к нему). «Обучение без наставника»: задачи классификации (правильный ответ неизвестен, но набор параметров относительно устойчив -> раскрытие внутренней структуры данных или связей между образцами). Смешанные формы обучения.

Алгоритм обучения (метод градиентного спуска aka обратное распространение ошибки) Выбрать очередную пару векторов Xk и Yk из обучающей выборки. Вычислить выход сети Y. Вычислить разность между выходом сети Y и требуемым выходным вектором Yk (целевым вектором обучающей пары). Т.е. определить ошибку нейронной сети. Подкорректировать веса сети wji так, чтобы минимизировать ошибку. Повторять шаги с 1 по 4 для каждой пары обучающей выборки до тех пор, пока ошибка не достигнет приемлемого уровня.

Обучение нейрона Угол между векторами: скалярное произведение / произведение длин Минимизация средней квадратичной ошибки при помощи корректировки весовых коэффициентов метод минимальных квадратов F(x) = mx+b MIN SS(m,b) = Σ(yi-f(xi)) 2 = Σ(yi-mxi-b) 2, i=1…n

Организация памяти (Макклелланд, 1981):

Работа сети Nodes organized in pools Inhibitory weights within pool Excitatory weights between pools Individual units point to property units Signals pass through network, and the network finds a stable pattern of processor activity

Преимущество нейронной сети Retrieve info from partial description Correct info from incorrect input Retrieve info not explicitly encoded Retrieve info after network damage

Коннекционизм Формирование у нейронной сети «социальных стереотипов»

ПРЕИМУЩЕСТВА СЕТЕВОЙ АРХИТЕКТУРЫ Возможность обучения Распределенное хранение информации ПРОБЛЕМЫ НЕЙРОСЕТЕВОГО ПОДХОДА Границы пластичности субстрата и «содержательная» специализация? Ограничения по типам решаемых задач

Нейронные сети Символьные модели неявные правила, «интуитивные» задачи (индивидуальные знания): умозаключение по аналогии, выделение фигуры на фоне и т.п. явные правила, формализуемые задачи (культурно-обусловленные общедоступные знания): например, логические и математические задачи. СИМВОЛЬНЫЕ И НЕЙРОСЕТЕВЫЕ МОДЕЛИ: «СФЕРЫ ВЛИЯНИЯ» Задачи, требующие обучения. Задачи, требующие конечного набора знаний.

Нейронные сети Символьные модели СИМВОЛЬНЫЕ И НЕЙРОСЕТЕВЫЕ МОДЕЛИ: «СФЕРЫ ВЛИЯНИЯ» «Холистическая» стратегия правого полушария «Аналитическая» стратегия левого полушария

Нейронная сеть распознавание образов, быстрые ответы на запросы сложной окружающей среды ВОЗМОЖНОСТИ ИНТЕГРАЦИИ НЕЙРОСЕТЕВОГО И СИМВОЛЬНОГО ПОДХОДОВ: ЭКСПЕРТНЫЕ СИСТЕМЫ Экспертная система принятие решений, логическая проверка выводов с учетом дополнительной информации

ВОЗМОЖНОСТИ ИНТЕГРАЦИИ НЕЙРОСЕТЕВОГО И МОДУЛЬНОГО ПОДХОДОВ: ПРОБЛЕМА ВРОЖДЕННОГО И ПРИОБРЕТЕННОГО В ПОЗНАНИИ «Наследственность» нейронной сети: количество элементов количество слоев правила и параметры распространения активации и изменения весов в разных слоях Достаточно ли этого для развития форм познания, характерных для человека?