ОЦЕНКА ЭФФЕКТИВНОСТИ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ С.А.Амелькин Институт программных систем имени А.К.Айламазяна РАН.

Презентация:



Advertisements
Похожие презентации
Лекция 7: Метод потенциальных функций Предположим, что требуется разделить два непересекающихся образа V1 и V2. Это значит, что в пространстве изображений.
Advertisements

Теория систем и системный анализ Тема5 «Оценка сложных систем. Основные типы шкал измерения »
Построение уравнения регрессии. Задача Коэффициент корреляции.
Проверка статистических гипотез 1.Формулировка задачи. Термины и определения. 2.Схема проверки статистической гипотезы. 3.Мощность критерия. 4.Проверка.
Урок-зачёт. Тема: функции и их графики.. x x x x 4 5 y y y y y 1.График какой функции лишний? 2. На каком рисунке изображён график прямой пропорциональности?
Свойства коэффициентов регрессии и проверка гипотез.
МЕТОД СКОЛЬЗЯЩЕГО КОНТРОЛЯ ДЛЯ ОЦЕНКИ КАЧЕСТВА РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ- СЕРВИСОВ А.Ю. Каминская, Р.А. Магизов Научный руководитель – Д.И. Игнатов Государственный.
Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
3.1. Назначение онтологий. Информационный поиск..
МОНИТОРИНГ СОСТОЯНИЯ ЭКОНОМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ АНАЛИЗА ДИНАМИКИ ЭНТРОПИИ А.Н. Тырсин 1, О.В. Ворфоломеева 2 1 – НИЦ «Надежность и ресурс больших систем.
МНОГОМЕРНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ. Совместное распределение термин, относящийся к распределению нескольких случайных величин, заданных на.
Регрессионный анализ и заполнение пробелов Лекция 4.
Симплекс-метод Лекции 6, 7. Симплекс-метод с естественным базисом Симплекс –метод основан на переходе от одного опорного плана к другому, при котором.
Анализ данных Лекция 5 Методы построения математических функций.
Статистическая проверка статистических гипотез.. Нулевая гипотеза - выдвинутая гипотеза. Конкурирующая гипотеза - - гипотеза, которая противоречит нулевой.
МБОУ «Основная общеобразовательная школа 36» Автор: Максимович Галина Рамильевна, учитель математики I квалификационной категории.
Лабораторная работа 6 Обработка результатов эксперимента в MathCad.
Корреляционная таблица. Коэффициент линейной кор-ии Пирсона.
Проверка статистических гипотез Основные понятия и терминология Что такое статистическая гипотеза? Лекция 6.
Транксрипт:

ОЦЕНКА ЭФФЕКТИВНОСТИ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ С.А.Амелькин Институт программных систем имени А.К.Айламазяна РАН

ЗАДАЧИ Задача восстановления оценки Задача составления рекомендации Составление упорядоченного множества объектов RCDL'2012 Переславль-Залесский, октября Постановка задачи Формулировка критериев Построение алгоритма решения

ЗАДАЧА ВОССТАНОВЛЕНИЯ ОЦЕНКИ Задачей рекомендательной системы является расчет значений r i, максимально близких к величинам v i, при заданном множестве пар (пользователь, объект), для которых известны v i. RCDL'2012 Переславль-Залесский, октября Другие: корреляции, Махаланобис Функция близости Метрики: совместно монотонны

ФУНКЦИИ БЛИЗОСТИ: МЕТРИКИ Результат работы рекомендательной системы: вектор R=(r 1, r 2, …, r n ) представляет собой точку в пространстве M n, где M – множество (спектр) оценок, допустимых в используемой шкале. Этому же пространству принадлежит точка V=(v 1, v 2, …, v n ). Если на пространстве М n выбрана норма ||V||, например, из класса lp, то соответствующее этой норме расстояние (метрика Минковского) может служить критерием эффективности. RCDL'2012 Переславль-Залесский, октября Нормированное расстояние

ФУНКЦИИ БЛИЗОСТИ: ДРУГИЕ Расстояние Махаланобиса: RCDL'2012 Переславль-Залесский, октября

ЗАДАЧА СОСТАВЛЕНИЯ РЕКОМЕНДАЦИИ Разделим принятую в данной рекомендательной системе шкалу на две страты: P – положительные оценки и N – отрицательные оценки. Тогда работа рекомендательной системы представляет собой проверку гипотезы H 0 : v i P. RCDL'2012 Переславль-Залесский, октября v i Pv i N r i P положительный прогноз верен ошибка 1 рода ( -ошибка) r i Nошибка 2 рода ( -ошибка)отрицательный прогноз верен

КОЭФФИЦИЕНТЫ АССОЦИАТИВНОСТИ RCDL'2012 Переславль-Залесский, октября precision positive prediction value точность recall (recall rate), true positive rate, sensitivity, hitrate, coverage Полнота negative prediction value точность отрицательного прогноза specificityспецифичность accuracyсовстречаемость обозначив pa, pb частоты a и b ошибок, получаем связь между ними и аккуратностью 1 – pb = pa +acc

КОЭФФИЦИЕНТЫ АССОЦИАТИВНОСТИ RCDL'2012 Переславль-Залесский, октября F-measure (F score) F мера (мера Ван Ризбергена) false discovery rate false positive rare fall-out

НЕОДНОЗНАЧНОСТЬ РЕЗУЛЬТАТА Критерии могут быть противоречивыми: уменьшение уровня значимости (pa) возможно только за счет снижения мощности критерия проверки гипотезы (1 – pb). Если в качестве критериев деятельности рекомендательной системы выбраны несколько таких противоречивых критериев, то настройки системы могут обеспечить увеличение эффективности по одному из критериев только за счет ухудшения эффективности по другому. Зависимость между предельными значениями критериев эффективности называется множеством Парето. Такое множество для рекомендательных систем строится, как правило либо для показателей prc(rcl), либо для rcl(fpr). Свертка критериев, например, коэффициент корреляции Мэтью: RCDL'2012 Переславль-Залесский, октября

СОСТАВЛЕНИЕ УПОРЯДОЧЕННОГО МНОЖЕСТВА ОБЪЕКТОВ Задача рекомендательной системы – найти такие оценки r i, чтобы для максимального числа пар (i, j) (i=1, …, n; j=1, …,n; i j) выполнялось условие: RCDL'2012 Переславль-Залесский, октября

КРИТЕРИИ RCDL'2012 Переславль-Залесский, октября

КРИТЕРИИ RCDL'2012 Переславль-Залесский, октября

Сергей Амелькин RCDL'2012 Переславль-Залесский, октября