Статистические методы классификации писем. Антиспамовые фильтры Выполнил Коренков Максим.

Презентация:



Advertisements
Похожие презентации
Spam и защита от Spam`a Степанов Виктор. Что такое спам?
Advertisements

Защита информации от вредоносных программ Выполнила ученица 10 «Б» класса Панина Мария.
ИСПОЛЬЗОВАНИЕ МОДИФИЦИРОВАННОЙ НЕЙРОСЕТИ С СЕЛЕКЦИЕЙ СУЩЕСТВЕННЫХ СВЯЗЕЙ ДЛЯ РАСПОЗНАВАНИЯ КОДОВ НА WEB-САЙТАХ Хакасский государственный университет им.
Классификация и регрессия Доклад по курсу Интеллектуальный анализ данных Закирова А.Р. 1.
Спам и защита от него. СПАМ Спам (от англ. spam) это массовая автоматическая рассылка рекламных электронных сообщений, со скрытым или фальсифицированным.
Наивный байесовский классификатор к.х.н. Варламова Екатерина Владимировна.
Моделирование поведения взаимодействующих агентов в среде с ограничениями Юданов А.А., студент 525 гр. Научный руководитель: к.ф.-м.н. Бордаченкова Е.А.
Единицы количества информации: вероятностный и объемный подходы 1.
Классификация, кластеризация и поиск изображений на основе низкоуровневых характеристик Наталья Васильева Руководитель: Новиков Б. А.
ЛОКАЛЬНЫЕ СЕТИ. Локальные сети с выделенным сервером без выделенного сервера.
Христова Татьяна Михайловна Христова Татьяна Михайловна 2014.
1 Моделирование поведения сложных динамических систем Докладчик: Юданов А.А. Научный руководитель: Бордаченкова Е.А Москва, 2009.
3.1. Назначение онтологий. Информационный поиск..
Алгоритм
Использование нейросимулятора при определении внешнего вида ребенка по параметрам родителей.
Основные принципы 1. Системный подход к организации обучения с четкими целями обучения 2. Пошаговое обучение, ориентированное на конкретного обучаемого.
Область определения и область значений функции. Вспомним Что такое функция? Что такое область определения функции Что такое область значений функции Функцией.
1 Трус Мария Александровна ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ УФИМСКИЙ ГОСУДАРСТВЕННЫЙ АВИАЦИОННЫЙ ТЕХНИЧЕСКИЙ.
ИНФОРМАЦИОННЫЕ СИСТЕМЫ СОДЕРЖАНИЕ Понятие информационной системы Информационное обеспечение Технологические платформы ИС Централизованная платформа Децентрализованная.
Повышение качества результатов анонимного интернет-голосования на основе анализа сетевых объектов Студеникин Роман Науч.рук. Гамаюнов Денис.
Транксрипт:

Статистические методы классификации писем. Антиспамовые фильтры Выполнил Коренков Максим

СПАМ! Легальные рассылки. Нелегальные рассылки(спам). Вредоносность спама.

Технические методы борьбы Для сервера Для клиента

Классификация спама Вероятностный подход. «Наивный» Байес. Обучаемые системы. Нейросеть Кохонена.

«Наивный» Байес не все входные переменные статистически независимы; допущение этой независимости и обуславливает приставку наивно- в названии алгоритма.

Сеть Кохонена Зависит от количества атрибутов Априорно должны знать количество кластеров

User Interface А. Лебедев:«Пользователь ленив» Модули расширения к The Bat!

User Interface

Результат неверной классификации Пользователь может повлиять на подстройку весов нейросети Кохонена: Пометить письмо как спам Пометить письмо как не спам

Выводы Оба реализованных метода хорошо себя зарекомендовали при классификации текста. Каждый из них имеет недостатки, которые легко компенсируются их совместной работой. К общим недостаткам стоит отнести зависимость точности классификации от обучающей выборки.