Метод Гусениця -SSA Виконав : Студент групи СНм -51 Стодола Володимир Тернопіль,2010.

Презентация:



Advertisements
Похожие презентации
ПРОГНОЗУВАННЯ ЧИСЕЛЬНОСТІ ОКРЕМИХ БІОЛОГІЧНИХ ПОПУЛЯЦІЙ.
Advertisements

Кожен оточуючий нас обєкт має свої властивості. Обєкт – цілісна частина навколишнього світу. Наприклад, стіл має такі властивості, як розміри, форму,
Основи алгоритмізації та програмування Надання значень величинам. Вказівки присвоєння та введення.
Модель Виконали: студенти групи маг МІ-3 Волошин Андрій.
Запити в Access Запити в базі даних Запити використовуються для перегляду, зміни й аналізу даних різними способами. Основні операції з використанням.
Бази даних Поняття про моделі даних. Види моделей даних Бази даних.
Тема : О сновні е лементи комбінаторики Підготували: Щур Х., Фощанко А., Король Л., Мацупа Н.
Підготували: Бондарчук О., Сірий О.. § Визначники Усі визначники незалежно від свого порядку, мають однакові властивості, тому їх краще всього демонструвати.
Основні поняття У математиці матрицею називають прямокутну таблицю, у кожній клітинці якої записане число. Їх називають елементами матриці
СЗШ І-ІІІ ступенів с.Старичі Діаграми в Excel Графічний аналіз даних.
Практична робота 3 "Форматування в електронних таблицях. Використання формул" 11 клас Рівень стандарт Урок 10.
Лекція 1. Інформаційні системи в управлінні економікою. 1.Поняття інформаційної системи. 2.Класифікація інформаційних систем. 3.Структура інформаційної.
1 АНАЛІЗ ВАРІАЦІЙНИХ РЯДІВ ЛЕКЦІЯ 7. 2 ПЛАН Предмет математичної статистики. Генеральна сукупність та вибірка. Оцінки параметрів генеральної сукупності.
Самостійна робота студента Самостійна робота студентів - оцінюється під час поточного контролю теми на відповідному занятті.
Презентація на тему: Школа кількісного (економіко-математичного) підходу
База даних (БД) це структурована сукупність взаємопов'язаних даних певної предметної області (реальних об'єктів, процесів, явищ тощо). це структурована.
Основи комбінаторики. Робота студентів економічного факультету II курсу, 9 групи: Кислюк Аліни, Сімончук Марини, Федоренко Катерини, Цибори Аліни
Мета уроку : повторити вивчений матеріал по темі «Функція»; вивчити поняття області визначення та області значень функції;навчитися шукати область визначення.
Функція. Область визначення і область значення функції.
Підготував учень 10 класу Бондаренко Руслан. Стовпчасті діаграми доцільно створювати тоді, коли потрібно порівняти значення кількох наборів даних, графічно.
Транксрипт:

Метод Гусениця -SSA Виконав : Студент групи СНм -51 Стодола Володимир Тернопіль,2010

Гусениця SSA SSA (Singular spectrum analysis) - метод аналізу часових рядів, заснований на перетворенні одновимірного часового ряду в багатовимірний ряд і подальшого застосування до отриманого багатовимірному тимчасовому ряду методу головних компонент. Спосіб перетворення одновимірного ряду в багатовимірний представляє собою « згортку » тимчасового в матрицю, що містить фрагменти тимчасового ряду, отримані з деяким зрушенням. Загальний вигляд сдвиговой процедури нагадує « гусеницю », тому сам метод нерідко так і називають - « Гусениця »: довжина фрагмента називається довжиною « гусениці », а величина зсуву одного фрагмента щодо іншого кроком « гусениці ».

Історія Broomhead і King (1986) пропонують використовувати SSA і М - SSA в контексті нелінійної динаміки в цілях відновлення атрактор системи з виміряних часових рядів. Ghil, Vautard і співробітники (Vautard і Ghil, 1989; Ghil і Vautard, 1991;. Vautard та ін, 1992) зауважив, аналогію між траєкторією матриця Broomhead і King, з одного боку, і Karhunen (1946)- Loève (1945) аналіз головних компонент у домені часу, з іншого. Таким чином, SSA може бути використаний як метод області часу і частоти для аналізу часових рядів - незалежно від аттрактора реконструкції і в тому числі випадків, в яких останній може дати збій. В даний час роботи, присвячені методологічним аспектам та застосування SSA обчислююься сотнями. Багато літератури надаються Elsner and Tsonis (1996), Danilov and Zhigljavsky (1997), Golyandina et al. (2001), and Ghil et al. (2002).

Актуальнісь використання SSA В даний час актуальним є аналіз і прогнозування товарних і фінансових ринків з використанням методів математичної статистики. Традиційні підходи, засновані на використанні класичних моделей типу " тренд + шум » або « авторегресії - ковзного середнього » призводять до задовільних результатів лише для рядів досить простої структури Особливістю тимчасових рядів, що відображають поведінку ринку, є те, що їх характеристики ( ціни, обсяги угод, індикатори і т. д.) формуються з декількох складових : повільної - трендом, періодичної чи коливальної складової і випадкової складової описуваної випадковим процесом певного типу. Важливою особливістю періодичної складової, у свою чергу, є наявність періодичності зі змінним періодом і амплітудою. З причини розглянутих особливостей для дослідження фінансових ринків погано застосовні класичні методи аналізу, такі як аналіз Фур ' є, регресійний аналіз чи вейвлет - аналіз, тому що вони використовують розкладання вихідної функції в ряд по фіксованій системі базисних функцій, що породжує властивість строгої періодичності.

Альтернативним підходом, використовуваним для аналізу та прогнозу ринків, є Сингулярний Спектральний Аналіз SSA (Singular Spectrum Analysis), заснований на динамічній модифікації методу головних компонент. Даний підхід заснований на дослідженні тимчасового ряду методом головних компонент і не вимагає попередньої стабілізації ряду. SSA дозволяє досліджувати структуру часового ряду, виділити окремі його складові та прогнозувати як сам ряд, так і тенденції розвитку його складових. Особливостями методу є такі його властивості, як інтерактивність ; візуалізація результатів обчислень.

Ідеї створення : Першою ідеєю, що лежить в основі методу, є створення повторюваності шляхом переходу від тимчасового ряду, наприклад послідовності цін у рівновіддалені моменти часу, до послідовності векторів, що складаються з відрізків тимчасового ряду обраної довжини. Таким чином, виходить багатовимірна вибірка, іншими словами, мається на увазі, що якщо вихідний ряд мав якусь структуру, то і відрізки успадковують цю структуру. Другою ідеєю є аналіз отриманої багатовимірної вибірки за допомогою її сингулярного розкладання або, використовуючи статистичні аналогії, аналізу головних компонент, виділення значущих компонент і подальшому відновленні, заснованому на угрупованню і діагональному усередненні. Тим самим виходить розкладання вихідного часового ряду ( його траекторної матриці ) по базису, породжуваному їм самим.

Перевагою методу « Гусениця »-SSA є відсутність вимоги апріорного завдання моделі ряду, а також можливість виділення гармонійних складових до мінливих амплітудами і частотами, що вигідно відрізняє його від методів, в основі яких лежить метод Фур ' є. Недоліком методу, що обмежує можливості його застосування, є припущення про лінійність моделі досліджуваного ряду. На перший план висувається завдання вибору достатньо універсальної моделі часового ряду, що дозволяє відобразити суттєві особливості його нелінійної динаміки, найчастіше носить хаотичний характер. Для вирішення подібних завдань ефективні методи, засновані на ядерних методах (kernel methods), що забезпечують можливість моделювання нелінійних зв ' язків у фінансових часових рядах при порівняно малому обсязі апріорної інформації.

модифікація методу для аналізу рядів з пропусками Нехай вихідний часовий ряд складається з N елементів, частина яких невідома. Опишемо схему алгоритму для випадку відновлення першої складової ряду на основі суми двох :

Перший етап : розкладання 1. Вкладення. Зафіксуємо довжину вікна L:1

2. Знаходження базису. Нехай - власні числа матраци, взяті в незростаючими порядку - ортонормованна система власних векторів матриці відповідних власним числам, d = max { і : > 0}. Задамо два вектори Якщо ввести операцію "*" таким чином : то при множенні векторів без пропусків результат виконання операції збігається зі скалярним добутком, а для векторів з пропусками буде чисельно замінювати скалярний твір. В якості матриці можна взяти матрицю яка обчислюється де X - траєкторна матриця ряду F N, яка містить пропуски. Далі утворюємо матрицю що складається з векторів вкладення, утримуючиих не більше пропущених компонент, і

Другий етап : відновлення 3. Проекція векторів вкладення На початку проводиться вибір підпростору проекти векторів вкладення без пропусків Вибирається набір номерів з допомогою яких утворюється підпространство відповідне виділеній компоненті. відбувається проектування векторів вкладення без пропусків на вибраний підпростір строється проекція векторів вкладення з пропусками Для кожного вектора вкладення з пропусками на місцях з Р ( своє для кожного вектора ) апроксимація траекторної матриці ряду при правильному виборі множини I r.

4. Діагональне усереднення. На останньому кроці базового алгоритму матриця переводиться в новий ряд ( відновлений ряд ) за допомогою операції діагонального усереднення. Задача 105 студентів 35 спроб здачі тестів Вводимо позначення Ns - кількість студентів Na - кількість спроб для кожного студента значення тимчасового ряду оцінок тестування знань для і - го студента в j- й спробі

Тимчасові ряди з пропущеними значеннями отримуємо за допомогою видалення з вихідного {f ij } ряду n значень, поріг кількості пропущених компонент. У нашому випадку =15 сімейство тимчасових рядів кількість варіантів видалення а значен m з вихідного часового ряду загальга кількість тимчасових рядів ( для всіх студентів )

У нашому випадку при n> 4 кількість варіантів перевищує 10 6 У цьому випадку конкретні часові ряди генеруються випадковим чином за допомогою методу Монте - Карло. Таким чином Застосовуємо модифікацію методу SSA для відновлення тимчасового ряду Отримуємо сімейство відновлених тимчасових рядів

Математичне сподівання « помилки » алгоритму відновлення визначається за формулою : а стандартне відхилення дорівнює

статистичні результати імітаційного моделювання алгоритму відновлення тимчасового ряду з пропусками. Для конкретних значень кількості пропущених значень ( від 1 до 15) визначалися довірчі інтервали « помилки » алгоритму з рівнем довіри 90%. Статистичний аналіз показав, що якщо число пропущених значень не перевищує семи, то « помилка » алгоритму відновлення не більше 20%.

Це означає, що розбіжність між оцінками не перевищує один бал за п ' ятибальною шкалою. при великих помилках тести вже не оцінюють адекватно знання студентів. Тому при кількості пропущених значень більше семи, алгоритм SSA не можна використовувати для відновлення тимчасового ряду результатів тестування знань студентів.

Висновок За порівняльним аналізом ефективності SSA з класичними методами Технічного Аналізу показує, що SSA підхід, принаймні, також хороший, а в багатьох випадках перевершує класичні засоби Технічного Аналізу. При цьому часто він дозволяє виявити ефекти, які розпізнати стандартними методами не представляється можливим.

Використанні джерела 1. html html 2. SSA_%28%D0%BC%D0%B5%D1%82%D0%BE% D0%B4%29 SSA_%28%D0%BC%D0%B5%D1%82%D0%BE% D0%B4% analysis#Brief_history analysis#Brief_history 4. /Bochar.pdf /Bochar.pdf / 3/

Дякую за увагу