Статистичні методи вивчення взаємозв'язку даних Розділ 10 Підготувала учитель інформатики Слівіна Л.І. 11.08.20151.

Презентация:



Advertisements
Похожие презентации
Основи кореляційного аналізу Інформатика 10 клас Фролов М.А. Новоолександрівська СЗОШ Єланецький р-н Миколаївська обл.
Advertisements

Основні поняття У математиці матрицею називають прямокутну таблицю, у кожній клітинці якої записане число. Їх називають елементами матриці
1 АНАЛІЗ ВАРІАЦІЙНИХ РЯДІВ ЛЕКЦІЯ 7. 2 ПЛАН Предмет математичної статистики. Генеральна сукупність та вибірка. Оцінки параметрів генеральної сукупності.
Урок 17 7 клас. Електронні таблиці. Табличний процесор MS Excel.
ФУНКЦІЇ ТА ГРАФІКИ. ЛІНІЙНА ФУНКЦІЯ. Повторення та систематизація знань.
1 Тема 5 Мультиколінеарність Кафера інформатики та компютерних технологій доцент Бесклінська О.П.
Функції. Графік функції x y 01 Геометрія 7 клас. Мета: Домогтися свідомого розуміння учнями поняття функції, області визначення і області значень функції,
ЛІНІЙНА ФУНКЦІЯ, ЇЇ ГРАФІК ТА ВЛАСТИВОСТІ. Перевірка домашнього завдання Зразок 1 X–3–3,51,252,53,3 y33,5222,53.
Я порівнюю таємниці Природи із законами математики. Я був, і до цього часу залишаюся переконаним, що один і той самий ключ відкриває зміст одного й другого.
Мета уроку : повторити вивчений матеріал по темі «Функція»; вивчити поняття області визначення та області значень функції;навчитися шукати область визначення.
ФУНКЦІЯ. ОБЛАСТЬ ВИЗНАЧЕННЯ ТА ОБЛАСТЬ ЗНАЧЕНЬ ФУНКЦІЇ.
1 Тема 4 Класична лінійна багатофакторна модель. Кафера інформатики та компютерних технологій доцент Бесклінська О.П.
Правильні варіанти відповідей АБВГ 1 а 2 зсувом вгору на 7 одиниць 3 х 1 = - 3; х 2 = b= – 4 АБВГ 1 б 2 зсувом вниз на 2 одиниці 3 х 1 =9; х 2 =
Рівняння Основна тотожність квадратного кореня Основна тотожність квадратного кореня.
Розвязування квадратичних та дробово-рацінальних нерівностей Алгебра 9 клас Презентація Довжаниці О.Б. Деражненська ЗОШ І-ІІІ ступенів.
Урок Урок 7 клас Побудова зображень, що дає тонка лінза.
Первісна та її властивості.. Функція F(x) називається первісною функції f(x) на деякому про ­ міжку, якщо для всіх x із цього проміжку виконується рівність.
СТАТИСТИКА- ЦЕ НАУКА, ЯКА ВИВЧАЄ, ОБРОБЛЯЄ Й АНАЛІЗУЄ КІЛЬКІСНІ ДАНІ ПРО НАЙРІЗНОМАНІТНІШІ МАСОВІ ЯВИЩА В ЖИТТІ.
СЗШ І-ІІІ ступенів с.Старичі Діаграми в Excel Графічний аналіз даних.
Мета: вивчити властивості лінійної функції: -Область визначення -Область значень -Розміщення графіка в системі координат -Точки перетину графіка з осями.
Транксрипт:

Статистичні методи вивчення взаємозв'язку даних Розділ 10 Підготувала учитель інформатики Слівіна Л.І

Зміст 1.Статистичні ряди розподілу 2.Поняття кореляційного зв'язку та коефіцієнта кореляції 3.Рівняння та лінія тренду 4.Прогнозування даних 5.Кореляційна матриця 6.Практичні завдання, практичні роботи

Урок Основні поняття: статистичні ряди розподілу, атрибутивні та варіаційні ряди розподілу, дискретні та інтервальні ряди розподілу, абсолютні та відносні частоти. 2.Практичне завдання1 3.Узагальнення отриманих знань і результатів виконання завдання1

Основні поняття Для виконання статистичних досліджень часто варіанти вибірки групують за відповідними ознаками. Виконуючи ЗАВДАННЯ 2 у минулому розділі, ми групували вік батьків і обчислювали скільки разів повторювалася відповідна варіанта Аналізувати ці значення нам стало зручніше. Групування також здійснюють, коли про об'єкт дослідження відомо декілька різних властивостей. Така таблиця називається статистичним рядом розподілу, а кількість повторень значення називають частотами.

Завдання 1 Вкажіть за якими властивостями можна згрупувати статистичні дані з таблиці. об'єктширинадовжинаколірматеріал 1 Стіл учнівський жовтий дерево 2 Стіл учнівський 89109синійдерево 3 Стіл учнівський 91111блакитнийпластик 4дошка110150чорнийзалізо 5дошка111151білийскло 6дошка119152білийелектронна 7дошка112148білийпластик 8дошка118149брунатнийдерево Чи можна групувати статистичні дані про різні об'єкти? Відповідь поясніть.

Різновиди рядів розподілу Атрибутивні Варіаційні Дискретні інтервальні

Визначення Якщо за основу групування взята якісна ознака такий ряд розподілу називається атрибутивним. Приклад Розподіл учнів за місцем проживання. 7 ознака Батальонна Шевченко Західна частоти Якщо за основу групування взята кількісна ознака такий ряд розподілу називається варіативним. Приклад Розподіл учнів за успішністю навчання. ознака частоти Наведіть свої приклади. Практичне завдання аркуш Ряди розподілу. Для побудови дискретного ряду розподілу використайте функцію СЧЕТЕСЛИ.

Визначення Коли окремим частотам зіставляється окреме значення ознаки це дискретний ряд, а якщо інтервал таких значень – то такий ряд називаємо інтервальним. 8 ознака частоти Визначте які це ряди розподілу ? ознака частоти Практичне завдання аркуш Ряди розподілу Вкажіть тип варіаційного ряду розподілу

Абсолютні та відносні частоти Ряди розподілу за частотами абсолютнівідносні ознака абсолютні частоти ознака відносні частоти 0,6 0,2 0,3 ознака х1х2 х3 відносні частоти м1/р м2/р м3/р мі- абсолютна частота, р – сума всіх частот (об'єм вибірки) Практичне завдання аркуш Ряди розподілу Обчисліть відносні частоти для рядів розподілу. Побудуйте кругові діаграми для отриманих рядів розподілу з відносними частотами.

Результат виконання Завдання1

Використання функції ЧАСТОТА для формування інтервального ряду розподілу в EXCEl Для побудови за вибіркою інтервального ряду розподілу, що складається з декількох рівних інтервалів в EXCEl використовуємо такий алгоритм: 1.Визначте найбільшу і найменшу варіанти та ширину інтервалу. 2.Визначте межі інтервалів. 3.Підрахуйте кількість варіант, які потрапляють у кожен інтервал за допомогою функції ЧАСТОТА(масив_варіант;масив_інтервалів) Зауваження Спочатку виділіть всі клітинки діапазону, які відповідають значенням інтервалів, у першу клітинку уведіть функцію =ЧАСТОТА. Після заповнення масиву варіант та масиву інтервалів натисніть одночасно клавіші CTRL+SHIFT+ENTER.

Вправа 10_1 Побудуйте інтервальний ряд розподілу для значень зросту учнів з таблиці2, вибравши кількість інтервалів з таблиці1, відповідно вашого варіанта. Обчисліть значення у таблиці3 і межі інтервалів у таблиці4. Створіть інтервальний ряд розподілу у таблиці5.

Обчислення статистичних показників варіаційних рядів розподілу Середнє значення вибірки де n - обсяг вибірки; k - число інтервалів групування; ni - частоти інтервалів; xi - серединні значення інтервалів. ознака х1… хk абсолютні частоти n1 … nk Дисперсія варіаційного ряду розподілу та стандартне відхилення

Статистичні показники варіаційних рядів в Excel відсутні Для обчислення середнього, дисперсії і стандартного відхилення треба використовувати формули. Приклад Знайти середнє значення вибірки варіаційного ряду розподілу :

Основи кореляційного та регресійного аналізу Проблеми аналізу між різними вибірками статистичних даних досліджують використовуючи засоби кореляційного аналізу. Він дозволяє визначити чи є звязок між явищами, які досліджуються. Цей звязок називають кореляційним зв'язком. Якщо звязок виявився значним, то можна застосовувати засоби регресійного аналізу. Основне завдання регресійного аналізу полягає у визначенні характеру зв'язку і побудові його математичної моделі. На основі моделі можна передбачити або спрогнозувати ту чи іншу подію, спрогнозувати розвиток певних процесів об'єкта дослідження. Дослідити клас гандболістів за результативністю влучення у м'яч в іграх чемпіонату. Приклад

Факторні та результативні ознаки Ознаки від яких залежать інші називають факторними, а залежні ознаки називають результативними. Наведіть приклади факторних та результативних ознак за цими малюнками.

Кореляційний зв'язок Якщо при збільшенні значень факторної ознаки збільшуються значення результативної ознаки, це називають прямим кореляційним зв'язком. Якщо при збільшенні значень факторної ознаки зменшуються значення результативної ознаки, це називають оберненим кореляційним зв'язком. Якщо при збільшенні значень факторної ознаки значення результативної ознаки поводять себе хаотично, кажуть, кореляційний зв'язок відсутній.

Приклади кореляційного зв'язку х12,133,74,65,9 у24,35,78,48,812 х12,133,74,65,9 у124,35,78,48,82 х12,133,74,65,9 у128,88,45,74, Визначте наявність і тип кореляційного зв'язку за даними діаграм (1-3)

Завдання 4 Проаналізувати захворюваність на астму в залежності від концентрації чадного газу. За значеннями таблиці побудувати точкову діаграму на цьому аркуші. Вісь Х - факторні ознаки, вісь У - результативні ознаки. Визначте тип кореляційного зв'язку за діаграмою. Концентрація чадного газу, мг/м3 1,22,402,563,103,504,204,80 Кількість хронічно хворих на астму на 1000 жителів

Виконання завдання 4 початок 21 Прямий кореляційний зв'язок

Коефіцієнт кореляції |k|0,8 Сильний зв'язок 0,4|k|0,8 Наявний кореляційний зв'язок |k|<0,4 кореляційний зв'язок відсутній Міцність зв'язку між двома ознаками будемо виражати за допомогою коефіцієнта кореляції. може набувати значення від -1 до 1. від'ємний КК показує що дані взаємопов'язано розходяться, додатний КК - що дані взаємопов'язано зростають, 0 і близькі значення свідчать про те, що дані не пов'язані один з одним.

Діаграми розсіювання при різних значеннях коефіцієнта кореляції

Обчислення коефіцієнта кореляції у MS Excel КОРРЕЛ(масив1;масив2) Масив1 це клітинки інтервалу значень. Масив2 це другий інтервал клітинок зі значеннями. Дані 1Дані Формуларезультат =КОРРЕЛ(A2:A6;B2:B6) Коефіцієнт кореляції між двома масивами (0,997054) Між текстовими ознаками неможливо обчислювати коефіцієнт кореляції. На аркуші Вправа10_8 обчисліть коефіцієнт кореляції для значень таблиці.

Недоліки функції КОРРЕЛ Функція КОРРЕЛ визначає коефіцієнт лінійної кореляції, але звязок між ознаками може бути і близький до параболи, що свідчить про наявність квадратичного зв'язку, але коефіцієнт кореляції при цьому може бути незначним.

Побудова лінії тренду Для точкової діаграми часто використовують лінії тренду. (За допомогою контекстного меню точки на діаграмі вибрати команду Додати лінію тренду - Формат).

Прогнозування Якщо коефіцієнт кореляції вказує на сильну залежність результативної ознаки від факторної, то можна прогнозувати результативні ознаки за допомогою регресійного аналізу. Для прогнозування будемо використовувати рівняння регресії y=f(x), де х- факторна ознака, а у – результативна ознака. Рівняння регресії можна подати у вигляді графіків (лінія тренду) або у вигляді формул. Близькість рівняння регресії до лінії тренду характеризують коефіцієнта детермінації 0R 21. В Excel називають величину достоверности апроксимації. За отриманим рівнянням регресії можна прогнозувати нові значення результативної ознаки.

Завдання 4 Продовження Спробуємо дізнатися яким буде рівень захворювання на астму, якщо концентрація чадного газу становитиме 6; 7; 8; 9;10 мг/м 3 ? Побудуємо точкову діаграму і додамо до неї лінію тренду та рівняння регресії і R 2. Визначте за формулою нові прогнозовані значення кількості хворих в залежності від концентрації чадного газу.

Кореляційна матриця в Excel Для порівняння більшої кількості вибірок будують кореляційну матрицю, у якій коефіцієнти кореляції між ознаками розташовані на перетині відповідних рядків і стовпців.

Приклад Обчислення кореляційного зв'язку між різними вибірками Визначити рівень зв'язку між різними вибірками даних к1,к2,к3,к4. Кореляційну матрицю отримаємо на новому аркуші.

Аналіз отриманих результатів к1к2к3к

Прогнозування

Завдання 5 Кореляційний і регресійний аналіз За варіантами вибірок побудуйте кореляційну матрицю на новому аркуші. Визначте за допомогою кореляційної матриці, між якими ознаками найсильніший та найслабкіший зв'язок. Скопіюйте значення з цих пар стовбців у нові таблиці на цьому аркуші. Відсортуйте значення у перших стовпцях цих таблиць і за значеннями других стовпців побудуйте дві точкові діаграми. Визначте наявність кореляційного зв'язку. Для діаграми з найсильнішим зв'язком додайте лінію тренду, рівняння регресії і коефіцієнт детермінації. Вкажіть у параметрах лінії тренду значення для прогнозування на 3 одиниці вперед. За рівнянням регресії визначте нові прогнозовані значення результативної ознаки. Факторні значення виберіть самостійно. хуас

Практична робота 10_Е Таблиця 1 Рік Відрахування на розвиток соціальної сфери, тис. грн Кількість лікарнян их листків У таблиці 1 наведені дані про щомісячні відрахування на розвиток соціальної сфери підприємства та про рівень захворюваності його працівників протягом 12 років. З'ясуйте, чи існує між цими показниками залежність, визначте її тип та спрогнозуйте, як зміниться рівень захворюваності працівників, якщо відрахування на розвиток соціальної сфери збільшити до грн.. Визначте також, як зміниться рівень захворюваності у разі зменшення відрахувань до грн.

Практична робота 10_Б Потрібно встановити, чи існує зв'язок між цими параметрами і спрогнозувати, яким скоріш усього буде пульс у людини, маса якої становить 100 кг. маса, кгчастота пульсу Визначити коефіцієнт кореляції, побудувати точкову діаграму, визначити коефіцієнт детермінації і рівняння регресії. Визначити за рівнянням регресії прогнозоване значення.

Практична робота 10_М Розв'язати задачу апроксимації трансцендентних функцій поліномами. Для заданої функції за варіантом потрібно знайти поліном, який найменше відхилявся б від цієї функції на відрізку [a,b]. Найпростішими прикладами трансцендентних функцій служать показова функція, тригонометричні функції, логарифмічна функція. Приклад Апроксимувати функцію у= 5sin3x-6, x є [π,6] Виконання завдання 1.Створити таблицю значень функції на заданому відрізку. 2.Побудувати діаграму типу графік. 3.Визначити степінь полінома і додати лінію тренду до діаграми. Тип лінії тренду – Поліноміальна степінь 3. Параметри: рівняння регресії та коефіцієнт детермінації.

Домашнє завдання 1.Протягом року продовольча компанія здійснювала рекламу продукції за допомогою рекламних листівок у кількості від до штук за місяць. Визначити, чи був цей захід ефективним і як вплине на дохід компанії розповсюдження на протязі місяця листівок. 37 місяць Кількість рекламних листівок, тис.шт Дохід компанії млн.грн.243,51,3531,22,30,20,533,3 Коефіцієнт кореляції Коефіцієнт детермінації лінійний тренд Коефіцієнт детермінації поліноміальний тренд