© А.Р. Урубков1 Введение Содержание: Постановка задачи Исходная информация для построения моделей Выборка Особенности исходных данных в выборке Основные.

Презентация:

Advertisements

Похожие презентации

Теория статистики Описательная статистика и получение статистических выводов Часть 2. 1.

Advertisements

ОСНОВНЫЕ СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ, ИСПОЛЬЗУЕМЫЕ В ГЕОЛОГИИ Лекция 3 по дисциплине «Математические методы моделирования в геологии» 1Грановская Н.В.

Российский университет дружбы народов Институт гостиничного бизнеса и туризма В.И. Дихтяр Теория и методология социально- экономических исследований в.

Российский университет дружбы народов Институт гостиничного бизнеса и туризма В.И. Дихтяр Теория и методология социально- экономических исследований в.

Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции

Лекция 1 Введение.. Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.

5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.

1 Описательная статистика. 2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные:

Лекция 2 – Идентификация закона распределения вероятностей одномерной случайной величины 2.1. Основные определения 2.2. Этапы обработки данных одномерной.

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.

Минаева Татьяна Александровна Демьяненко Ирина Николаевна.

Статистические оценки параметров распределения Доверительные интервалы.

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 2. Доверительные интервалы 2-1. Доверительный интервал для доли 2-2. Доверительный.

Лекция 6 Линейная регрессия. Простая линейная регрессия.

Авторы: Равичев Л.В., Ломакина И.А. Кафедра менеджмента и маркетинга РХТУ им. Д.И.Менделеева. Москва СТАТИСТИКА. Описательная статистика. Лекция.

Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.

Элементы математической статиститки. Статистика – дизайн информации.

АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.

Расчет оптимальной численности выборки. Статистическое наблюдение сплошное Обследование всех единиц изучаемой совокупности не сплошное Обследование части.

Типовые расчёты Растворы

Транксрипт:

© А.Р. Урубков1 Введение Содержание: Постановка задачи Исходная информация для построения моделей Выборка Особенности исходных данных в выборке Основные этапы построения моделей на основе статистической информации

© А.Р. Урубков2 Постановка задачи Цель Получить модель (расчетное соотношение, формулу)

© А.Р. Урубков3 Пример – оценка объекта недвижимости Цель Получить модель (расчетное соотношение, формулу)

© А.Р. Урубков4 Исходная информация для построения моделей– данные об объектах-аналогах или о результатах собственной деятельности – статистика (выборка).

© А.Р. Урубков5 Основные этапы построения моделей на основе статистической информации 1.Анализ имеющейся выборки - определение особенностей (законов) распределения количественных признаков; кластеризация данных. 2.Выявление наличия (отсутствия) взаимосвязи между зависимой переменной и влияющими на нее факторами. 3.Построение модели (регрессионной), связывающей между собой зависимую переменную и факторы. 4.Оценка качества модели. 5.Проведение расчетов, построение доверительных областей - диапазонов, в которых с заданной надежностью (гарантированно) находится «истинное» значение зависимой переменной.

© А.Р. Урубков6 Выборка (часть объектов, выбранных из генеральной совокупности для анализа) Генеральная совокупность (множество всех объектов-аналогов) Выборка

© А.Р. Урубков7 Основная цель формирования выборки – эффективное использование ее состава в качестве исходной информации для получения правдоподобных (достоверных) выводов обо всех объектах генеральной совокупности. Основное требование при формировании выборки – репрезентативность (представительность). Выборка должна в максимальной степени (как в «капле воды») отражать свойства и структуру генеральной совокупности и ее объектов.

© А.Р. Урубков8

9 Способы формирования выборок Случайный Систематический Экспертный Объем выборки N - не менее 10% от объема генеральной совокупности; N>30.

© А.Р. Урубков10 Выборочные данные – случайные величины (!). «Природа» случайности (неопределенности) выборочных данных Случайный характер отбора информации в выборку Ошибки (неточности) в данных, обусловленные неточностью (недостоверностью) собранной информации. Неоднородность выборки (данные относятся к разным периодам времени => различная «стоимость» денег, не однотипные объекты и др.). Особенности исходных данных (статистики)

© А.Р. Урубков11 Структура статистических наблюдений (статистики) Собранная информация (статистика) Ошибка «измерений» (невязка) «Среднее» значение величины

© А.Р. Урубков12 Выводы 1.Обработка информации должна проводиться методами математической статистики с учетом случайного (вероятностного) характера обрабатываемых величин. 2. Зависимая переменная, оцениваемая на основе статистической информации - случайная величина, характеризующаяся определенным законом распределения и соответствующими числовыми характеристиками.

© А.Р. Урубков13 выборки Первичная обработка статистической информации Анализ выборки методом группировки данных

© А.Р. Урубков14 Исследование выборки (алгоритм первичной обработки информации) Имеются данные выборки (ставки аренды, объемы продаж,….): 1. Исходные данные упорядочивают по возрастанию 2. Весь диапазон значений переменной разбивают на интервалы (карманы) одинаковой длины (от 5 до 15 интервалов). 3. Подсчитывают число значений n i, попавших в каждый интервал. 4. Результаты вычислений фиксируют в таблице. y мин y макс Y

© А.Р. Урубков15 Таблица первичной обработки информации

© А.Р. Урубков16 Используя данные таблицы строят гистограмму, характеризующую особенности распределения количественного признака выборки

© А.Р. Урубков17 Средства Excel для построения гистограмм (эмпирических законов распределения) Сервис Анализ данных Гистограмма

© А.Р. Урубков18 Пример. Риэлтер, занимающийся продажами на вторичном рынке жилья, случайным образом отобрал 100 предложений по однокомнатным квартирам с одинаковой планировкой и площадью и занес в таблицу их цены в пересчете на один квадратный метр общей площади (тысяч рублей)

© А.Р. Урубков19 Решение. Минимальное и максимальное значения стоимости 1 кв. м. квартир в выборке составляют 7 тысяч и 65 тысяч рублей. Этот ценовой диапазон удобно Разбить на 8 интервалов (см. табл.). Определяем количество квартир, попавших в соответствующий ценовой интервал (частота) и их долю (в процентах) от общего числа квартир в выборке (100 квартир). Интервал (ценовой диапазон) (тыс. руб / кв.м) Частота (число квартир в данном ценовом диапазоне) Относ. частота (доля квартир в данном ценовом диапазоне) До % % % % % % % Более %

© А.Р. Урубков20 Данные таблицы Вставка Диаграмма Гистограмма

© А.Р. Урубков21 Пример предварительного анализа выборки, собранной по офисным помещениям, предлагавшимся к продаже в г. Москве Размер выборки – 194 аналога Размер выборки – 194 аналога Дата сбора – –

© А.Р. Урубков22

© А.Р. Урубков23 Ценообразующие факторы, отраженные в выборке Округ Ближайшая станция метро Площадь, кв.м Класс здания/сооружения (А, В, С, D, E, F) Укрупненное местоположение (в границах Бульварного, Садового, ТТК, МКАД, за МКАД) Пешеходная доступность до станции метро, мин Границы участка выходят на магистраль городского значения Расположение внутри квартала (1-я, 2-я линии домов, внутри квартала) Тип объекта (ОСЗ, сооружение, встроенное, пристроенное помещение(я)) Год постройки (до 1917, до 1984, до 1999, позднее) Этажи, занимаемые оцениваемым объектом Вид доступа в помещения (отдельный вход, через проходную, общий вход / с улицы, со двора и т.п) Необходимость проведения ремонта (вид, объем) Дополнительно введено в рассмотрение Расстояние от центра (км по прямой от Кремля)

© А.Р. Урубков24

© А.Р. Урубков25

© А.Р. Урубков26 Выводы: - 86% офисов в выборке – офисы классов B,C,D. - Половина выборки состоит из офисов класса С

© А.Р. Урубков27

© А.Р. Урубков28

© А.Р. Урубков29 Характеристики и описание случайных величин в выборке

© А.Р. Урубков30 Эмпирический закон распределения случайной величины позволяет «выбрать» теоретический закон распределения и в дальнейшем использовать его для анализа и расчетов.

© А.Р. Урубков31 Замечания. 1. Наряду с законом распределения, не менее важными характеристиками любой случайной величины являются ее математическое ожидание μ (среднее значение) и дисперсия D (мера разброса). 2. Выборочные данные позволяют приближенно определить - оценить μ и D, характеризующие всю генеральную совокупность. 3. Оценки, полученные для μ и D, на основе выборочных данных – случайные величины. Они не могут считаться в точности равными истинным значениям математического ожидания и дисперсии, характерными для всей генеральной совокупности.

© А.Р. Урубков32 Математическое ожидание (среднее значение) случайной величины Выборочная средняя - оценка математического ожидания случайной величины. Характеризует «центр тяжести» распределения. В зависимости от закона распределения, средняя не обязательно может находиться в середине интервала. Существуют как симметричные относительно средней законы распределения, так и ассиметричные.

© А.Р. Урубков33 Дисперсия Выборочная дисперсия S 2 – оценка дисперсии D. Х арактеризует разброс случайной величины относительного ее среднего значения. Дисперсией назвали математическое ожидание для квадрата отклонения случайной величины от ее математического ожидания

© А.Р. Урубков34 Для практического анализа использовать дисперсию неудобно. Например, если некоторая величина измеряется в рублях (стоимость), то размерность разброса стоимости (дисперсия) – «рубль в квадрате». Поэтому для реальной оценки рассеивания ввели в оборот и стали использовать корень квадратный из дисперсии, который назвали - стандартн ое отклонение Выборочное стандартное отклонение S – оценка среднеквадратического (стандартного) отклонения σ.

© А.Р. Урубков35 Нормальный закон распределения и его свойства Нормальный закон распределения - самый распространенный закон, которому подчиняется большинство случайных величин, встречающихся в различных сферах практической деятельности - экономике, технике, медицине, биологии. Установлено, что независимые случайные величины, имеющие любые законы распределения, в сумме приводят к нормальному распределению. Причем, чем больше число слагаемых, тем ближе к нормальному закону распределена их сумма.

© А.Р. Урубков36 Основные свойства нормального распределения

© А.Р. Урубков37 Для нормального закона распределения, зная μ и σ, можно найти (оценить) доверительные интервалы для конкретных значений и диапазонов случайной величины. Для этого существуют специальные таблицы, а в Excel предусмотрены стандартные статистические функции и программы (Пакет анализа). Доверительные интервалы, кратные стандартному отклонению

© А.Р. Урубков38 Схема получения выводов и заключений на основе выборки

© А.Р. Урубков39

© А.Р. Урубков40 Средства Excel для вычисления числовых характеристик выборки Сервис Анализ данных Описательная статистика

© А.Р. Урубков41 Вычисляемые характеристики Среднее Стандартная ошибка Медиана Мода Стандартное отклонение Дисперсия выборки Эксцесс Асимметричность Интервал Минимум Максимум Сумма Счет

© А.Р. Урубков42 Примечание. Если пакет анализа в Excel не доступен, то его следует установить Сервис Надстройки Пакет анализа