ГОРАЗДО ЛЕГЧЕ ЧТО-ТО ИЗМЕРИТЬ, ЧЕМ ПОНЯТЬ, ЧТО ИМЕННО ВЫ ИЗМЕРЯЕТЕ Дж. Салливен ВСЕ, ЧЕГО НЕЛЬЗЯ ВЫРАЗИТЬ В ЦИФРАХ, НЕ НАУКА, А ПРОСТО МНЕНИЕ Роберт Хайнлайн.

Презентация:



Advertisements
Похожие презентации
ГОРАЗДО ЛЕГЧЕ ЧТО-ТО ИЗМЕРИТЬ, ЧЕМ ПОНЯТЬ, ЧТО ИМЕННО ВЫ ИЗМЕРЯЕТЕ Дж. Салливен ВСЕ, ЧЕГО НЕЛЬЗЯ ВЫРАЗИТЬ В ЦИФРАХ, НЕ НАУКА, А ПРОСТО МНЕНИЕ Роберт Хайнлайн.
Advertisements

Работа учащегося 7Б класса Толгского Андрея. Каждое натуральное число, больше единицы, делится, по крайней мере, на два числа: на 1 и на само себя. Если.
Лекция 1 Введение.. Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от
Применение генетических алгоритмов для генерации числовых последовательностей, описывающих движение, на примере шага вперед человекоподобного робота Ю.К.
Таблица умножения на 8. Разработан: Бычкуновой О.В. г.Красноярск год.
ЦИФРЫ ОДИН 11 ДВА 2 ТРИ 3 ЧЕТЫРЕ 4 ПЯТЬ 5 ШЕСТЬ 6.
Фрагмент карты градостроительного зонирования территории города Новосибирска Масштаб 1 : 4500 к решению Совета депутатов города Новосибирска от
Матемтааки ЕТ СТ 2 класс Шипилова Наталия Викторовна учитель начальных классов, ВКК Шипилова Наталия Викторовна учитель начальных классов, ВКК.
ТУЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МЕДИЦИНСКИЙ ИНСТИТУТ Хромушин В.А., д.б.н., к.т.н., академик МАИ и АМТН 2010 г. ГРАФИЧЕСКОЕ ОТОБРАЖЕНИЕ РЕЗУЛЬТИРУЮЩИХ.
Рейтинг территорий с преимущественно городским населением по уровню преступности в 2008 году 1ЗАТО «Звездный»33,10 2Гремячинский230,00 3г. Кунгур242,00.
Число зарегистрированных преступлений. Уровень преступности.
Тренажор Таблично умножение Отлично!
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
Фрагмент карты градостроительного зонирования территории города Новосибирска Масштаб 1 : 6000 Приложение 7 к решению Совета депутатов города Новосибирска.
РАСПРЕДЕЛЕНИЕ УЧАСТНИКОВ ККР-2011 ПО ТИПАМ ОБРАЗОВАТЕЛЬНЫХ УЧРЕЖДЕНИЙ Тип ОУДоля учащихся в общем количестве участников ККР-2011 СОШ115/72% ООШ35/22% НОШ9/6.
Приложение 1 к решению Совета депутатов города Новосибирска от Масштаб 1 : 5000.

27 апреля группадисциплина% ДЕ 1МП-12Английский язык57 2МП-34Экономика92 3МП-39Психология и педагогика55 4МП-39Электротехника и электроника82 5П-21Информатика.
Транксрипт:

ГОРАЗДО ЛЕГЧЕ ЧТО-ТО ИЗМЕРИТЬ, ЧЕМ ПОНЯТЬ, ЧТО ИМЕННО ВЫ ИЗМЕРЯЕТЕ Дж. Салливен ВСЕ, ЧЕГО НЕЛЬЗЯ ВЫРАЗИТЬ В ЦИФРАХ, НЕ НАУКА, А ПРОСТО МНЕНИЕ Роберт Хайнлайн ЗАКОНЫ МАТЕМАТИКИ, ИМЕЮЩИЕ КАКОЕ-ЛИБО ОТНОШЕНИЕ К РЕАЛЬНОМУ МИРУ, НЕНАДЕЖНЫ; А НАДЕЖНЫЕ МАТЕМАТИЧЕСКИЕ ЗАКОНЫ НЕ ИМЕЮТ ОТНОШЕНИЯ К РЕАЛЬНОМУ МИРУ Альберт Эйнштейн РАЗНООБРАЗИЕ И СТРУКТУРА СООБЩЕСТВ: ВВЕДЕНИЕ В МЕТОДЫ АНАЛИЗА

ВИДОВОЕ БОГАТСТВО: КАК ЕГО ОЦЕНИТЬ? КАКАЯ ГРУППА БОГАЧЕ ВИДАМИ: ИНФУЗОРИИ ИЛИ ПОЗВОНОЧНЫЕ? КАКАЯ ГРУППА БОГАЧЕ ВИДАМИ: ИНФУЗОРИИ ИЛИ ПОЗВОНОЧНЫЕ?

ВИДОВОЕ БОГАТСТВО ЗАВИСИТ ОТ МАСШТАБА ЕГО НУЖНО НОРМИРОВАТЬ. КАК? НА ПЛОЩАДЬ (НА м 2 ? НА ГЕКТАР?) НА РАЗМЕР ОСОБИ? НА ЧИСЛО ОСОБЕЙ?

α1α1α1α1 α2α2α2α2 α3α3 β γ УРОВНИ РАЗНООБРАЗИЯ по УИТТЕКЕРУ ТОЧЕЧНОЕ Рз (проба)

Число видов S Объем выборки, N (пробы или особи) НАКОПЛЕНИЕ ВИДОВ («КРИВАЯ СБОРЩИКА») ВИДОВОЕ БОГАТСТВО ЧИСЛО ВИДОВ: на пробу: S sample на n особей: ES(n)

ОЦЕНКИ β -РАЗНООБРАЗИЯ ПО СООТНОШЕНИЮ α - и γ -РАЗНООБРАЗИЯ: β = γ – α (аддитивный метод) β = 1- α / γ (мультипликативный метод) НЕДОСТАТОК: ЗАВИСИТ ОТ ОБЪЕМА ВЫБОРКИ НА ОСНОВЕ ИНДЕКСОВ СХОДСТВА: β = 1 – SIMIL НЕДОСТАТОК: ЗАВИСИТ ОТ ИНДЕКСА ПО СКОРОСТИ РОСТА КРИВОЙ НАКОПЛЕНИЯ ВИДОВ НЕДОСТАТКИ: 1) ЗАВИСИТ ОТ СПОСОБА АППРОКСИ- МАЦИИ КРИВОЙ; 2) НАДО СЧИТАТЬ ВРУЧНУЮ

СРАВНЕНИЕ КРИВЫХ НАКОПЛЕНИЯ ВИДОВ γ1 = γ 2 (при сопоставимых объемах выборки) α2 > α1 β1 >β2 РАСЧЕТ ПО СТЕПЕННОЙ АППРОКСИМАЦИИ: S = a N b log S = log a + b log N a = α; b = β (угол наклона)

ОЦЕНКИ «ПОЛНОГО» ЧИСЛА ВИДОВ ПО ВЫБОРКЕ Пусть взято N проб, вид найден в n проб. Встречаемость такого вида (вероятность найти его в пробе): n/N Вероятность НЕ найти его в пробе: 1-n/N Вероятность пропустить такой вид (не найти ни в одной из проб): (1-n/N) N Метод Chao (оценка полного числа видов с учетом «пропущенных»):

ТАКСОНОМИЧЕСКОЕ РАЗНООБРАЗИЕ ПРОБА 1: ПРОБА 2: Индекс Среднего Таксономического Разнообразия:

АНАЛИЗ СХОДСТВА R R ВИДОВ Q Q ПРОБ R ВИДОВ Q ПРОБ

ТРЕБОВАНИЯ К МЕРАМ СХОДСТВА МАСШТАБ: 0 S 1 СИММЕТРИЯ: S AB = S BA ВЕРХНИЙ ПРЕДЕЛ: S AA = 1 НИЖНИЙ ПРЕДЕЛ: S AB = 0, ЕСЛИ A B = 0

СХОДСТВО ДЛЯ КАЧЕСТВЕННЫХ ДАННЫХ (ЕСТЬ/НЕТ) 4-ХПОЛЬНАЯ ТАБЛИЦА I ПРОБА II ПРОБА ab c d R I = a + c R II = a + b R I+II = a + b + c R ОБЩ = a + b + c + d

ИНДЕКСЫ СХОДСТВА ДЛЯ КАЧЕСТВЕННЫХ ДАННЫХ СЪЁРЕНСЕНА-ЧЕКАНОВСКОГО ЖАККАРА ЧУВСТВИТЕЛЕН ПРИ НИЗКОМ СХОДСТВЕ (a < b, c) ЧУВСТВИТЕЛЕН ПРИ ВЫСОКОМ СХОДСТВЕ (a > b, c)

ИНДЕКСЫ СХОДСТВА ДЛЯ КАЧЕСТВЕННЫХ ДАННЫХ СИМПСОНА НЕЧУВСТВИТЕЛЕН К РАЗЛИЧИЯМ В ДЛИНЕ СПИСКОВ (a+b >> a+c) БАРОНИ-УРБАНИ и БЮССЭ ЧУВСТВИТЕЛЕН К КЛЕТКЕ d !

ИНДЕКСЫ СХОДСТВА ДЛЯ КОЛИЧЕСТВЕННЫХ ДАННЫХ БРЕЯ-КЁРТИСА (BRAY-CURTIS): ПИАНКИ (PIANKA)(ЧУВСТВИТЕЛЕН К РАЗЛИЧИЯМ В ДОМИНАНТАХ) ЭВКЛИДОВО РАССТОЯНИЕ:

МЕТОДЫ МНОГОМЕРНОЙ СТАТИСТИКИ (много объектов со многими признаками) РАЗБИЕНИЕ НА КЛАССЫ НЕ ТРЕБУЕТСЯТРЕБУЕТСЯ a priori КЛАССИФИКАЦИЯ (кластер-анализ) ДАННЫЕ О ФАКТОРАХ СРЕДЫ ИСПОЛЬЗУЮТСЯ? ПРЯМОЙ ГРАДИЕНТНЫЙ АНАЛИЗ (CCA, RSM) ДА ОРДИНАЦИЯ (PCA, CA, DCA, MDS) НЕТ

ИЕРАРХИЧЕСКАЯ КЛАССИФИКАЦИЯ: КЛАСТЕР-АНАЛИЗ (CLUSTER-ANALYSIS) B C D CBA CBAD A+B C D C C+DC+D A+B 0.3

СПОСОБЫ ОБЪЕДИНЕНИЯ ГРУПП ОБЪЕКТОВ МЕТОД БЛИЖАЙШЕГО СОСЕДА (SINGLE LINKAGE) МЕТОД ДАЛЬНЕГО СОСЕДА (COMPLETE LINKAGE) МЕТОД СРЕДНЕГО ПРИСОЕДИНЕНИЯ (GROUP AVERAGE)

МЕТОД БЛИЖАЙШЕГО СОСЕДА

МЕТОД ДАЛЬНЕГО СОСЕДА

МЕТОДЫ ОРДИНАЦИИ ЗАДАЧИ: ОТРАЗИТЬ ВЗАИМНОЕ ПОЛОЖЕНИЕ ОБЪЕКТОВ УМЕНЬШИТЬ РАЗМЕРНОСТЬ ПРОСТРАНСТВА ПРИЗНАКОВ ВЫЯВИТЬ «СКРЫТУЮ СТРУКТУРУ» ДАННЫХ ИСХОДНАЯ ИДЕЯ: ЛЮБОЙ ОБЪЕКТ С n ПРИЗНАКАМИ МОЖНО ПРЕДСТАВИТЬ КАК ТОЧКУ В n -МЕРНОМ ПРОСТРАНСТВЕ

МОДЕЛЬ СВЯЗИ ПРИЗНАКОВ МЕЖДУ СОБОЙ И СО «СКРЫТЫМИ ФАКТОРАМИ» СПОСОБ ПОСТРОЕНИЯ ОСЕЙ ОРДИНАЦИИ ОПРЕДЕЛЕНИЕ ПОЛОЖЕНИЯ ОБЪЕКТОВ В НОВЫХ ОСЯХ

МЕТОД ГЛАВНЫХ КОМПОНЕНТ (PRINCIPAL COMPONENT ANALYSIS, PCA) ТОГДА ОСИ - ЛИНЕЙНЫЕ КОМБИНАЦИИ ПРИЗНАКОВ Y1 = a 1 X A + b 1 X B Оби лие Ось ординации Вид A Вид B Вид А Вид B Y1 ПРЕДПОЛАГАЕТСЯ, ЧТО ПРИЗНАКИ СВЯЗАНЫ МЕЖДУ СОБОЙ ЛИНЕЙНО

МЕТОД ГЛАВНЫХ КОМПОНЕНТ (PRINCIPAL COMPONENT ANALYSIS) ОСИ - ЛИНЕЙНЫЕ КОМБИНАЦИИ ПРИЗНАКОВ ПЕРВАЯ ОСЬ (КОМПОНЕНТА) - НАПРАВЛЕНИЕ НАИБОЛЬШЕГО РАЗБРОСА ТОЧЕК Вид А Вид B Y1 Y1 = a 1 X A + b 1 X B Y2

Данные без структурыДанные со скрытой структурой МЕТОД ГЛАВНЫХ КОМПОНЕНТ (PRINCIPAL COMPONENT ANALYSIS)

ГК 1 ГК 2 ВТОРАЯ ОСЬ - НАПРАВЛЕНИЕ НАИБОЛЬШЕГО РАЗБРОСА ТОЧЕК, ПЕРПЕНДИКУЛЯР- НОЕ ПЕРВОЙ

ПРИМЕР: ОРДИНАЦИЯ СТАНЦИЙ ПО ФАКТОРАМ СРЕДЫ НАГРУЗКА (ВКЛАД В КОМПОНЕНТУ) ПЕРЕМЕННАЯ 1-АЯ (44%)2-АЯ (19%) РАЗМЕР ЧАСТИЦ РАЗБРОС РАЗМЕРОВ ВРЕМЯ ОСУШЕНИЯ ВЛАЖНОСТЬ ГРУНТА МОЩН. СОВР. ОСАДКА PH СТЕПЕНЬ СОРТИРОВКИ % ИЛОВОЙ ФРАКЦИИ АЭРИРОВАННЫЙ СЛОЙ EH

ПРИМЕР: ОРДИНАЦИЯ СТАНЦИЙ ПО ФАКТОРАМ СРЕДЫ

АНАЛИЗ СООТВЕТСТВИЙ (CORRESPONDENCE ANALYSIS, CA-DCA) Вид А Вид B ЭТО ПРЕДПОЛАГАЕТ, ЧТО САМИ ПРИЗНАКИ СВЯЗАНЫ МЕЖДУ СОБОЙ НЕЛИНЕЙНО ВИДЫ (ПРИЗНАКИ) РАСПРЕДЕЛЕНЫ ВДОЛЬ ОСЕЙ УНИМОДАЛЬНО Оби лие Ось ординации Вид A Вид B

ПРИМЕР АНАЛИЗА СООТВЕТСТВИЙ: ОРДИНАЦИЯ СТАНЦИЙ ПО ОБИЛИЮ ВИДОВ

РАСПОЛАГАЕТ ОБЪЕКТЫ ТАК, ЧТОБЫ РАССТОЯНИЯ МЕЖДУ НИМИ СООТВЕТСТВОВАЛИ ВЕЛИЧИНАМ НЕСХОДСТВА ЗАДАЧИ: ВИЗУАЛИЗАЦИЯ ДАННЫХ О СХОДСТВЕ УМЕНЬШЕНИЕ РАЗМЕРНОСТИ МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ (MULTIDIMENSIONAL SCALING)

ПРИМЕР МНОГОМЕРНОГО ШКАЛИРОВАНИЯ: ОРДИНАЦИЯ СТАНЦИЙ ПО ОБИЛИЮ ВИДОВ

ВЫЯВЛЕНИЕ СВЯЗИ МЕЖДУ СТРУКТУРОЙ СООБЩЕСТВ И ФАКТОРАМИ СРЕДЫ Группы проб выделяются (ординацией или классификацией) – ANOSIM (проверка гипотез) Ординация дает четкие результаты (высок % объясненной дисперсии PCA или DCA), факторов немного – корреляция координат проб на осях с факторами среды Прямой градиентный анализ (канонический анализ соответствий, ССА) Корреляционный анализ (недостатки: нелинейность, выбросы, мультиколлинеарность, множ-ть сравнений) Регрессия на матрицах сходства (RSM)

КАНОНИЧЕСКИЙ АНАЛИЗ СООТВЕТСТВИЙ (CANONICAL CORRESPONDENCE ANALYSIS, CCA) АНАЛОГ ССА, НО ОСИ ОРДИНАЦИИ КОНСТРУИРУЮТСЯ КАК ЛИНЕЙНЫЕ КОМБИНАЦИИ ФАКТОРОВ СРЕДЫ. ЭТИ ОСИ ПОДБИРАЮТСЯ ТАК, ЧТОБЫ ОПИСЫВАТЬ РАСПРЕДЕЛЕНИЕ ВИДОВ ВДОЛЬ НИХ (ОТКЛИК ВИДОВ – УНИМОДАЛЬНЫЙ )

ПРОБЛЕМА: ВЕЛИЧИНЫ СХОДСТВА В МАТРИЦЕ ВЗАИМОСВЯЗАНЫ (ЕСЛИ A похоже на B и B похоже на C, то A не может сильно отличаться от C ) К ИНДЕКСАМ СХОДСТВА НЕПРИМЕНИМЫ ОБЫЧНЫЕ МЕТОДЫ ОЦЕНКИ ДОСТОВЕРНОСТИ РЕШЕНИЕ: ДЛЯ ОЦЕНКИ НЕСЛУЧАЙНОСТИ КАКОЙ-ЛИБО ВЕЛИЧИНЫ, СРАВНИВАЕМ ЕЕ РЕАЛЬНОЕ ЗНАЧЕНИЕ С ПОЛУЧЕННЫМИ В РЕЗУЛЬТАТЕ СЛУЧАЙНЫХ ПЕРЕСТАНОВОК (PERMUTATION TEST) МАТРИЦЫ СХОДСТВА – ПРОВЕРКА ГИПОТЕЗ

ГИПОТЕЗА О СООТВЕТСТВИИ МЕЖДУ ДВУМЯ МАТРИЦАМИ СХОДСТВА (ПЕРЕСТАНОВОЧНЫЙ ТЕСТ МАНТЕЛЯ, MANTEL PERMUTATION TEST) 2 МАТРИЦЫ СХОДСТВА (ПО РАЗНЫМ ПРИЗНАКАМ) ДЛЯ ОДНОГО И ТОГО ЖЕ НАБОРА ОБЪЕКТОВ S ij P ij МЕРА СООТВЕТСТВИЯ - КОРРЕЛЯЦИЯ МЕЖДУ ПАРАМИ ( S ij, P ij )

ПРИМЕР: СООТВЕТСТВУЕТ ЛИ СХОДСТВО СТАНЦИЙ ПО БЕНТОСУ CХОДСТВУ ПО АБИОТЕ? 1-я матрица: СХОДСТВО ПО БЕНТОСУ (индекс Чекановского) 2-я матрица: СХОДСТВО ПО ФАКТОРАМ (Эвклидово расстояние) Rank correlation method: Spearman Sample statistic (Rho): Significance level of sample statistic: 0.7 % Number of permutations: 999 Number of permuted statistics greater than or equal to Rho: 6

ОРДИНАЦИЯ СТАНЦИЙ ПО ОБИЛИЮ ВИДОВ (МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ)

НЕСЛУЧАЙНОСТЬ ГРУППИРОВКИ ОБЪЕКТОВ (Analysis Of Similarities, ANOSIM) ДЕЙСТВИТЕЛЬНО ЛИ СТАНЦИИ ОДНОГО ГОРИЗОНТА БОЛЕЕ ПОХОЖИ, ЧЕМ СТАНЦИИ РАЗНЫХ ГОРИЗОНТОВ? 1) РАНЖИРУЕМ ВСЕ ВЕЛИЧИНЫ СХОДСТВА (ПО УБЫВАНИЮ) 2) СЧИТАЕМ СРЕДНИЕ РАНГИ: - ДЛЯ ВСЕХ ПАР ВНУТРИ ГРУПП (Sвн) - ДЛЯ ВСЕХ ПАР ИЗ РАЗНЫХ ГРУПП (Sмеж) 3) СЧИТАЕМ R-СТАТИСТИКУ:

R меняется от -1 до +1 R = +1, если ВСЕ пробы из одной группы более схожи, чем ЛЮБАЯ пара проб из разных групп R = 0, если нет различий между сходством проб внутри групп и между группами ОЦЕНКА ДОСТОВЕРНОСТИ: СЧИТАЕМ Rслуч ДЛЯ СЛУЧАЙНЫХ ПЕРЕТАСОВОК ПРОБ ПО ГРУППАМ СРАВНИВАЕМ РЕАЛЬНОЕ R СО МНОЖЕСТВОМ Rслуч

Global Test Sample statistic (Global R): Уровень значимости R: 0.1% Число случайных вариантов: 999 Число случайных вариантов, давших значение R, большее или равное наблюдаемому: 0 Global R РЕАЛЬНОЕ R

Pairwise Tests R Significance Actual Number >= Groups Statistic Level % Permutations Observed A, B A, C B, C

Процедура SIMPER (Similarity percentages - species contributions) ВЫДЕЛЕНИЕ ХАРАКТЕРНЫХ И ДИФФЕРЕНЦИРУЮЩИХ ВИДОВ ДЛЯ ГРУПП СТАНЦИЙ ХАРАКТЕРНЫЕ ВИДЫ: ОПРЕДЕЛЯЮТ СХОДСТВО ПРОБ ВНУТРИ ГРУППЫ ДИФФЕРЕНЦИРУЮЩИЕ ВИДЫ: ОПРЕДЕЛЯЮТ РАЗЛИЧИЯ МЕЖДУ СТАНЦИЯМИ

Group A Average similarity: Species Av.Abund Contrib% Cum.% Hydrobia ulvae Macoma baltica Tubifex spp Group B Average similarity: Mya arenaria Hydrobia ulvae Macoma baltica Group C Average similarity: Mya arenaria Macoma baltica Hydrobia ulvae Littorina spp Mytilus edulis ХАРАКТЕРНЫЕ ВИДЫ

ДИФФЕРЕНЦИРУЮЩИЕ ВИДЫ Groups A & BAverage dissimilarity = Group A Group B Species Av.Abund Av.Abund Contrib% Mya arenaria Hydrobia ulvae Tubifex spp Arenicola marina Groups B & CAverage dissimilarity = Mya arenaria Macoma baltica Mytilus edulis Littorina spp Nereis pelagica Peloscolex benedeni