Томский государственный университет Исторический факультет Бочаров А.В. КОНТЕНТ-АНАЛИЗ В ГУМАНИТАРНЫХ НАУКАХ спецкурс Слайд-шоу к вводной лекции «Определения.

Презентация:



Advertisements
Похожие презентации
ИОМКР Стулова Ю. А. Методы социологического исследования.
Advertisements

Внимательно прочтите вопрос и варианты ответов на него. Выберите из предложенных вариантов один или несколько верных и впишите номер/а выбранных вами ответов.
Метод способ достижения цели исследования, его решающая роль в успехе той или иной исследовательской работы очевидна. От его выбора зависти всё исследование,
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
«Подготовка и составление научного аппарата исследования. Характеристика методов исследования при подготовке курсовых и дипломных работ»
Статус социологии в системе социального знания. Структура социологического знания. Старший преподаватель кафедры истории Казахстана и социально-политических.
Организация и проведение научных исследований в библиотеке Е. Б. Артемьева –д-р пед. наук.
Экономическая статистика Преподаватель – Грабовский А.Е.
Тема 8. Математические методы исследования явлений культуры. Рекомендуемая литература: 1.Ковальченко И.Д. Методы исторического исследования. – М., 1987.
Презентация курса по выбору «Технологии визуализации данных» Кафедра Информатики и МОИ Факультет Математики, физики и информатики.
ОРГАНИЗАЦИЯ ИССЛЕДОВАТЕЛЬСКОЙ ДЕЯТЕЛЬНОСТИ УЧАЩИХСЯ Государственное учреждение образования «Средняя школа 3 г. Крупки» Заместитель директора по учебной.
Метод(от греч. «путь исследования, теория, учение») - способ достижения какой-либо цели, решения конкретной задачи; совокупность приемов и операций практического.
Науки. Перечислите естественные и гуманитарные науки. естественныегуманитарные.
Требования к разработке рабочих программ по предмету.
«Поисковое исследование условий перехода на компетентностную модель подготовки студента с учетом анализа соответствующих современной государственной политике.
Тема 3. СОВРЕМЕННЫЕ ТЕНДЕНЦИИ РАЗВИТИЯ СИСТЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 1. Проблемная область искусственного интеллекта 2. Модели представления знаний.
Конкретное социологическое исследование – основа прикладной социологии 1 Понятие о конкретном социологическом исследовании 2 Разновидности конкретного.
Занятие : Методы построения теории Методика научного исследования 3 курс, 5 семестр.
Метод способ достижения цели исследования, его решающая роль в успехе той или иной исследовательской работы очевидна. От его выбора зависти всё исследование,
Моделирование. Работу выполнила Ирина Бахтина Ученица 9 и класса.
Транксрипт:

Томский государственный университет Исторический факультет Бочаров А.В. КОНТЕНТ-АНАЛИЗ В ГУМАНИТАРНЫХ НАУКАХ спецкурс Слайд-шоу к вводной лекции «Определения и назначение метода контент- анализа»

Глобальные задачи контент-анализа (КА) Избыточное культурное предложение (информационный взрыв) – глобальная проблема XXI века Диспропорция между человечеством как совокупным производителем информации и отдельным человеком как ее потребителем. С каждым поколением даже в узкой профессиональной области на личность наваливается все более тяжелый груз знаний, которые она не в состоянии усвоить. Один из путей решения: превращение неструктурированной информации в структурированную Это превращение – главная цель КА Рекомендуемая статья: Эпштейн М.Н. "Информационный взрыв и травма постмодерна" (1998 г.)

Текстовая информация Отличи- тельные признаки НЕструктурированнаяСтруктурированная Форма текста Нестандартизированный и неформализованный текст, состоящий из предложений на естественном языке. Стандартизованный или формализованный список из символов, слов или словосочетаний. Содержание текста Полнотекстовое изложение идей, смыслов и сюжетов (свободный текст). Только краткие обозначения и название тематик, смыслов и сюжетов (строго лимитированный текст).

Текстовая информация Отличи- тельные признаки НЕструктурированнаяСтруктурированная Образ предметной области Описания реальности не разделяется явно и обязательно на части, которые напрямую сводятся к триаде «сущность-признак-связь». Описания реальности явно и обязательно разделяется на части, которые напрямую сводятся к триаде «сущность-признак-связь». Виды практических реализаций текстов Разножанровые авторские тексты не имеющие статус документов или тексты документов (отчёты, стенограммы, проекты, характеристики, заявления) Таблицы и списки со значениями текстологических признаков.

Текстовая информация Отличи- тельные признаки НЕструктурированнаяСтруктурированная Типы электронных файлов Текст в любых форматах может быть сведен к отдельным текстовым файлам без потери информации. Базы данных или электронные таблицы, которые не могут быть сведены к отдельным текстовым файлам с линейным текстом без потери информации. Уровень единообразия Единообразие содержания в разных текстах из одного массива сводится к минимуму. Единообразие содержания таблиц и списков сведено к максимуму. Поводы к написанию текста при анкетировании Ответы на открытые вопросы анкет и опросников, предполагающих самостоятельное изложение респондентом. Ответы на закрытые вопросы анкет и опросников, предполагающих выбор из заранее готовых вариантов ответов.

Текстовая информация Отличительные признаки НЕструктурированнаяСтруктурированная Форма текста Нестандартизированный и неформализован-ный текст, состоящий из предложений на естественном языке. Стандартизованный или формализованный список из символов, слов или словосочетаний. Содержание текста Полнотекстовое изложение идей, смыслов и сюжетов (свободный текст). Только краткие обозначения и название тематик, смыслов и сюжетов (строго лимитированный текст). Допущение повторений Неповторяющиеся инвариантные предложения. Случайные повторения не являются идентичными компонентами текста. Принципиальное допущение повторяющихся идентичных вариантов целостных компонентов списка. Образ предметной области Описания реальности не разделяется явно и обязательно на части, которые напрямую сводятся к триаде «сущность-признак-связь». Описания реальности явно и обязательно разделяется на части, которые напрямую сводятся к триаде «сущность- признак-связь». Виды практических реализаций текстов Разножанровые авторские тексты не имеющие статус документов; тексты документов (отчёты, стенограммы, автобиографии, характеристики, заявления и т.п.). Таблицы, списки и отчеты с генерированными частотами значений в таблицах или списках. Поводы к написанию текста при анкетировании Ответы на открытые вопросы анкет и опросников, предполагающих самостоятельное изложение респондентом. Ответы на закрытые вопросы анкет и опросников, предполагающих выбор из заранее готовых вариантов ответов. Типы электронных файлов Текст в любых форматах может быть сведен к отдельным текстовым файлам без потери информации. Базы данных или электронные таблицы, которые не могут быть сведены к отдельным текстовым файлам с линейным текстом без потери информации. Уровень единообразия Единообразие содержания в разных текстах из одного массива сводится к минимуму. Единообразие форм интерфейса и содержания таблиц и списков сведено к максимуму. Взаимодействие с противоположным видом текстовой информации Неструктурированная информация может содержать внутри себя фрагменты структурированной, при условии что ими не исчерпывается весь текст, иначе он теряет статус неструктурированного. Структурированный компонент таблицы или списка не может содержать внутри себя неструктурированную информацию, иначе он теряет статус структурированности. Контент-анализ

От англ.: contents - содержание, содержимое Текст (лат. tekstum - ткань, сплетение) - последовательность символов, образующих сообщение. Текст - система высказываний, обладающих единым смыслом. Определения контент-анализа текстов Текст в узком смысле– состоит из букв. Текст в широком смысле – из любых символов.

Количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей. КА – это систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника Исследовательский метод для определения присутствия определенных слов или понятий в тексте или массивах текстов Определения контент-анализа текстов

КА – это совокупность методик формализации текстов, предусматривающих процедуру сведения текста к ограниченному набору определенных элементов, которые подвергаются счету. Сущность метода КА состоит в фиксации определенных единиц содержания, которое изучается, а также в квантификации полученных данных. КА позволяет на основе статистических методов и теории множеств выявить поведение некого подмножества слов в неком их множестве, что позволяет сжать информацию и определить её тренды (trend – направление, курс, тенденция). Определения контент-анализа текстов

Восхождение от многообразия текстового материала к абстрактной модели содержания текста. В этом смысле, КА – одна из номотетических исследовательских процедур (греч. Nomo-teteo - издавать закон), используемых в сфере применения идеографических методов (греч. Ideo – образ, идея, grapho - пишу). Определения контент-анализа текстов

Определения КА: Методы стандартизации количественно точного поиска значений и смыслов в текстах, с целью выявления и изучения содержательных аспектов, невыявляемых при обычном прочтении. Читатель преодолевает путь от языковых средств выражения к идее. Задача КА - сократить этот путь.

Взаимосвязь прикладного использования КА в разных дисциплинах историография, история идей, история ментальности политология и международные отношения психология личности и психодиагностика социология и социальная психология культурология и литературоведение историческое источниковедение экспериментальная лингвистика маркетиг и маркетология юридическая экспертиза документоведение Специфика использования методик КА в каждой из дисциплин может послужить эвристическим образцом для использования во всех остальных дисциплинах. Для этого нужно задать вопрос: нельзя ли тоже самое, что сделано в анализе текстов для решения одной специфической задачи, применить и для решения другой специфической задачи.

Междисциплинарность прикладного использования КА: Интерпретация скрытых смыслов и интеллектуальных тенденций в текстах исторических источников. Интерпретация исторических повествований как феномена исторического сознания. Интерпретация соцопросов (анкет, интервью) для выявления установок, интересов и ценностей (и, шире, систем убеждений и «моделей мира») различных групп населения и общественных институтов. Психодиагностика личности или групп на основе текстов, написанных на заданные темы. Выявление фокусов внимания индивидов, групп и социальных институтов.

Междисциплинарность прикладного использования КА: Социально-психологический анализ текстов СМИ для задач PR. Выявление используемых пропагандистских или рекламных приемов. В прикладной политологии - для анализа неявных (имплицитных) смыслов в текстах программных политических документов, для изучения различий в содержании коммуникативных процессов в различных странах. Лингвистический анализ в юридической экспертизе текстов, по поводу содержания которых ведётся судебное разбирательство. Разработка компьютерных экспертных систем автоматизированной обработки неструктурированной информации и создание систем искусственного интеллекта

Междисциплинарность методологических оснований контент-анализа теория контент- анализа Литературо- ведение ЛингвистикаСемиотика Математи- ческая статистика Дискретная математика Когнитивная психология Психология речевой деятельности

Междисциплинарность методологических оснований контент-анализа В исторической науке - Источниковедение Лингвистика - для установления единиц и категорий текста для КА Литературоведение – для установления культурных феноменов и тенденций, в разновидностях тематического и мотивационного КА Математическая статистика - для обработки количественных данных КА, использование матстатистики для разных видов КА может быть либо обязательной и основной, либо возможной и дополнительной Дискретная математика и математическая логика - для построения граф-схем визуализации результатов КА и для создания алгоритмов автоматизированного КА Семиотика (семиология) – название теорий, изучающих различные свойства знаковых систем – для установления соотношения текстовых знаков и знаков социального, культурного, духовного и любых других сфер из предметной области научного исследования. Когнитивная психология, психология речевой деятельности– для выявления взаимодействия текстовых и психических явлений.

Виды контент-анализа: 1.Частотный анализ (Манифестное кодирование) (manifestus – явный, обнаруженный) Стилометрия (распознавание авторского стиля) (stilus – инструмент для письма, способ написания) 2.Семантический анализ (Латентное кодирование) (latens – скрытый, невидимый) Контекстный анализ (тематический) (contextus – сплетение, сочетание) Интент-анализ (выявление психологического подтекст) (intention - стремление, направленность) Когнитивное картирование (визуализация семантических связей) ( cognition – знание, познание) Иве́нт-анализ (фактографическая систематизация) (event – событие, факт) Нарративный анализ (структурирование сюжетных связей) (narratus – повествование, рассказ по порядку) Все виды семантического анализа неизбежно явно или имплицитно содержат в себе в качестве первого этапа частотный анализ

Общие этапы проведения КА: 1.Определение совокупности изучаемых источников или сообщений (объекта исследования) с помощью набора заданных критериев, которым должно отвечать каждое сообщение. 2.Формирование выборочной совокупности сообщений (выборка данных). Определение репрезентативности (степени полноты) выборки. 3.Выявление единиц анализа. Ими могут быть слова или темы. При выборе единицы руководствуются целями и предметом исследования. Исходят из того, какая объективная реальность (социальная, культурная, психологическая) стоит за текстовыми признаками.

4. Выделение единиц счета, относительно которых определяется количество единиц анализа. Единица счета, позволяет регистрировать частоту (регулярность) появления признака в тексте. Единица счета в КА – это количественная мера взаимосвязи текстовых и внетекстовых явлений (социальных, культурных, психологических). количество текстов относительно изучаемой выборки физическая протяженность текстов; площадь текста, заполненная смысловыми единицами; число структурных единиц текста (предложений, абзацев, глав, знаков, колонок); длительность трансляции по радио или ТВ; метраж пленки при аудио- и видеозаписях, количество рисунков с определенным содержанием, сюжетом и прочее. Общие этапы проведения КА:

5.Процедура подсчета: Составление карточек признаков для изучаемых текстов (протоколов обработки); составление матрицы формализованных данных на основе протоколов обработки текстов. 6.Определение и использование математического аппарата, исходя из свойств матрицы и целей исследования. 7.Интерпретация полученных результатов в соответствии с целями и задачами конкретного исследования. Выявляются и оцениваются такие характеристики текстового материала, которые позволяют делать заключения о том, что хотел подчеркнуть или скрыть его автор. Общие этапы проведения КА:

Общие этапы проведения КА >> Этапы КА – это своеобразный фильтр, который отфильтровывает текстовую информацию, делая её всё менее объёмной и всё более содержательной Структури- рованная информация

Критерии (пункты и этапы) проектирования или описания контент-аналитического исследования 1.Описание объекта исследования: какой конкретный текст или выборка текстов анализируется в исследовании. 2.Цели и задачи, связанные с предметом исследования из предметной области базовой дисциплины. 3.Учитываемые и анализируемые лингвистические единицы текста. 4.Учитываемые единицы счёта, относительно которых выявляется встречаемость лингвистических или семантических единиц текста.

5.Фрагмент изучаемого текста или выборки текстов и карточка его анализа (либо указание на то, приводятся ли фрагменты текстов и какие в чужом исследовании). 6.Внетекстовые явления предметной области базовой дисциплины (исторические, психологические, социальные, литературные, политические и др.), отождествляемые с учитываемыми лингвистическими единицами или выводимые из них. Экстралингвистический контекст повлиявший на особенности содержания текста. 7.Вид КА и обоснование использования именно этого вида. 8.Эмпирико-методические цели и задачи, связанные с применением КА к изучаемому тексту (то есть способы структурирования информации). Критерии (пункты и этапы) проектирования или описания контент-аналитического исследования

9.Описание матрицы данных, на которой основано исследование (какие единицы счёта в строках, какие единицы анализа в столбцах). 10.Описание использования математических методов и обоснование использования именно этих методов (в случае простого процентного анализа указать, что берётся за 100%). 11.Описание приведённых либо возможных форм и способов представления эмпирических числовых результатов КА (вербальное описание типов графиков и структуры таблиц). 12.Обобщающие выводы и выявленные закономерности для предметной области базовой дисциплины. Критерии (пункты и этапы) проектирования или описания контент-аналитического исследования