Контент-анализ как метод исследования
Общая информация
Определение
Требования к объектам исследования
Виды контент-анализа
Направления применения
Использование в исследованиях
Использование в исследованиях
Использование на практике. Проект для поиска квартир и комнат, сдаваемых в аренду
Процедура контент-анализа
Выбор категорий
Требования к категориям
Рекомендации к выбору категорий
Выбор единицы анализа
Выбор единицы счета
Выбор источников
Таблица-анкета
Кодировальная матрица
Матрица случайностей
Пояснения к матрице
Пояснения к матрице
Процедура подсчета
Коэффициент Яниса
Пример контент-анализа
Шаг 1. Собираем текстовый массив
Шаг 1. Собираем текстовый массив
Шаг 1. Собираем текстовый массив
Шаг 2. Вводим параметры
Шаг 2. Вводим параметры
Шаг 3. Кодируем материал
Шаг 3. Кодируем материал
Шаг 4. Сбрасываем балласт
Шаг 4. Сбрасываем балласт
Шаг 4. Сбрасываем балласт
Шаг 4. Сбрасываем балласт
Шаг 4. Сбрасываем балласт
Шаг 4. Сбрасываем балласт
Шаг 4. Сбрасываем балласт
Шаг 5. Анализ результатов
Шаг 5. Анализ результатов
Шаг 6. Пишем записку
Шаг 6. Пишем записку
Шаг 6. Пишем записку
Примечания
Варианты усложнения
Варианты усложнения
1.16M
Category: sociologysociology

Контент-анализ как метод исследования

1. Контент-анализ как метод исследования

2. Общая информация

2

3. Определение

Контент-анализ — специальный достаточно
строгий метод качественно-количественного
анализа содержания документов в целях
выявления или измерения социальных фактов
и тенденций, отраженных этими документами.
3

4. Требования к объектам исследования

Необходимо, чтобы исследуемое содержание позволило задать однозначное
правило для надежного фиксирования нужных характеристик (принцип
формализации), а также чтобы интересующие исследователя элементы
содержания встречались с достаточной частотой (принцип статистической
значимости).
Чаще всего в качестве объектов исследований посредством контент-анализа
выступают сообщения печати, радио, телевидения, массовой устной агитации
и пропаганды, протоколы собраний, письма, приказы, распоряжения и т.д., а
также данные свободных интервью и открытые вопросы анкет.
4

5. Виды контент-анализа

Качественный
КАК? ЗАЧЕМ? ПОЧЕМУ? В
СВЯЗИ С ЧЕМ? и
аналогичные
Количественный
СКОЛЬКО?
Контент-анализ
Возможны комбинации. Например, качественной стадии может предшествовать количественная, так как
исследователь может заинтересоваться и тем КАК? ЗАЧЕМ? ПОЧЕМУ? В СВЯЗИ С ЧЕМ? автор (авторы)
высказываний НАИБОЛЕЕ ЧАСТО излагают свои мысли.
5

6. Направления применения

6

7. Использование в исследованиях

Может использоваться в качестве
• основного метода исследования
• (например, в исследовании социальной направленности газеты)
• параллельного, т.е. в сочетании с другими методами (например, в
исследовании эффективности функционирования средств массовой
информации);
• вспомогательного или контрольного (например, при
классификации ответов на открытые вопросы анкет).
7

8. Использование в исследованиях

Контент-анализ применяют для
• выявления того, что существовало до текста и что тем или иным
образом получило в нем отражение (текст как индикатор
определенных сторон изучаемого объекта — окружающей
действительности, автора или адресата);
• определения того, что существует только в тексте как таковом
(различные характеристики формы — язык, структура и жанр
сообщения, ритм и тон речи);
• выявления того, что будет существовать после текста, т.е. после его
восприятия адресатом (оценка различных эффектов воздействия).
8

9. Использование на практике. Проект для поиска квартир и комнат, сдаваемых в аренду

Суть проекта — на сервере происходит постоянный
мониторинг появления новых постов вконтакте о сдаваемых
и продаваемых квартирах, комнатах, домах, офисах, гаражах,
складах и пр.
Отслеживаются посты желающих снять или купить
недвижимость.
Посты классифицируются по типу предложения и по типу
недвижимости, определяется страна и город (Россия и СНГ),
выдергивается цена.
Сервис пытается определить, кто опубликовал объявление —
а точнее, не посредник ли это.
Алгоритм для определения посредников довольной простой
— регулярные выражения для конкретных индикаторов
посредников (типа «комиссия 99%) и учет количества постов,
написанных этим же автором.
9

10. Процедура контент-анализа

10

11. Выбор категорий

После того, как сформулированы тема, задачи и гипотезы исследования, определяются
категории анализа, т.е. наиболее общие, ключевые понятия, соответствующие
исследовательским задачам.
• Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть
найдены в тексте.
• В практике советских контент-аналитических исследований в свое время сложилась
довольно устойчивая система категорий, среди которых можно назвать такие, как знак, цели,
ценности, тема, герой, автор, жанр и др.
• Все более широко распространяется контент-анализ сообщений средств массовой
информации, основанный на парадигматическом подходе, в соответствии с которым
изучаемые признаки текстов (содержание проблемы, причины ее возникновения,
проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.)
рассматриваются как определенным образом организованная структура.
11

12. Требования к категориям

Категории контент-анализа должны быть
• исчерпывающими (т.е. охватывать все части содержания, определяемые
задачами данного исследования);
• взаимоисключающими (одни и те же части не должны принадлежать
различным категориям);
• надежными (т.е. между кодировщиками не должно быть разногласий по
поводу того, какие части содержания следует относить к той или иной
категории);
• уместными (т.е. соответствовать поставленной задаче и исследуемому
содержанию).
12

13. Рекомендации к выбору категорий

При выборе категорий необходимо избегать двух крайностей:
• выбора слишком многочисленных и дробных категорий, почти повторяющих
текст
• выбора слишком крупных категорий, т.к. это может привести к упрощенному,
поверхностному анализу.
! Иногда необходимо принимать во внимание и отсутствующие
элементы текста, которые могут быть значимыми.
13

14. Выбор единицы анализа

Единица анализа — лингвистическая единица речи или элемент содержания, служащая в
тексте индикатором интересующих исследователя явлений.
◦ Сложные виды контент-анализа обычно оперируют не одной, а одновременно несколькими
единицами анализа.
Единицы анализа, взятые изолированно, могут быть не всегда правильно истолкованы,
поэтому они рассматриваются на фоне более широких лингвистических или содержательных
структур, указывающих на характер членения текста, в пределах которого идентифицируется
присутствие или отсутствие единиц анализа — контекстуальных единиц.
◦ Например, для единицы анализа «слово» контекстуальная единица — «предложение».
14

15. Выбор единицы счета

Единица счета — количественная мера взаимосвязи текстовых и
внетекстовых явлений.
◦ Наиболее употребительны такие единицы счета, как времяпространство (число строк, площадь в квадратных сантиметрах,
минуты, время вещания и т.п), появление признаков в тексте, частота
их появления (интенсивность).
15

16. Выбор источников

Необходимо определиться с числом сообщений, датами сообщений и исследуемым
содержанием.
◦ Все эти параметры выборки определяются задачами и масштабами исследования.
Чаще всего контент-анализ проводится на годичной выборке: если это изучение
протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение
сообщений средств массовой информации — 12-16 номеров газеты или теле- радиодней.
◦ Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.
16

17. Таблица-анкета

Разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую
собой систему скоординированных и субординированных категорий анализа.
Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд
признаков (ответов), по которым квантифицируется содержание текста. Таблица-анкета
может быть достаточно объемной.
17

18. Кодировальная матрица

Для регистрации единиц анализа составляется другая таблица — кодировальная матрица:
Признак
А
В
С
...
n
Σn
Текст
1
2
+
+
+
3
+
n
Σn
+
Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило,
работает с тетрадью матричных листов. Если выборка сравнительно невелика (до 100 единиц),
то можно проводить двумерный или даже многомерный анализ. В этом случае для каждого
текста должна быть своя кодировальная матрица. Однако эта работа очень трудоемка и
кропотлива, поэтому при больших объемах выборки сопоставление интересующих
исследователя признаков осуществляется на компьютере.
18

19. Матрица случайностей

Иногда таблица может быть необходимой и на этапе количественной обработки данных.
Например, при использовании анализа случайностей, разработанного американским
социальным психологом Ч. Осгудом, строится т.наз. матрица случайностей:
Реальное
совпадение
А
В
С
...
n
Σn
Ожидаемое
совпадение
А
0,05
0,08
В
0,15
0,12
С
0,02
0,06
-
n
Σn
-
-
19

20. Пояснения к матрице

С помощью такой матрицы выявляются меры случайности совпадения каждой
классификационной единицы со всеми остальными. Например, единица А встречается в
30% анализируемых текстов (Р = 0,3), а единица В — в 50% текстов (Р = 0,5), тогда
ожидаемая частота совместного появления этих единиц будет равна: РАВ = РА • Рв=0,3 • 0,5
= 0,15.
В действительности же признаки А и В совместно встретились лишь в 5% текстов АВ = 0,05.
Сравнивая ожидаемые и реальные совпадения признаков, можно определить, какие
фактические зависимости оказались не случайными (напр., из приведенной выше таблицы
видно, что совместное появление единиц А и В — случайное, т.к. реальное совпадение
меньше ожидаемого, а единиц В и С — не случайное, т.е. реальное совпадение выше
ожидаемого).
20

21. Пояснения к матрице

Цели применения данной матрицы могут быть различными:
проследить случайность-неслучайность совпадения признаков для проверки гипотезы
отметить устойчивые-неустойчивые парные сочетания признаков, что может оказаться значимым
для характеристики деятельности отправителя информации, и т.д.
Важным условием является разработка инструкции кодировщику — системы правил и
пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя)
заданные единицы анализа.
В инструкции точно и однозначно излагается алгоритм действий кодировщика, даются
операциональное определение категорий и единиц анализа, правила их кодирования, приводятся
конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как
следует поступать в спорных случаях, и т.д.
21

22. Процедура подсчета

В общем виде аналогична стандартным приемам классификация по выделенным
группировкам ранжирования и измерения ассоциаций.
Есть и более простые способы измерения. Удельный вес той или иной категории можно
вычислить с помощью формулы
Существуют также специальные процедуры подсчета применительно к контент-анализу,
напр., формула коэффициента Яниса (с), предназначенного для вычисления соотношения
положительных и отрицательных (относительно избранной позиции) оценок, суждений,
аргументов.
22

23. Коэффициент Яниса

В случае, когда число положительных оценок превышает число отрицательных, коэффициент
Яниса подсчитывается по формуле
где f- число положительных оценок;
n — число отрицательных оценок
r — объем содержания текста, имеющего прямое отношение к научаемой проблеме;
t — общий объем анализируемого текста.
В случае, когда число положительных оценок меньше, чем отрицательных, коэффициент Яниса
находится по формуле
23

24. Пример контент-анализа

24

25. Шаг 1. Собираем текстовый массив

В данном примере используются результаты глубинных интервью на тему
наркомании и наркоугрозы в России
! тема и непосредственно содержание интервью здесь для нас не играют роли
! можно брать и иные тексты — например, результаты фокус групп, публикации в СМИ и
т.д.
• Составляем гайд (или его ещё называют топик-гайд), содержащий набор тем и подтем,
на который опираемся при общении с респондентами.
• Берем интервью и набираем высказывания респондентов в текстовом формате.
25

26. Шаг 1. Собираем текстовый массив

•Сохраняем каждое интервью в отдельном текстовом документе.
• ! Настоятельно рекомендуется кодировать названия документов — например,
•Открываем Excel либо аналог и разбиваем текст на отдельные фрагменты, коды и
непосредственно текст которых помещается в таблицу.
26

27. Шаг 1. Собираем текстовый массив

27

28. Шаг 2. Вводим параметры

•Параметр - та или иная микротема, микросюжет, фигурирующий в рамках
информационного пространства анализируемого материала.
•Набор параметров должен охватывать наиболее важные составляющие тематического
поля материала, то есть их совокупность должна полно передавать набор тем и микротем,
затрагиваемых респондентами в рамках интервью.
• Для того, чтобы ввести такие параметры, прежде всего достаточно будет просто
попытаться представить себе их, в частности, опираясь на гайд, и записать в
соответствующие ячейки таблицы.
• Далее имеет смысл открыть тексты интервью и, бегло прочитывая их, дополнить набор
параметров.
• Это можно сделать также опираясь на нюансы конкретного ТЗ.
•Таким образом, это должны быть наиболее весомые параметры. Ориентировочно у Вас
должно получиться 20-35 параметров. Их число зависит от объёма текстового массива, от
самого потенциала вариативности темы, глубины гайда и качества интервьюирования
28

29. Шаг 2. Вводим параметры

29

30. Шаг 3. Кодируем материал

•В том случае если в текстовом фрагменте присутствует упоминание параметра ставим 1,
если отсутствует — ставим 0.
•Шкала может быть и порядковой, например, 1 — нейтрально выраженный параметр, 2 —
несколько эмоционально выраженный параметр, 3 — ярко эмоционально выраженный
параметр.
•В данном примере рассмотрим простейшую количественную шкалу, просто чтобы не
усложнять себе задачу.
•На основе такой шкалы нам необходимо обработать весь текстовый массив — применить
каждый из параметров к каждому из текстовых фрагментов.
30

31. Шаг 3. Кодируем материал

Матрица контент-анализа
31

32. Шаг 4. Сбрасываем балласт

Отсеиваем неинформативные текстовые фрагменты — высказывания респондентов,
в которых не звучит ни одного из параметров, вошедших в наш перечень.
Для этого просто подсчитаем автосумму по строкам.
◦ Можно воспользоваться формулой =СУММ(диапазон значений) либо нажать на
соответствующий значок в панели инструментов
◦ Для подсчёта автосуммы надо кликнуть по ячейке, следующей за последней ячейкой в
диапазоне, после этого подсчитать автосумму.
32

33. Шаг 4. Сбрасываем балласт

33

34. Шаг 4. Сбрасываем балласт

Подсчитаем автосуммы для всех строк.
◦ Для этого кликнем два раза по правому нижнему уголку ячейки с уже подсчитанной
автосуммой.
В ячейках, где сумма по строке равна 0, содержатся фрагменты текстов, не включающие ни
одного из выделенных нами микросюжетов.
Отсортировав значения по возрастанию, мы увидим, что наверху окажутся «неактуальные»
текстовые фрагменты. Мы можем просто удалить эти строки.
◦ ! иногда в перспективе может появиться необходимость расширить набор параметров
анализа, что может задействовать «неактуальные» текстовые фрагменты, поэтому
удалять необязательно
34

35. Шаг 4. Сбрасываем балласт

35

36. Шаг 4. Сбрасываем балласт

36

37. Шаг 4. Сбрасываем балласт

Аналогичным образом мы можем поступить и с микросюжетами, не
отражёнными в высказываниях респондентов.
Также можно удалить из матрицы слабовыраженные микросюжеты, то
есть удалить некоторые малоактуальные столбцы из матрицы.
◦ Точно таким же образом подсчитываем автосуммы по столбцам
С другой стороны, стоит просмотреть, не принадлежат ли все
высказывания, относящиеся к тому или иному доминирующему
параметру, одним и тем же людям (здесь нам как раз поможет столбец с
кодами фрагментов).
Если это так, едва ли можно говорить о количественной интерпретации
такого материала.
37

38. Шаг 4. Сбрасываем балласт

Синим цветом представлены неактуальные параметры — кандидаты на удаление из матрицы.
Красным отмечены параметры, доминирующие в информационном пространстве изучаемого
предмета. Им стоит уделить особое внимание при анализе.
На рисунке мы находимся в самом низу матрицы — не удивляйтесь результатам вычисления
автосумм — просто шапка матрицы закреплена и опускается вместе с движением экрана вниз.
38

39. Шаг 5. Анализ результатов

Нужно выбрать все актуальные параметры и сгруппировать их в отдельные блоки — более
крупные темы. Каждой из тем надо дать осмысленное название.
глава
параграф
В нашем примере только 2 группы. Однако, в рамках проведения реальных замеров групп
больше, равно как больше и параметров (20-35).
Параметры, безусловно, можно объединять в рамках параграфов, если есть такая
необходимость.
39

40. Шаг 5. Анализ результатов

Начнём наш анализ с параграфа про
«наркоманию и молодёжь».
Сортируем данные в соответствующем
столбце, так чтобы наверху оказались
наибольшие значения (в нашем примере это
единицы).
Из первого столбца копируем все текстовые
фрагменты, соответствующие ненулевому
значению (представленные в высказываниях
респондентов).
40

41. Шаг 6. Пишем записку

Обобщаем мысли высказываний респондентов, идентифицируем особенностей
интерпретации ими тех или иных микросюжетов.
Здесь важно обращать внимание именно на особенности деталей описания предмета
обсуждения, а не на степень их представленности.
Если респондент говорит о распространении наркомании среди молодёжи, важно
интерпретировать особенности его отношения к проблеме. Простой пример:
◦ Респондент 1 (м, 16 лет) «У меня нет опасений за российскую молодёжь. Каждый сам волен
выбирать, как ему жить. Если подросток намеренно травит себя наркотиками, значит это всё
на что он способен. Пусть травит дальше. Мне нет до него дела. Общество станет только
чище, наркоманов меньше, меньше уличных воров, собирающих себе на дозу…»
41

42. Шаг 6. Пишем записку

Мы можем сделать вывод о том, что если для молодёжи и актуальна эта проблема как
социальный недуг, то беспокойство главным образом вызывает именно преступность,
порождаемая наркоманией.
Молодые люди чаще всего попадают под удар таких преступных элементов, что и
беспокоит их в данном отношении. Сами же наркоманы воспринимаются ими конгруэнтно
юношескому максимализму — наркоманы лишние в обществе и от них стоит избавляться
любыми способами, не гнушаться жестокостью и насилием.
Другими словами, ориентируясь на молодёжь как на целевую аудиторию, государство,
организующее кампании борьбы с наркоманией, может позволить решительные и жёсткие
действия — молодёжь, как целевую аудиторию, они устроят.
42

43. Шаг 6. Пишем записку

Важно учитывать не одно высказывание, а постоянно верифицировать его другими
высказываниями. Если звучат противоположные позиции, важно отметить точки их
соприкосновения и ключевые различия. Надо описывать каждую деталь, и, самое важное,
не просто перечислять их, а делать выводы, рассуждать, и ещё раз верифицировать, дабы
не сделать ложных выводов.
Таким образом поступаем с каждым высказыванием. Анализируем, пишем выводы в
соответствующем разделе записки, цитируем респондентов, что является неотъемлемым
атрибутом отчёта — в нём обязательно должен содержаться иллюстративный материал.
В начале параграфа целесообразно написать некоторое небольшое введение в микротему,
вначале главы — экскурс в тему — и только после это приступить к анализу материала. В
конце параграфа необходимо сделать выводы по параграфу и также представить их
читателю.
Готово!
43

44. Примечания

С помощью наших кодов высказываний структуру изложения можно строить, например,
опираясь на гендерный признак: вначале описать мужскую позицию в отношении той же
проблемы распространения наркомании среди молодёжи, а потом женскую, сравнить их.
С помощью этого можно понять как лучше работать с мужской аудиторией, реализуя
соответствующую кампанию борьбы с наркоманией, и как работать с женской аудиторией.
Также это может быть возрастная дифференциация: вначале описывать мнение респондентов
младше 18 лет, далее от 19 до 25 и так далее.
Такое простое сегментирование поможет лучше сориентироваться использующему итоговый
отчёт для реализации той или иной кампании.
Точно также структуру изложения нашей аналитики мы можем строить и на других социальных
или, например, профессиональных квотах.
Этим методом можно проводить и замеры отношения к услуге, продукту, оценивать
внутрикорпоративный психосоциальный климат и т.д.
44

45. Варианты усложнения

Для того, чтобы его несколько усложнить, можно ввести несколько дополнительных
параметров.
Например, таких как рациональность и эмоциональность и оценивать каждое
высказывание по ним. При этом мы можем продолжать работать с отдельными
сегментами — гендерными, возрастными, просто сортируя высказывания по столбцу
кодов.
Допустим мы можем отдельно оценить особенности эмоций и рациональных доводов,
звучащих в высказываниях женщин нужного возраста, и отдельно, мужчин. Такая
сегментация даёт массу хорошо структурированной информации.
Параметры могут быть любыми, градации могут содержать как массу элементов, так и
всего несколько.
Непосредственно ТЗ определяет необходимость использовать тот или иной набор
дополнительных параметров для качественной интерпретации материала.
45

46. Варианты усложнения

46
English     Русский Rules