613.33K
Category: literatureliterature

Социальная сеть персонажей книги "Игра Престолов"

1.

Социальная сеть персонажей
книги Игра Престолов
Выполнил: Антон Серов

2.

Цель анализа
• Сетевой анализ позволяет выявить ключевых
персонажей и группы в сложных системах.
• Интересно понять, как взаимодействия между
персонажами влияют на сюжет и какие из них
являются наиболее важными.
• Этот метод также полезен для анализа реальных
социальных сетей, научных коллабораций и
политических структур.
• Другие исследователи использовали сетевой
анализ для анализа сюжетов, но не всегда с
акцентом на взаимодействия и их характеристики.

3.

Данные и источник
• Датасет взят из анализа взаимодействий персонажей "Игры
престолов" (Первая книга).
• Узлы представляют персонажей, а рёбра — взаимодействия
между ними.
• Источник данных: Публичный датасет
https://github.com/mathbeveridge/asoiaf
• Данные включают:
• Имена персонажей.
• Количество взаимодействий (веса рёбер).
• Типы взаимодействий (если применимо).
• Используемое программное обеспечение: Gephi Desktop и
Gephi Lite для построения и визуализации графов.

4.

Визуализация графа
• Граф был построен и
отфильтрован с
использованием Gephi
Desktop.
• Использованы алгоритмы
укладки: Yifan Hu и
Fruchterman-Reingold для
улучшения читаемости.
• Применена цветовая
кластеризация для
отображения сообществ.
• Основные узлы (персонажи)
выделены увеличением
размера и подписью.
• Применены фильтры для
удаления разрозненных
узлов и рёбер с низким
весом.

5.

6.

Методы анализа
• Тип сети: Неориентированный граф.
• Узлы: Персонажи (всего 187 узлов).
• Рёбра: Взаимодействия между персонажами (всего 684 рёбра).
• Диаметр графа: 6 (максимальная длина кратчайшего пути между
узлами).
• Средняя длина пути: 2.89.
• Плотность графа: 0.024 (низкая плотность, много разрозненных
связей).
• Коэффициент кластеризации: 0.671 (высокая плотность
локальных связей).
• Метрики анализа:
• PageRank, Centrality, Modularity для выявления значимых узлов и
групп.
• Кластеризация с использованием Модулярности (58 кластеров).

7.

8.

Почему график выглядит именно так:
• Большинство компонентов имеют
небольшие размеры (1-5 узлов). Это
означает, что в сети есть множество
персонажей, которые практически не
взаимодействуют с другими, а
взаимодействуют с очень ограниченной
группой персонажей.
• Наличие одной большой компоненты
(около 130 узлов) — это основной
кластер, объединяющий большую часть
взаимодействий персонажей. Это
объясняется тем, что большая часть
сюжета сконцентрирована на событиях,
где персонажи активно взаимодействуют
друг с другом.
• Причина низкой плотности графа:
Наличие большого количества маленьких
изолированных групп сильно снижает
общую плотность сети, что также было
подтверждено в предыдущих анализах.
• Слабые компоненты: Некоторые группы
персонажей не связаны с основной

9.

10.

Почему график выглядит именно так:
• Средний коэффициент кластеризации (0,671)
указывает на достаточно высокую степень
объединённости среди групп персонажей.
Это значит, что, в среднем, персонажи,
которые связаны с одним узлом, также
взаимодействуют друг с другом.
• Множество точек с низкими значениями
(близкими к нулю): Большое количество
персонажей имеют слабые связи, что
означает их изолированность или редкое
взаимодействие с другими.
• Некоторые высокие значения (ближе к 1):
Указывают на кластеры персонажей, которые
взаимодействуют почти исключительно между
собой. Это может отражать группы,
связанные с определёнными сюжетными
линиями или локациями.
• Общее количество треугольников (650): Это
показатель количества замкнутых
треугольников в сети, что также
подтверждает высокий уровень связанности

11.

• Большая часть
значений
сосредоточена в
диапазоне от 0 до
0.2. Это говорит о
том, что большинство
персонажей
расположены далеко
от центральных узлов
и имеют ограниченный
доступ к другим.
• Небольшое количество
точек с высокими
значениями (около 1)
означают, что
несколько персонажей
являются центрами
влияния, к которым
можно легко

12.

• Большинство значений
сконцентрировано около
нуля, что значит, что только
несколько ключевых
персонажей активно
соединяют другие группы.
• Небольшое количество
узлов с высокими
значениями (например, около
2000) показывают
персонажей, которые играют
роль "мостов" между
крупными группами.
• В данном графике можно
увидеть персонажей,
играющих критические роли в
общении или передаче
информации.

13.

• Большинство узлов имеют
низкие значения, что
указывает на их
периферийное
расположение и
незначительное влияние.
• Небольшое количество
узлов с высокими
значениями означает,
что они связаны с
другими важными
персонажами.
• Пример: Возможно, узлы,
представляющие
влиятельные семьи или
центральные фигуры в
сюжете, такие как
Тирион Ланнистер или
Джон Сноу.

14.

График показывает распределение количества
узлов (размер) по числу компонент, которые
являются слабо связанными (то есть, между узлами
может существовать путь, игнорируя направления
рёбер).
Почему график выглядит так:
Большинство компонентов имеют
небольшие размеры: Почти все узлы
находятся в компонентах с очень малым
числом узлов, что объясняется тем, что они
изолированы или имеют крайне
ограниченное количество связей.
Одна крупная компонента: Один узел
далеко вправо с размером около 130 узлов
соответствует гигантской связной
компоненте, которая объединяет большую
часть графа.
Наличие одной крупной компоненты говорит
о том, что сеть в основном связана, и
информация или влияние могут
распространяться среди большинства узлов.

15.

Выводы
• Основные персонажи, обладающие наибольшей центральностью: Джон
Сноу, Эддард Старк, Тирион Ланнистер.
• Высокий коэффициент кластеризации (0.671) показывает наличие
множества локальных групп.
• Низкая плотность сети (0.024) указывает на разрозненность
взаимодействий.
• 58 выделенных сообществ с помощью модулярности.
• Граф позволяет выявить не только центральные узлы, но и
изолированные группы, которые имеют мало связей.
Возможные направления для дальнейшего исследования:
• Сравнение сетей из разных книг серии для изучения динамики
взаимодействий.
• Использование других алгоритмов кластеризации.
• Применение методов анализа центральности для прогноза важности

16.

Спасибо за внимание!
Вопросы?
English     Русский Rules