Similar presentations:
2_Грамматика зависимостей 2025
1. Грамматика зависимостей: основные положения
ЛЕКЦИЯ 22. Синтаксический анализ
Синтаксический анализ — это исследовательскаяпроцедура, в результате которой устанавливается
грамматическая структура предложения.
Комп. линг.:
Парсинг – процесс сопоставления линейной
последовательности
лексем
(словоформ,
токенов) естественного или формального языка с его
формальной грамматикой.
3. Синтаксический анализ
1.Разделить
предложение
составляющие части
2. Установить между ними отношения
на
4. Основные синтаксические единицы
словословосочетание
предложение
связный текст (?)
5. Синтаксическое отношение
Отношение одной синтаксической единицык другой:
1) словоформа-словоформа: [синее] [небо];
2) словосочетание-словосочетание:
небо] [покрылось туманом]
[синее
3) предложение-предложение: [Синее небо
покрылось туманом], [поэтому солнца не
видно]
И т.д.
6. Синтаксический анализ
[Холодная осень портит настроение][[Холодная] [осень] [портит] [настроение]]
[[Холодная осень] [портит настроение]]
*?[[Холодная] [осень портит настроение]]
7. Синтаксический анализ
1. Типы синтаксических единиц2. Типы отношений между ними
8. Синтаксический анализ
Исходные данные(словосочетания,
предложения,
тексты)
Критерии
выделения
Синтаксическая
структура в
терминах единиц
и отношений
9. Методы синтаксического анализа (результат: синтаксическое дерево)
1)анализ
структуры
зависимостей
(результат: система (дерево) зависимостей)
2)
анализ
структуры
составляющих
(результат: система (дерево) составляющих)
Синтаксическая
структура
—
теоретический
конструкт,
описывающий деривацию синтаксического объекта из минимальных
синтаксических единиц и определяющий на нем отношения
зависимости и/или вложения.
10. Грамматика зависимостей: исходные положения
минимальная синтаксическая единицаграмматическое слово (= словоформа
синтаксема);
синтаксические отношения
между словоформами
–
словосочетание,
предложение,
цепочки словоформ
–
=
отношения
текст
–
11. Структуры зависимостей: связность – свойство любого предложения
Связь словоформ – без разрывов:все
словоформы
в
предложении
непосредственно или опосредованно:
связаны
- нет словоформ, не связанных с другими
словоформами;
- нет групп словоформ, не связанных с другими
группами.
Только раннее утро может иногда пройти без
сюрпризов.
12. Структуры зависимостей: связность – свойство любого предложения
Предложение – всякая связная цепочкасловоформ, которая не является частью
другой цепочки
[может иногда пройти без сюрпризов]
[Только раннее утро [может иногда пройти
без сюрпризов]]
Предложение
синтаксиса (?)
–
максимальная
единица
13. Структуры зависимостей: связность – свойство любого предложения
отношение является бинарным:? – может пройти без сюрпризов
[может] -> [пройти]
[пройти] -> [без]
[без] -> [сюрпризов]
? – Не знаю, как без сюрпризов может пройти утро
[Не знаю] -> [как]
[как] -> [может]
[может] -> [пройти]
[пройти] -> [без]
[без] -> [сюрпризов]
14. Структуры зависимостей: связность – свойство любого предложения
В синтаксические отношения вступают слова,семантически
определяющие
и
дополняющие друг друга (семантически
связанные):
раннее утро
может пройти
пройти без…
15. Структуры зависимостей: связность – свойство любого предложения
Отношение иерархично – одна словоформаглавнее другой;
у словоформы может быть несколько
зависимых, но только одна подчиняющая
вершина:
раннее и позднее утро
может [пройти] + может [утро]
утро может иногда пройти
16. Структуры зависимостей: связность – свойство любого предложения
X –> YX – вершина = хозяин = ядро = главное
слово
Y – зависимое = слуга = зависимое
слово
17. Структуры зависимостей: связность – свойство любого предложения
Антисимметричность:X -> Y => 1 (Y ->X)
Снег -> белый - *белый -> снег
Антитранзитивность:
(X ->Y) & (Y -> Z) => 1 (X ->Z)
Снег -> белый + белый -> очень - *снег -> очень
18. Структуры зависимостей: связность – свойство любого предложения
Сейчас мы начинаем изучать синтаксис.19. Дерево зависимостей
Множество с заданными на нем бинарнымиотношениями – граф (Сейчас мы начинаем изучать
синтаксис).
Элементы множества – узлы (сейчас, мы, начинаем,
изучать, синтаксис).
Бинарная пара узлов (ab) – дуга (начинаем мы,
начинаем сейчас, начинаем изучать, изучать
синтаксис).
20. Структуры зависимостей: связность – свойство любого предложения
Сейчас мы начинаем изучать синтаксис.синтаксис
сейчас изучать
начинаем
мы
21. Дерево зависимостей
Узел a – начало дуги (начинаем, изучать), узел b –конец дуги (мы, сейчас, изучать, синтаксис); a
подчиняет b, b подчиняется a.
Узлы графа, не являющиеся началом никаких дуг, висячие узлы = листы (сейчас, мы, синтаксис).
Узлы, не являющиеся ни началом, ни концом
никаких дуг, - изолированные узлы (вводные
слова).
22. Структуры зависимостей: связность – свойство любого предложения
Сейчас мы начинаем изучать синтаксис.синтаксис
сейчас изучать
начинаем
мы
23. Дерево зависимостей
Последовательность узлов графа – путь:1) начинаем -> мы
2) начинаем -> сегодня
3) начинаем -> изучать -> синтаксис
24. Дерево зависимостей
Конечный граф – ДЕРЕВО, еслиА) в нем есть только один узел, не являющийся концом никакой
дуги: корень (начинаем) – ПРИНЦИП ЕДИНСТВЕННОСТИ
КОРНЕВОГО УЗЛА;
Б) любой некорневой узел является концом только одной дуги
(мы,
сегодня,
изучать,
синтаксис)
–
ПРИНЦИП
ЕДИНСТВЕННОСТИ ВЕРШИНЫ;
В) нет замкнутых путей (конец НЕ= началу) – ПРИНЦИП
ЗАПРЕТА НА КОНТУР.
25. Структуры зависимостей: связность – свойство любого предложения
Сейчас мы начинаем изучать синтаксис.синтаксис
сейчас изучать
начинаем
мы
26. Структуры зависимостей: связность – свойство любого предложения
The cat is on the mat.the mat
the cat
on
is
27. Структуры зависимостей: связность – свойство любого предложения
Is the cat on the mat?the mat
the cat
on
is
28. Дерево зависимостей
Дерево зависимостей (дерево синтаксическогоподчинения) – дерево, для которого множеством
узлов служит цепочка словоформ.
Структура дерева зависимостей =
(1) множество словоформ, содержащихся в цепочке,
+
(2) множество n-арных синтаксических отношений,
определенных на множестве словоформ.
29. Грамматика зависимостей
В широком смысле: одна из формальныхсинтаксических моделей языка (структурный
синтаксис): представление строя предложения в виде
иерархии
компонентов,
между
которыми
установлено отношение зависимости.
В узком смысле: теория синтаксической структуры
предложения, где все связи в предложении
рассматриваются как подчинительные, вершина –
сказуемое (или его знаменательная часть).