ЧАСТОТНІ СЛОВНИКИ – навіщо вони?
ЧСУП
ЧастСлУкрПреси
Перші 200 слів ЧСУП, які дають покриття 50,2% газетних текстів українською мовою
ПЕРШІ 200 СЛІВ у живому складанні
Що тут помітили Зіпф і Флеш
Перший у світі частотний словник Ф.Кедінґа (сучасне видання)
Базові праці класиків: ● Estoup J.-B. Les gammes sténographiques. – Paris, 1916. ● Zipf G.K. Selected Studies of the Principle
Часові пласти англійського словника (діаграми Дж.Зіпфа; до закономірності № 6)
1/4
Розподіл 80 службових слів серед 200 найчастотніших слів (УЧС)
Перфор-маційні константи частин мови (РЧС) “N всіх слів тексту до N повнозначних = N повнозначних до N службових” = Ф [ОМ, с.
Золотий перетин
РЧС
Типова сторінка
Початок частотного реєстру (ЧР)
РЧС
Накопичення числа слів і частка покриття ними мільйоннослівного тексту
Момент досягнення половини слів мільйоннослівного тексту
ПОКРИТТЯ ВАШОГО іноземного тексту “ВАШИМ” вивченим за 1½ місяця словником: “Процес пішов”
ПОКРИТТЯ ВАШОГО іноземного тексту ВАШИМ словником “у голові”, вивченим за 4-5 років. Щороку зусилля стабільне, але приріст у %
Ось перша сотня: покриття 41,3 % слів тексту
Знову залежність Зіпфа-Флеша
Залежність Зіпфа у словотворі (ФЧСС) (ОМ, с. 146)
Підрахунки словотвірних гнізд за словником ФЧСС: Tyschenko K., Rudyj B. Suomen kielen sananjohdon taajuuskirja. A Frequency
A Frequency Dictionary of Persian
Routledge stand at Senate House History Day 2018
Розрізняти науку і марчандайзинґ
Закони Зіпфа і Ґіро
Покриття тексту
Покриття тексту
Покриття тексту
Висновки з теми
Література
19.68M
Category: ukrainianukrainian

Скільки слів має знати перекладач?

1.

1.Скільки слів має знати
перекладач?
2. Слова зручніше вчити стихійно
чи відбирати їх за планом?
3. Чи вивчите ви весь словник “своєї”
східної мови? За скільки часу?
4. Чи можна якісь ділянки словника
просто не вчити?
5. Чи уявляєте ви сьогодні, 24.10.22, які саме
слова – першочергові для завчання? І чому?

2.

Основи мовознавства
для сходознавців (ІФ КНУТШ)
К.М.Тищенко
ЧАСТОТНІ СЛОВНИКИ
У ВИВЧЕННІ СХІДНИХ МОВ
(Актуальна на 24 і 28.10.2022 частина теми 4:
“Синтактика. Лінґвостатистичні закони”)
За матеріалами експонатів Лінґвістичного
навчального музею КНУТШ

3.

І. ЩО ТАКЕ
ЧАСТОТНИЙ
СЛОВНИК?

4. ЧАСТОТНІ СЛОВНИКИ – навіщо вони?

Соломія
БУК
3000
найчастотніших слів
НАУКОВОГО
Стилю СУЧАСНОЇ УКРАЇНСЬКОЇ МОВИ

5. ЧСУП

• ЧСУП – Частотний словник українського
публіцистичного стилю – (укладений за
матеріалами центральних та обласних
газет «Українська Правда», "Україна
молода", "Голос України", "Дзеркало
тижня", "Наша Газета+", «Львівська
газета», "Рівне вечірнє", «Правда»,
«Критика», «Контекст», «Коментар»,
«Церква і молодь»).
http://www.mova.info/Page2.aspx?l1=178

6. ЧастСлУкрПреси

• ПОЧАТОК ЧАСТОТНОГО СЛОВНИКА
СУЧАСНОЇ УКРАЇНОМОВНОЇ ПРЕСИ.
• Стандартне доопрацювання (Б. Рудий,
К. Тищенко) даних публікації: [ЧСУП].
Курсивом набрані ключові слова. Відсотки
прибувним підсумком вказують покриту
словником частину сумарного тексту з
256.607 словоформ. Всього у словнику
5332 різні слова, у т.ч. 347 імен власних.
• Кожне друге слово української преси – з
дальших 200 найчастотніших слів

7. Перші 200 слів ЧСУП, які дають покриття 50,2% газетних текстів українською мовою

8.

¼



³/₇

9.

⁴/₉
½

10. ПЕРШІ 200 СЛІВ у живому складанні

10 в і на з не що бути до який та 18,7%
20 за той він а це цей як вони про ми 26,0%
¼ тексту
30 свій для рік я від але вона весь такий людина 30,4%
40 могти мати вже один час український інший чи наш ж 33,4%
⅓ тексту
50 ще президент сказати так також стати коли якщо лише влада 35,6%
60 під по ви щоб хто б день перший себе країна 37,4%
⅜ тексту
70 робити після питання навіть новий то або справа слово саме 38,9%
80 можна робота тому рішення де через голова місце область самий 40,2%
90 кожний проблема більше дати два сьогодні відбутися вибори дуже депутат 41,3%
100 політичний будинок місто закон дільниця право гривня останній без раз 42,4%
110 ситуація їхній тут державний все другий бо щодо життя великий 43,4%
120 повідомити особа працювати при член представник держава багато кілька тільки 44,4%
130 річ народ почати діти сила група результат там просто організація 45,2%
140 проект прихильник світ бік вулиця місцевий тисяча власний випадок хоча 46,0%
150 мій міський опозиція отримати проте перед уряд суд між гроші 46,8%
160 думка тоді частина команда зараз голосування три виборчий орган обласний 47,6%
170 тепер участь немає національний рівень вважати центр адже народний учасник 48,3%
180 сам повинен парламент хотіти можливість потім говорити майдан жодний дія 48,9%
190 стояти ніж акція голос оскільки більшість район серед ніхто біля 49,6%
200 якийсь журналіст процес рука рівненський головний підтримка різний діяльність ціна 50,2%
З цієї жменьки слів – ½ ВСЯКОГО тексту

11. Що тут помітили Зіпф і Флеш

10 в і на з не що бути до який та 18,7% (8)
Чим слово частотніше,
20 за той він а це цей як вони про ми 26,0% (8)
тим воно коротше
30 свій для рік я від але вона весь такий людина 30,4% (5)
40 могти мати вже один час український інший чи наш ж 33,4% (4)
50 ще президент сказати так також стати коли якщо лише влада 35,6% (6)
60 під по ви щоб хто б день перший себе країна 37,4% (7)
70 робити після питання навіть новий то або справа слово саме 38,9% (5)
80 можна робота тому рішення де через голова місце область самий 40,2% (3)
90 кожний проблема більше дати два сьогодні відбутися вибори дуже депутат 41,3% (4)
100 політичний будинок місто закон дільниця право гривня останній без раз 42,4% (1)
110 ситуація їхній тут державний все другий бо щодо життя великий 43,4% (4)
120 повідомити особа працювати при член представник держава багато кілька тільки 44,4% (4)
130 річ народ почати діти сила група результат там просто організація 45,2% (2)
140 проект прихильник світ бік вулиця місцевий тисяча власний випадок хоча 46,0% (2)
150 мій міський опозиція отримати проте перед уряд суд між гроші 46,8% (3)
160 думка тоді частина команда зараз голосування три виборчий орган обласний 47,6% (3)
170 тепер участь немає національний рівень вважати центр адже народний учасник 48,3% (2)
180 сам повинен парламент хотіти можливість потім говорити майдан жодний дія 48,9%
190 стояти ніж акція голос оскільки більшість район серед ніхто біля 49,6% (5)
200 якийсь журналіст процес рука рівненський головний підтримка різний діяльність ціна 50,2% (0)
200 найчастотніших слів складають 50 % тексту

12. Перший у світі частотний словник Ф.Кедінґа (сучасне видання)

● Зроблений для потреб стенографії
у Німеччині Ф.Кедінґом з помічниками
1898 р. відразу на тексті-корпусі в 11
млн слів (!).
● Цей КОРПУС включає тексти
з 290 джерел від художньої літератури до записів парламентських
дебатів [Николова, 15].
● Найвідоміші спостереження
Кедінґа:
► ПОЛОВИНА СЛІВ У ТЕКСТІ –
ОДНОСКЛАДОВІ
(і це для німецької !);
► чим БІЛЬШЕ СКЛАДІВ у слові, тим
МЕНШЕ ТАКИХ СЛІВ у тексті (див.
ОМ, рис. 16).

13.

14.

15.

G.K. Zipf
J.B. Estoup

16. Базові праці класиків: ● Estoup J.-B. Les gammes sténographiques. – Paris, 1916. ● Zipf G.K. Selected Studies of the Principle

of Relative Frequency
in Language. – Cambridge, 1932; ● The Psychobiology of Language.
An Introduction to Dynamic Philology. – Boston, 1935; ● Human
Behaviour and the Principle of Least Effort. – Cambridge, 1943.

17. Часові пласти англійського словника (діаграми Дж.Зіпфа; до закономірності № 6)

18.

1-200 за абеткою. УЧС: ПОЧАТОК СЛОВОТВІРНОЇ КОНСОЛІДАЦІЇ СЛОВНИКА
а
або
адже
акція
але
б
багато
без
бік
більше
більшість
біля
бо
будинок
бути
в
вважати
великий
весь
вже
ви
вибори
виборчий
випадок
від
відбутися
він
влада
власний
вона
вони
все
вулиця
говорити
голова
головний
голос
голосування
гривня
гроші
група
дати
два
де
день
депутат
держава
державний
дільниця
діти
дія
діяльність
для
до
другий
дуже
думка
ж
життя
жодний
журналіст
з
за
закон
зараз
і
інший
їхній
кілька
кожний
коли
команда
країна
лише
людина
майдан
мати
ми
між
мій
місто
місце
місцевий
міський
могти
можливість
можна
на
навіть
народ
народний
національний
наш
не
немає
ніж
ніхто
новий
обласний
область
один
опозиція
орган
організація
оскільки
особа
останній
отримати
парламент
перед
перший
питання
під
підтримка
після
по
повинен
повідомити
політичний
потім
почати
право
працювати
представник
президент
при
прихильник
про
проблема
проєкт
просто
проте
процес
раз
район
результат
рівень
рівненський
різний
рік
річ
рішення
робити
робота
рука
сам
саме
самий
свій
світ
себе
серед
сила
ситуація
сказати
слово
справа
стати
стояти
суд
сьогодні
та
так
такий
також
там
тепер
тисяча
тільки
то
тоді
той
тому
три
тут
український
уряд
учасник
участь
хотіти
хоча
хто
це
цей
центр
ціна
час
частина
через
чи
член
ще
що
щоб
щодо
я
як
який
якийсь
якщо
4–2
3–5
2 – 15

19. 1/4

УЧС: НАЙЧАСТОТНІША СОТНЯ
10 в і на з не що бути до який та 18,7% (8)
20 за той він а це цей як вони про ми 26,0% (8)
1/4
30 свій для рік я від але вона весь такий
людина 30,4% (5)
40 могти мати вже один час український інший
чи наш ж 33,4% (4)
1/3
50 ще президент сказати так також стати коли
якщо лише влада 35,6% (6)
60 під по ви щоб хто б день перший себе країна
37,4% (7)
70 робити після питання навіть новий то або
справа слово саме 38,9% (5)
80 можна робота тому рішення де через голова
місце область самий 40,2% (3)
2/5
90 кожний проблема більше дати два сьогодні
відбутися вибори дуже депутат 41,3% (4)
100 політичний будинок місто закон дільниця
право гривня останній без раз 42,4% (1)

20. Розподіл 80 службових слів серед 200 найчастотніших слів (УЧС)

21. Перфор-маційні константи частин мови (РЧС) “N всіх слів тексту до N повнозначних = N повнозначних до N службових” = Ф [ОМ, с.

Перформаційні
0,603
константи
частин
мови
+ 0,026 –
цифри і знаки
(РЧС)
“N всіх слів
тексту до
N повнозначних
=
N повнозначних
до N службових”
0,371

похибка
–0,011 ?
[ОМ, с. 150]

22. Золотий перетин

Число Фі
(a + b) : a = a : b
1,618... : 1 = 1 : 0,618...
SECTIO AUREA
GOLDEN RATIO
Золотий перетин
Деталі рослини Aeonium tabuliforme

23.

24.

25. РЧС

• Існує словник (у списку літератури в підручнику –
РЧС на с. 150) за ред. Л. Засоріної "Частотный
словарь русского языка": він є в мережі і має добре
опрацьований теоретичний додаток.
• Словник укладений на мільйоннослівному тексті,
– у якому виявлено бл. 40 тис. різних слів. Головне
досягнення словника – частотний список слів там
іде у розділі "ЧАСТОТНЫЙ СЛÓВНИК" (для вас
новина, що існує російське слово слóвник – тобто
‘реєстр слів’) від с. 807.
• Для початківців-філологів будь-якої мови тут
найважливіші перші 230 слів (до слова сегодня на
с. 809 з частотою 497 на 1 млн.): з них складається
ПОЛОВИНА СЛІВ УСЯКОГО РОСІЙСЬКОГО
ТЕКСТУ.

26. Типова сторінка

Тексти корпусу:
газетні
драматургія
наукові
художні
Типова сторінка
г
д
н
х
г д н х

27.

ˊ
• Це російська назва для ‘частотного реєстру’.
• Він поданий від сторінки 807 РЧС.
• Тут найцінніший матеріал словника.
• А для вас особливо – його перші 230 слів (с. 807809).
• Секрет у тому, що саме з цих 230 слів складається
ПОЛОВИНА всякого російського тексту.
• А з їхніх відповідників – БЛИЗЬКО ПОЛОВИНИ
тексту в кожній іншій мові.
(Ваш викладач апробував це наукове досягнення у
викладанні десятка іноземних мов різної будови.)

28. Початок частотного реєстру (ЧР)

№ у ЧР Початок частотного реєстру (ЧР)
і сумар. %
покриття
тексту
1: 4.05 %
60: 36 %
10: 18 %
70: 37.6 %
20: 24 %
80: 39 %

29.

220: 49,5 %
228: 50 %
230
Бажаючі
уточнити – 228
чи 230 слів –
можуть сюди
повернутися до
цього пунктиру
через три кадри

30. РЧС

• Хто захоче розібратися глибше, може розкрити
стор. 902 РСЧ, рядок таблиці 10: ранг 213, слово
з частотою 497: накопичена кількість слів – 230,
накопичена відносна частота – 0,5002196.
• Це і є мить подолання половини словоформ
мільйоннослівного тексту...
• (Слово сегодня з частотою у тексті 497 – насправді у частотному реєстрі не 230-е, а 228-е.)

31. Накопичення числа слів і частка покриття ними мільйоннослівного тексту

22 слова: 25 %

32. Момент досягнення половини слів мільйоннослівного тексту

Момент досягнення половини 230: 50 %
слів мільйоннослівного тексту

33.

1. Чи покриття тексту словником
буде приростати так істотно і далі?
2. Чи помітний початок інтегративних
процесів у формуванні власного
словника?
3. Невже взаєминами словника і
тексту керує гармонія?
4. Чи існують частотні словники
східних мов?
5. Годинниковий механізм
породження тексту.

34. ПОКРИТТЯ ВАШОГО іноземного тексту “ВАШИМ” вивченим за 1½ місяця словником: “Процес пішов”

TEKCT
100%
1 сем.
Ми поки що тут
50% 200: 50 %
230: 50 %
2 сем.
(4000-5000: 85-87 % ●)
Плюс 2,3,4 курси
1000:
67 %
500: 59 %
ПОКРИТТЯ ВАШОГО іноземного тексту
“ВАШИМ” вивченим за 1½ місяця словником:
“Процес пішов”
ВАШ словник 250
500
1000

35. ПОКРИТТЯ ВАШОГО іноземного тексту ВАШИМ словником “у голові”, вивченим за 4-5 років. Щороку зусилля стабільне, але приріст у %

TEKCT
100%
Ми тут
(Досить віддалене майбутнє)
6 сем.
4 сем.
8 сем.
2 сем.
5000: 87 %
Плюс 2,
3,
4 курси
4000: 85 %
3000: 81 %
2000: 76 %
1000:67 %
50 %
50%230:
ПОКРИТТЯ ВАШОГО іноземного тексту
ВАШИМ словником “у голові”, вивченим за 4-5
років. Щороку зусилля стабільне, але приріст у %
менший: ціна довершеності
ВАШ словник
2000
4000
5000

36. Ось перша сотня: покриття 41,3 % слів тексту

• в и не на я быть что он с а;
• как это вы ты к мы этот она они но;
• по весь за то все у из свой так о;
• же который бы от мочь один для такой сказать тот;
• вот только еще говорить наш да себя знать год
его;
• нет большой до когда уже если дело другой чтобы
или;
• сам время какой идти ну новый самый человек мой
люди;
• первый рука кто стать жизнь видеть под надо ни
очень;
• без день два более при даже хотеть раз видать
сейчас;
• теперь товарищ здесь ли должен советский там
работа думать глаз;

37. Знову залежність Зіпфа-Флеша


Чим слово частотніше,
тим воно коротше
в и не на я быть что он с а
как это вы ты к мы этот она они но
по весь за то все у из свой так о
же который бы от мочь один для такой сказать тот
вот только еще говорить наш да себя знать год его
нет большой до когда уже если дело другой чтобы или
сам время какой идти ну новый самый человек мой люди
первый рука кто стать жизнь видеть под надо ни очень
без день два более при даже хотеть раз видать сейчас
теперь товарищ здесь ли должен советский там работа думать глаз 100
страна ведь земля слово мир где свет пойти ваш каждый
сила народ место тут дать есть стоять рабочий вопрос борьба
ее вода тогда больше после жить голова можно иметь через
хорошо тоже война их перед смотреть друг город дом такое
казаться почему взять потом тысяча лицо лета понимать дверь сделать
над старший конечно делать чем значить несколько великий книга уходить
труд работать много последний три между входить ничто второй понять
всегда любить завод уйти давать стекло путь американский стол сторона
потому молодой отец часть конец голос наука пока правда твой
писать камень будто слышать против мать вид армия просто спросить
выйти высокий всякий прийти начать развитие хороший случай партия вдруг
увидеть сидеть машина оно важный совсем дорога полный русский главный
пора почти выходить нельзя вместе производство куда сегодня
230: покриття 50 % т.
200

38.

1-228 за абеткою. РЧС: ПОЧАТОК СЛОВОТВІРНОЇ КОНСОЛІДАЦІЇ СЛОВНИКА
а
американский
армия
без
более
больше
большой
борьба
будто
бы
быть
в
важный
ваш
вдруг
ведь
великий
весь
взять
вид
видать
видеть
вместе
вода
война
вопрос
вот
время
все
всегда
всякий
второй
входить
вы
выйти
высокий
выходить
где
главный
глаз
говорить
год
голова
голос
город
да
давать
даже
дать
два
дверь
делать
дело
день
для
до
должен
дом
дорога
друг
другой
думать
его
ее
если
есть
еще
же
жизнь
жить
за
завод
здесь
земля
знать
значить
и
идти
из
или
иметь
их
к
каждый
казаться
как
какой
камень
книга
когда
конец
конечно
который
кто
куда
лета
ли
лицо
любить
люди
мать
машина
между
место
мир
много
можно
мой
молодой
мочь
мы
на
над
надо
народ
наука
начать
наш
не
нельзя
несколько
нет
ни
ничто
но
новый
ну
о
один
он
она
они
оно
от
отец
очень
партия
первый
перед
писать
по
под
пойти
пока
полный
понимать
понять
пора
после
последний
потом
потому
почему
почти
правда
при
прийти
производство
просто
против
путь
работа
работать
рабочий
раз
развитие
рука
русский
с
сам
самый
свет
свой
сделать
себя
сегодня
сейчас
сидеть
сила
сказать
слово
случай
слышать
смотреть
советский
совсем
спросить
старший
стать
стекло
стол
сторона
стоять
страна
так
такое
такой
там
твой
теперь
то
товарищ
тогда
тоже
только
тот
три
труд
тут
ты
тысяча
у
увидеть
уже
уйти
уходить
хороший
хорошо
хотеть
часть
человек
чем
через
что
чтобы
это
этот
я
4–3
3–4
2 – 23

39.

40.

41.

42.

43. Залежність Зіпфа у словотворі (ФЧСС) (ОМ, с. 146)

• [R36]110-111 Залежність Зіпфа у словотворі. Досвід
комп'ютерного укладання частотного словника фінського
словотвору дав змогу одержати базу статистичних даних
[див. Tyschenko, Rudyj], два параметри якої унаочнено на
рис. 18. Графіки ілюструють дві виявлені області прояву
залежності Зіпфа у словотворі: зі спаданням ранґу
словотвірного гнізда число слів у ньому закономірно
спадає, а кількість самих гнізд зростає за кривою Зіпфа.
• Іншими словами, що більше похідних у словотвірному гнізді,
то менше таких гнізд. Або інакше: що більша продуктивність
основи, то менше таких основ. Серед найпродуктивніших
фінських основ виявлені: yksi 'один' (72 похідні), yli 'верхній'
(69), keski 'середній' (63), maa 'земля' (54), elää 'жити' (41),
ensi 'перший' (39), liike 'рух; торгівля' (37), aika 'час' (36
похідних) тощо. Найбільші гнізда – унікальні, гнізд з 15–20
похідними – десяток, з 10 похідними – 25; а непродуктивних
(з одного слова) – 818.

44. Підрахунки словотвірних гнізд за словником ФЧСС: Tyschenko K., Rudyj B. Suomen kielen sananjohdon taajuuskirja. A Frequency

Dictionary of Finnish Word
Building. К., 2004. 140 с.
В абеткових упорядкуваннях частотної лексики видно, як починається
наростання однокореневих слів у
тривалій мовній пам’яті ...
ПРО МОВНУ ПАМ’ЯТЬ
БУДЕ ОКРЕМА ЛЕКЦІЯ

45.

ІІ. СЛОВНИКИ
ЧАСТОТНИХ СЛІВ
НА МАТЕРІАЛІ
МОВ СХОДУ

46.

ТЕПЕР – ПРО
СВІТ СУЧАСНИХ
СХІДНИХ
ЧАСТОТНИХ
СЛОВНИКІВ
2009

47.

2011

48.

2013
Словникове осердя мови

49.

2015

50.

2016

51.

2016

52.

2017

53. A Frequency Dictionary of Persian

54.

2017

55.

56.

2018

57. Routledge stand at Senate House History Day 2018

58.

2021

59.

60.

61.

62.

63.

Variation of watashi (I, me)
The most formal variant, watakushi, is used most frequently in academic presentations, and is
rarely used in dialogue. The most casual variant, atashi, shows the opposite pattern.
watakushi
watashi
watakushi
watashi
atashi
watashi

64.

65. Розрізняти науку і марчандайзинґ

• Frequency information has a CENTRAL ROLE TO
PLAY IN LEARNING A LANGUAGE.
• Nation (1990) showed that the 4,000–5,000 most
frequent words account for up to 95 per cent of a
written text
• and the 1,000 most frequent words account for 85
per cent of speech.
• Although these results are only for English, they do
provide clear evidence that, WHEN EMPLOYING
FREQUENCY AS A GENERAL GUIDE FOR
VOCABULARY LEARNING, it is possible to acquire a
lexicon which will serve a learner well most of the
time.
According to:
Де ж внесок Естý? Де Зіпф? Ґіро?
Де Торндайк і Вест?

66. Закони Зіпфа і Ґіро

Знаючи
стільки
слів,
МОЖЕТЕ ЗРОЗУМІТИ:
можете упізнати
у тексті:

67.

68. Покриття тексту

Виявляється, що
7/8 усього почутого
за життя словника
(34 тис. слів з 39
тис. = його 87%) ...
Рідко вживані слова (19 тис. вжитих
по 1 і 2 рази на 1 млн) становлять
ПОЛОВИНУ слів словника, але
у тексті вони складають його семантично цінні, бо "останні“ 2 %
ТРЕТИНА (!) слів
словника трапиться
вам по РАЗУ на мільйон
слововживань...
А якісь за життя
й не трапляться...
Зате з повторених
перших 5 тис.
частотних слів
словника (це його
13%) складається
87% тексту
}
...нам потрібні,
щоб упізнати
лише 1/8 слів у
“життєвому”
тексті (його 13%).
Аналізована діаграма:
А от найчастіше вживані
(переважно “пакувальні”) перші
230 слів (0,6 % словника!) складають
ПОЛОВИНУ всіх словоформ тексту
Рис. 14. Кореляція частотності слів словника і
словоформ тексту
– з кн.: Тищенко К.М.
Основи мовознавства.
Системний підручник.
К., 2007. С. 141.
Діаграма укладена за
даними РЧС за ред.
Л.Засоріної (с. 895-915).

69. Покриття тексту

ВАШИХ ЗНАНЬ
МАЛОВЖИВАНИХ
СЛІВ
УНІВЕРСИТЕТ ВІД
ВАС І НЕ ЧЕКАЄ.
}
ТИХ 4-5-6 ТИС. СЛІВ
ВАМ ВИСТАЧИТЬ НА
4 – 6 РОКІВ (звичайно ж,
це лише один з аспектів – і
не головний – у навчанні)
Аналізована діаграма:
Рис. 14. Кореляція частотності слів словника і
словоформ тексту
А ЦІ перші 230 слів
потрібні вже відсьогодні
(і щодня на всі роки далі!)
– з кн.: Тищенко К.М.
Основи мовознавства.
Системний підручник.
К., 2007. С. 141.
Діаграма укладена за
даними РЧС за ред.
Л.Засоріної (с. 895-915).

70. Покриття тексту

ЯКИЙ ЖЕ “ВЛАСНИЙ” СЛОВНИК
ВИ ВСТИГНЕТЕ СФОРМУВАТИ СОБІ
в умовах, створених університетом?
Решту (для останніх 13% майбутніх
ваших текстів) будете дізнаватися
за випадкових обставин усе життя...
Ви встигнете засвоїти лише 13% словника
цілої мови – отих частотних 5 тис. слів, які
упродовж десятиліть повторюються
багаторазово, справно
заповнюючи 87% тексту:
Покриття
тексту
А в чому варто
особисто переконатися
вже тепер, у жовтні,
на другому місяці навчання ?
Чи ТОЧНО в засвоєний ПОЧАТОК свого словника
ви вже включили ВСІ ЦІ найчастотніші 230 слів?
Вони були комусь, а далі будуть вам ПОЛОВИНОЮ тих
текстів, що тільки-но чекають на вас у житті...

71. Висновки з теми

Основний висновок: як хочемо упізнавати ПОЛОВИНУ
ВСІХ ІЄРОГЛІФІВ чи СЛІВ БУДЬ-ЯКОГО ТЕКСТУ, –
то за кілька вечорів довчÍмо, чого бракує САМЕ
З ЦИХ 200-230 слів СВОЄЮ СХІДНОЮ МОВОЮ.
ЗАСВОЇВШИ ЇХ, студент сходить на одну професійну
сходинку вище, бо відчуває якісну різницю з
власним попереднім станом неспокою перед
монолітно-неприступним східним текстом.
Хоча цей неспокій і природний на початку освоєння
мови, однак його час меншає завдяки знанню
теорії.
ТЕКСТИ ПЕРЕСТАЮТЬ ВИГЛЯДАТИ МОНОЛІТАМИ.
З часом спостережливі помітять і “КУМУЛЯТИВНИЙ
ЕФЕКТ” (зв’язки МІЖ вивченими словами у пам’яті).

72. Література

• 1. Бук С. 3000 найчастотніших слів розмовнопобутового стилю сучасної української мови. Львів,
2015.
• 1. Бук С. 3000 найчастотніших слів наукового
стилю сучасної української мови. Львів, 2015.
• 2. Тищенко К.М. Основи мовознавства. К., 2007.
• 3. Частотный словарь русского языка / Ред. Л. Н.
Засорина. М., 1977. 936 с.
• 4. J.-B. Estoup. Les gammes sténographiques.
P.,1912.
• 5. Šteinfeldt E. Dictionnaire des fréquences des mots
dans le russe d’aujourd’hui. M.,1975.
• 6. Zipf, G.K. Human Behaviour and the Principle of
Least Effort. – Cambridge, 1943.
English     Русский Rules