Similar presentations:
Slovenščina v digitalni dobi
1.
SLOVENŠČINA V DIGITALNI DOBI (7)2024/25
2.
Še ne čisto pravi uvodIzpitno vprašanje:
Vitalnost in ogroženost slovenščine v digitalni dobi – na
podlagi predavanja ter virov in literature podajte lasten
razmislek o tej temi.
3.
0 Uvod0.1
UNESCO, 2002, Jezikovna vitalnost in ogroženost
> Language Vitality and Endangerment, 2003
4.
9 dejavnikov:1. Medgeneracijski jezikovni prenos
2. Absolutno število govorcev
3. Delež govorcev v celotni populaciji
4. Preklapljanja na področjih rabe
5. Odzivnost na nova področja rabe in nove medije
6. Dostopnost učnih sredstev za učenje jezika in pismenosti
7. Uradni status jezika in urejanje njegovega položaja (jezikovna politika)
8. Odnos govorcev kot skupnosti do lastnega jezika
9. Kakovost jezika v besedilih
5.
András Kornai, 2012:Language Death in the Digital Age
http://videolectures.net/metaforum2012_kornai_language/
6.
od 252 jezikov, ki so prisotni na Wikipediji, jih16 velja za varne,
83 za žive,
90 je mejnih in
41 že mrtvih.
7.
Miran Hladnik, 2013:S kvaliteto člankov na Wikipediji se meri vitalnost jezikov in
njihova sposobnost preživetja. Jeziki brez wikiskupnosti so
obsojeni na izumrtje.
8.
/.../9.
1 Jezikovna opremljenost slovenščineStanje leta 2012
META-NET, 2012: Evropski jeziki v digitalni dobi (31):
jezikovnotehnološka podprtost (strojno prevajanje,
procesiranje govora, besedilna analiza, govorni in besedilni
viri ipd.):
Odlična: noben jezik
Dobra: angleščina
Zmerno dobra: predvsem francoščina, španščina, nemščina,
italijanščina, nizozemščina, češčina
Fragmentarno podprti ali zelo slabo podprti ali sploh nepodprti
jeziki: vsi ostali jeziki
10.
Slovenščina:Krek, 2012: Slovenski jezik v digitalni dobi /The Slovene
Language in the Digital Age
Slovenščina je po treh segmentih (razpoznava govora, pomenska
interpretacija besedil in računalniška slovnica) fragmentarno podprta,
pri strojnem prevajanju pa je celo zelo slabo podprta.
11.
Stanje leta 2022Krek, dec. 2022: Razvoj slovenščine v digitalnem okolju
(videopredavanje), https://videolectures.net/razvojSlovenscine2022/
od 13' do 24' 30''
12.
Kaj torej imamo?a) Orodja in aplikacije za procesiranje slovenščine
oblikoslovni označevalnik
prepoznavalnik imenskih entitet
skladenjski razčlenjevalnik
GDEX
luščilnik terminoloških kandidatov
razdvoumljevalnik pomenov
...
13.
b) Orodja in aplikacije za širšo uporabočrkovalniki
pravopisno-slovnični pregledovalniki
prevajalniki
sintetizatorji in razpoznavalniki govora
...
14.
1. Črkovalnik15.
2. Pravopisno-slovnični pregledovalnik(= avtomatska lektorica)
Amebis Besana
(https://besana.amebis.si/preverjanje/)
> Preizkus
16.
3. Prevajalnik/.../
Strojno prevajanje za slovenščino:
Google Translate
Bing Translator
DeepL
Systran Translate
Amazon Translate
ModernTM
eTranslation
...
17.
Projekt Razvoj slovenščine v digitalnem okolju (RSDO),2020 2023, https://www.slovenscina.eu/
5 sklopov:
jezikovni viri
govorne tehnologije
semantični viri in tehnologije
strojno prevajanje
terminološki portal
Za razvoj kakovostnega strojnega prevajalnika je treba zbrati čim večje
količine prevedenih in poravnanih besedil.
18.
>> Prevajalnik RSDO (2022, nastal iz 3 mio poravnanih povedi)3. 1. 2024:
3. 1. 2025:
19.
Zakaj je pomembno, da jeprevajalnik RSDO sploh nastal?
?
Npr.:
Apple iOS
Netflix, Disney+
22. 11. 2023
Vlada RS sprejela spremembe
Zakona o javni rabi slovenščine, obj.
v Uradnem listu 12. aprila 2024, npr.
2. člen:
(3) Javna raba slovenščine obsega tudi
rabo slovenščine v elektronskih
komunikacijskih in digitalnih odjemalnih
napravah, s katerimi uporabniki dostopajo
do storitev informacijske družbe ali
medijev.
20.
4. Govora) Sintetizator govora
Amebis in Alpineon: eBralec, http://ebralec.si/
Preizkus
Več gl. v: M. Huš, Monitor, januar 2018: Od govorca do bralca; tudi
odlomek iz Rdeče kapice
21.
b) Razpoznavalnik govoraFrekvenca X: Vabljeni na pogovor s stroji!, 3. 10. 2013
(0' 5‘ 34‘‘)
= pretvorba glasovnega signala v zaporedje besed, ki jih naprava
prepozna kot ukaz za:
iskanje po napravi in povratni (besedni) odziv ali
komuniciranje z zunanjim svetom (npr. naročilo pri dostavljalcu
hrane)
22.
>> Razpoznavalnik govora RSDO (2022)o nastal na podlagi govorne zbirke Artur (več kot 1000 ur govora v
slovenščini, 800 ur transkripcije, več kot 1500 govorcev, vse slovenske
regije, javni govor radijske postaje)
o = razpoznavalnik (v treh različicah) je v odprtem dostopu na voljo
vsem uporabnikom
>> govorno komuniciranje z napravami v slovenščini
23.
5. Povzemanje in odgovarjanje na vprašanja(demo)
>> preverite sami na https://www.slovenscina.eu/
24.
6. Veliki jezikovni modeli in orodja umetneinteligence
... ki generirajo besedila (pa tudi zvočne in videoposnetke,
fotografije, slike, avatarje ipd.)
>> projekt PoVeJmO, 2023–2026, trenutno poteka zbiranje besedil
več o projektu: Jezikovni pogovori: Simon Krek: Slovenščina ni suverena, če o
njej odločajo pri podjetju OpenAI, 3. 9. 2024
oddaja besedil: https://povejmo.si/
25.
3 SklepIz Uvoda
9 dejavnikov:
1. Medgeneracijski jezikovni prenos
2. Absolutno število govorcev
3. Delež govorcev v celotni populaciji
4. Preklapljanja na področjih rabe
5. Odzivnost na nova področja rabe in nove medije
6. Dostopnost učnih sredstev za učenje jezika in pismenosti
7. Uradni status jezika in urejanje njegovega položaja s strani jezikovne politike
8. Odnos govorcev kot skupnosti do lastnega jezika
9. Kakovost jezika v besedilih
26.
Že sedanjost je v veliki meri digitalna, prihodnost bo taka šebolj. Zato moramo slovenščino opremiti z infrastrukturo, ki
ji bo v takem svetu omogočala enakovreden obstoj z vsemi
ostalimi jeziki. Če nam bo to uspelo, se nam za njeno
vitalnost ni treba bati.
***
27.
Vabljeni, da prisluhnete oz. si ogledate:Frekvenca X: Vabljeni na pogovor s stroji!, 3. 10. 2013,
https://365.rtvslo.si/arhiv/frekvenca-x/174241195
Intelekta: Kako jezikava bo digitalna prihodnost?, 10. 10. 2017,
https://365.rtvslo.si/arhiv/intelekta/174495597
Krek, S., in drugi, dec. 2022: Razvoj slovenščine v digitalnem okolju,
https://videolectures.net/razvojSlovenscine2022/
Podobe znanja: S. Krek, Črni scenarij za slovenščino v dobi ChatGPT-ja je jezikovna
nesuverenost, 26. 5. 2023, https://ars.rtvslo.si/podkast/podobeznanja/526/174960313
Jezikanje: Generativna slovenščina? Da!, 27. 9. 2024,
https://val202.rtvslo.si/podkast/jezikanje/173250741/175075074
lingvistics