Similar presentations:
Muddatli vazn va vektorli makon
1. Mavzu: Muddatli vazn va vektor makon modeli
Eshniyazova Nodira2. Reja:
1.Parametrik va zona indekslari2.Terminning chastotasi va vazni
3.TF-IDF vazni
4.Vektor Fazo Modeli
3. Term chastotasi (TF) vateskari chastota (IDF)
TFso‘z hujjatda
necha marta
uchragani.
IDF
so‘z boshqa
hujjatlarda
qanchalik kam
uchrashi.
TF-IDF
so‘zning
ahamiyatini
o‘lchaydi
• Axborot izlash tizimlarida hujjatlarni tegishlilik darajasi bo‘yicha baholash.
• Maqsad – aniq va tez qidiruvni ta’minlash.
4. 1. Parametrik va zona indekslari
Parametrik indekslar (ParametricIndexes) hujjatga tegishli
strukturali meta-ma‘lumotlarni
(muallif, nashr yili, hujjat turi, til)
indekslaydi. Bu qiymatlar so‘rovga
mos kelishini tekshirish uchun
ishlatiladi.
Masalan, foydalanuvchi “Muallif:
AlisherNavoiy VA Nashr yili: 1980 dan
katta” deb so‘rov berishi mumkin. Zona
indekslari (Zone Indexes) hujjatning
matnli qismlarini (“Sarlavha”,
“Abstrakt”, “Asosiy matn”, “Ilovalar”)
alohida indekslaydi, har bir zona uchun
alohida e‘lonlar ro‘yxati yaratiladi.
5.
Og‘irlangan zona reytingi (Weighted ZoneScoring) zona ahamiyatiga qarab vazn
beradi.
Masalan, sarlavhadagi so'z