- Bosh sahifa
- Maqolalar
- O‘zbek tilining milliy korpusi yaratiladi
O‘zbek tilining milliy korpusi yaratiladi
O‘zbek tili
turkiy tillar oilasiga mansub eng yirik tillardan biri bo‘lib, dunyo bo‘yicha 50 millionga yaqin kishi shu tilda
so‘zlashadi. Keyingi yillarda davlat tilining xalqaro miqyosdagi o‘rni va
nufuzi, boshqa tillar bilan aloqalari istiqbolini belgilash, o‘zbek tilining
milliy korpusini yaratish, xorijda istiqomat qiluvchi vatandoshlar va o‘zbek
tilini o‘rganish istagida bo‘lgan chet el fuqarolari uchun o‘zbek tili
darsliklari, elektron dasturlarni ishlab chiqish va o‘zbek tilini o‘rgatish
bo‘yicha amaliy ishlar qilinmoqda.
“2020-2030-yillarda o‘zbek tilini
rivojlantirish va til siyosatini takomillashtirish konsepsiyasi”da davlat
tilining zamonaviy axborot texnologiyalari va kommunikatsiyalariga faol
integratsiyalashuvini ta’minlash ustuvor yo‘nalish sifatida belgilangan.
Konsepsiyada o‘zbek tiliga oid barcha ilmiy, nazariy va amaliy ma’lumotlarni
o‘zida jamlagan elektron ko‘rinishdagi o‘zbek tili milliy korpusini yaratish va
uni jahon axborot tarmog‘ida ommalashtirish vazifalarining ko‘rsatib berilishi
biz, mutaxassislarga katta mas’uliyat yukladi.
Zamonaviy
axborot texnologiyalari tilning funksional imkoniyatlaridan foydalanish
borasida benihoya imkoniyatlar eshigini ochdi. Kompyuter tarjimasi, avtomatik
tahrir va tahlil, yozma matnni ovozlashtiruvchi nutq sintezatorlari, og‘zaki
nutqni yozma matnga aylantiruvchi nutqni tanish dasturlari, elektron lug‘atlar,
lingvistik mobil ilovalar, tezauruslar va til ontologiyasi fikrimizning
dalilidir. Ayniqsa, zamonaviy elektron lug‘atlar tuzish va undan foydalanish
madaniyatini shakllantirish til imkoniyatini egallashda samarador ekanligi o‘z
isbotini topgan. Xususan, tilning imkoniyatini namoyon qilish va egallash
borasida dunyo miqyosida tez sur’atlarda yaratilayotgan til korpuslarining roli
beqiyos.
Bu borada
“O‘zbek tilining milliy korpusini loyihalash va dasturiy majmua ishlab chiqish”
mavzusida 9 nafar ilmiy va texnik xodimlarimiz bilan birgalikda amaliy ishlarni
boshladik.
Dastavval,
mavjud xorijiy milliy korpuslarni tahlil qilish, o‘zbek tili milliy korpusini
yaratish tamoyillarini aniqlash, dasturiy ta’minot talablarini shakllantirish,
loyihalash, dasturiy ta’minot uchun algoritmlarni ishlab chiqish, sinovdan
o‘tkazish va tasdiqlash kabi loyihamizning asosiy vazifalarini belgilab oldik.
Ushbu amaliy
tadqiqot davomida ayni paytga qadar mavjud xorijiy milliy korpuslarni
tahlil qilish asosida o‘zbek tili milliy korpusi modeli yaratildi. Matnlarni
avtomatik qayta ishlash, tokenlash, lemmalash va grammatik razmetkalash
modellari va algoritmlari ishlab chiqildi. Internet orqali o‘zbek tili milliy
korpusidan foydalanish uchun “uzbekcorpora.uz” veb-sayti ishga tushirildi.
Tadqiqotning
asosiy natijasi o‘zbek tili milliy korpusini yaratish uchun ishlab chiqilgan
dasturiy majmuadan iborat bo‘ladi. Ushbu dasturiy majmua korpus lingvistikasi
mutaxassislariga mo‘ljallangan bo‘lib, zamonaviy internet texnologiyalari
asosida o‘zbek tilining tanlangan matnlar jamlanmasi bo‘yicha mualliflik yoki
tematik korpuslar hamda o‘zbek milliy korpusini yaratishga imkoniyat beradi.
Dasturiy ta’minot “Alpomish” dostoni matnlari asosida korpus yaratish yo‘li
bilan sinovdan o‘tkazilgan va foydalanishga tayyor holatga keltirilgan.
Ushbu
yo‘nalishda olib borilayotgan amaliy ishlar samarasida xorijiy va mahalliy
jurnallarda 10 ga yaqin, anjumanlarda 24 ta maqola e’lon qilinib, 5 ta dasturiy
guvohnoma olindi. Amaliy tadqiqot ishlarining kelgusi bosqichlarida o‘zbek
tilining tanlangan matnlar jamlanmasi bo‘yicha korpus shakllantiriladi va
korpusga kiritilgan matnlar ustida turli ilmiy tadqiqotlar o‘tkazishga
imkoniyat beradigan dasturlar yaratiladi.
Suyun KARIMOV,
filologiya fanlari doktori, Sharof Rashidov nomidagi SamDU
professori.