O‘zbek tilining internet axborot matnlari korpusini shakllantirishning nazariy va amaliy asoslari

Ushbu dissertatsiya avtoreferati Oʻzbek tilining internet axborot matnlari korpusini shakllantirishning nazariy va amaliy asoslariga bag'ishlangan bo'lib, unda Oʻzbekiston Respublikasi Vazirlar Mahkamasi huzuridagi Oliy attestatsiya komissiyasida B2019.3.PhD/Fil1018 raqami bilan roʻyxatga olingan dissertatsiya tadqiqotining asosiy ilmiy natijalari va xulosalari keltirilgan. Tadqiqotda Oʻzbek tilining internet axborot matnlari korpusini yaratishning nazariy va amaliy asoslari ishlab chiqilgan, korpusda matnlarni lingvistik annotatsiyalashning o'ziga xos tamoyillari aniqlangan va Oʻzbek tili elektron axborot matnlari korpusi yaratilgan.

Asosiy mavzular

  • Tadqiqotning dolzarbligi va zarurati: Jahon tilshunosligida korpus lingvistikasi va korpuslarni yaratish tadqiqotlari, oʻzbek tilining maqomini oshirish, uning faol qoʻllanilishini ta'minlash yuzasidan qabul qilinayotgan qonun va qarorlar hamda Prezident Sh.Mirziyoyevning Oʻzbek tiliga davlat tili maqomi berilganligi haqidagi ta'kidlari tadqiqotning dolzarbligini koʻrsatadi.
  • Tadqiqotning respublika fan va texnologiyalar rivojlanishining ustuvor yoʻnalishlariga mosligi: Mazkur tadqiqot respublika fan va texnologiyalar rivojlanishining I. “Axborotlashgan jamiyat va demokratik davlatni ijtimoiy, huquqiy, iqtisodiy, madaniy, ma'naviy-ma'rifiy rivojlantirish, innovatsion iqtisodiyotni rivojlantirish” ustuvor yo'nalishi doirasida bajarilgan.
  • Muammoning oʻrganilganlik darajasi: Dunyo tilshunosligida korpus lingvistikasi va korpuslarni yaratish tadqiqotlari 60-yillardayoq boshlangan. Oxirgi yillarda oʻzbek tilshunosligida koʻplab tadqiqot ishlari dissertatsiya, maqola va tezislar e'lon qilinmoqda.
  • Tadqiqotning maqsadi va vazifalari: Maqsadi – Oʻzbek tilshunosligida internet axborot matnlari korpusini yaratishning nazariy va amaliy asoslarini ishlab chiqish, korpusda matnlarni lingvistik annotatsiyalashning o'ziga xos tamoyillarini aniqlash va Oʻzbek tili elektron axborot matnlari korpusini yaratish. Vazifalari esa internet matnlari asosida korpus yaratishning nazariy asoslarini aniqlash, korpusini yaratishning oʻziga xos muhim jihatlarini aniqlash, algoritmini ishlab chiqish, ishlash prinsipini tajriba natijalari orqali koʻrish, korpusda natijalarni lingvistik tahlil qilish.
  • Tadqiqotning obyekti va predmeti: Obyekti sifatida oʻzbek tilidagi internet elektron axborot matnlari tanlangan. Predmeti esa internet elektron axborot matnlarining korpus yaratishda muhim bo'lgan leksik-semantik va morfologik xususiyatlari.
  • Tadqiqotning usullari: Tasniflash, tavsiflash, qiyoslash, statistik usul va uning tahlil tamoyillaridan foydalanilgan.
  • Tadqiqotning ilmiy yangiligi: Oʻzbek tili internet axborot matnlari korpusi platformasining lingvistik ta'minotini ishlab chiqish imkonini beruvchi axborot matnlaridagi lisoniy birliklarning leksik-semantik, struktur jihatlarini aniqlash orqali nutq birliklarini izohlash tamoyillari dalillangan.
  • Tadqiqotning amaliy natijasi: Oʻzbek tili elektron axborot matnlari korpusi uchun texnik topshiriqlar ishlab chiqilib, ish jarayoni bosqichma-bosqich belgilandi; korpus qurildi, sayt sifatida e'lon qilindi; nutq birliklarini teglash uchun morfologik va semantik teglar amalda ishlab chiqildi; korpusda nutq birliklari leksik-semantik va morfologik xususiyatlariga koʻra qo'l mehnati va yarim avtomatik annotatsiyalandi.
  • Tadqiqot natijalarining ishonchliligi: Tanlangan muammoning aniq qo'yilganligi, korpus qurilishi boshqa tillar korpuslari bilan uzoq muddatli kuzatuv-tajriba orqali oʻrganilganligi, to'plangan materiallar tahlili orqali oʻzbek tili korpusi qurilganligi, korpusda lingvistik tahlil amallari oʻtkazilib, ilmiy-nazariy xulosalar chiqarilganligi bilan belgilanadi.
  • Tadqiqot natijalarining ilmiy va amaliy ahamiyati: Kompyuter lingvistikasi fanida yangi tadqiqotlar yaratishda nazariy ahamiyat kasb etishi, oʻzbek tilini formallashtirish, kompyuter tilini yaratish boʻyicha ilmiy qarashlar orqali boyishi bilan belgilanadi. Materiallar, natija va xulosalar oʻzbek tilshunosligida korpus lingvistikasi fanida, bakalavriat va magistratura ta'lim yo'nalishlarida maxsus kurs, maxsus seminarlar oʻtishda manba va material vazifasini bajaradi.
  • Tadqiqot natijalarining joriy qilinishi: Internet axborot matnlari korpusi platformasining lingvistik ta'minotini ishlab chiqishda, til korpusi uchun oʻzbek tili birliklarini modellashtirishda, lingvistik modellashtirish va belgilashda standart vositalarini ishlab chiqishda ERASMUS CLASS loyihasida foydalanilgan.
  • Tadqiqot natijalarining aprobatsiyasi: Tadqiqot natijalari 6 ta ilmiy-amaliy anjuman, jumladan, 2 ta respublika hamda 4 ta xalqaro ilmiy-amaliy anjumanda muhokamadan oʻtkazilgan.
  • Tadqiqot natijalarining e'lon qilinganligi: Dissertatsiya mavzusi boʻyicha 11 ta ilmiy ish: 5 ta maqola (3 tasi respublika, 2 tasi xorijiy) nashr etilgan.
  • Disseratatsiyaning tuzilishi va hajmi: Kirish, 3 ta bob, xulosa, foydalanilgan adabiyotlar ro'yxati va ilovadan iborat bo'lib, umumiy hajmi 158 sahifani tashkil qiladi.
  • Internet matnlari asosida korpus yaratishning nazariy asoslari: Bobning birinchi faslida "Korpus lingvistikasi tilshunoslik yoʻnalishi sifatida" deb nomlangan va unda korpusning til va tilshunoslikdagi oʻrni, korpus lingvistikasining nazariy asoslari, korpuslar qanday mezonlar asosida shakllantirilishi tavsiflangan.
  • Korpus lingvistikasining shakllanish tarixi: Birinchi bobning 1.1.1-faslida korpus lingvistikasining shakllanish va rivojlanish bosqichlarining oʻziga xosliklari, davrlashtirish masalasi yoritilgan.
  • Korpus lingvistikasining obyekti, metodi va vazifalari: Birinchi bobning 1.1.2-faslida "Korpus lingvistikasining obyekti, metodi va vazifalari" deb nomlangan boʻlib, unda korpusning asosiy nazariy tushunchalari (namuna olish, muvozanat, til vakili) va an'anaviy tilshunoslik bilan farqlari tushuntirilgan.
  • Internet matnlari asosida korpus yaratish: Birinchi bobning 1.2-faslida "Internet matnlari asosida korpus yaratish" deb nomlangan boʻlib, bu faslda internet matnlarining til korpusi sifatidagi oʻrni va internet matnlari asosida korpus yaratishning nazariy asoslari aniqlangan.
  • Oʻzbek tilidagi elektron axborot matnlarining struktur-semantik xususiyatlari: Ikkinchi bobning birinchi faslida "Oʻzbek tilidagi elektron axborot matnlarining struktur-semantik xususiyatlari" deb ataladi. Bu faslda elektron axborot matnlarining tili va uslubi oʻrganildi.
  • Oʻzbek tilidagi internet axborot matnlari korpusining morfologik annotatsiyasi: Uchinchi bobning ikkinchi faslida "Oʻzbek tilidagi internet axborot matnlari korpusining morfologik annotatsiyasi" deb nomlangan boʻlib, unda morfologik annotatsiyalash algoritmi koʻrsatilgan.
  • Oʻzbek tilidagi internet axborot matnlari korpusining sintaktik annotatsiyasi: Uchinchi bobning uchinchi faslida "Oʻzbek tilidagi internet axborot matnlari korpusining sintaktik annotatsiyasi" deb nomlangan boʻlib, unda sintaktik annotatsiyalashning ahamiyati va zaruriyati xususida soʻz yuritiladi.
  • Oʻzbek tilidagi internet axborot matnlari korpusining semantik annotatsiyasi: Uchinchi bobning toʻrtinchi faslida "Oʻzbek tilidagi internet axborot matnlari korpusining semantik annotatsiyasi" deb nomlanib, korpusda soʻzlarning semantik xususiyatlari va semantik maydonlari teglar yordamida annotatsiyalandi.
  • Xulosa: Oʻzbek tilining internet axborot matnlari korpusini shakllantirishning nazariy va amaliy asoslari boʻyicha olib borilgan tadqiqotlar natijasida bir qator xulosalar chiqarildi, jumladan korpusning turlari, qiyosiy tahlili, internetning korpus sifatida oʻrni va boshqalar.