Täzelikler

Baş sahypa > Täzelikler

TÜRKMEN DILINE DÜŞÜNÝÄN “AKYLLY” TEHNOLOGIÝA

Häzirki wagtda ýurdumyzda sanly ulgama geçmek we sanlylaşdyrmak esasynda milli ykdysadyýetimizi ösdürmek babatynda hormatly Prezidentimiziň degişli Karary bilen tassyklanan “Türkmenistanda 2019–2025-nji ýyllarda sanly ykdysadyýeti ösdürmegiň Konsepsiýasyna” laýyklykda, ýurdumyzyň köp ýerlerinde akylly öýler we akylly enjamlar ornaşdyrylýar. Olaryň köpüsini iňlisçe sözleri aýtmak arkaly dolandyryp bolýar. Gynansak-da, häzirki wagtda akylly enjamlar türkmen dilini tanamaýar. Bu işde türkmen diliniň sözlerini tekste öwürmegiň akylly tehnologiýasy we programma üpjünçiligi işläp düzüldi. Bu tehnologiýany ornaşdyrmak arkaly akylly enjamlar türkmen dilini tanamaga ukyply bolýar. Meselem, öýde “çyrany öçür” diýmek bilen akylly enjam olary öçürip biler. Şeýle hem, türkmen diline düşünýän akylly tehnologiýany ulanylyp, düzülen programma üpjünçilgi, başga-da, el myşsalarynda, görüş ulgamlarynda kemçilikleri bar bolan adamlara kompýuterde tekst ýazmakda, akylly telefony ýa-da kompýuteri diňe ses buýruklary arkaly dolandyrmak mümkinçiligni berýär.

Taýýarlanan programma üpjünçiligi “Python” programmirleme dilinde düzüldi. Bu programma üpjünçiligi emeli aňyň düzüm bölekleri bolan “machine learning” we “neural network” bilen işleýär [1]. Programmany döretmek üçin köp sanly daşary ýurt uniwersitetleriniň we programma üpjünçiligi bilen işleşýän kompaniýalarynyň ylmy işleri we tejribeleri öwrenildi. Olaryň esasylarynyň hataryna ABŞ-nyň Karnegi Mellony uniwersiteti, Moskwanyň fiziki-tehnologiki instituty, “Google”, “IBM”, “Data Monsters” programma üpjünçilik kompaniýalary bar [2; 3; 4].

“Machine learning” arkaly işleýän programmalaryň aglaba böleginiň işlemegi üçin ýeterlik mukdarda maglumatlaryň berilmegi möhüm bolup durýar. Ýagny “Machine learning” usulynyň özi berlen maglumatlary öwrenip işleýär. Bu programma üpjünçiliginiň işleýiş takyklygynda gowy netijeler almak üçin 100 töweregi adamyň 20 sagatdan gowrak türkmen dilindäki audio ýazgylary gerek bolup durýar [5]. Häzirki wagtda bu programmada 10 sany adamyň 2 sagat töweregi audio ýazgysy bar. Bu maglumatlary ulanyp programmada barlag geçirilende, onuň işleýşi 70–80% takyklygy berdi. Sesi tekste öwürýän programma üpjünçiligi türkmen diliniň sesini tanaýan ýörite işlenilip düzülen türkmen diliniň modeli esasynda işleýär.

Daşary ýurt dilleri üçin (rus dili, iňlis dili) internet ulgamynda taýýar görnüşde maglumat toplumlary bar, emma gynansak-da türkmen diliniň maglumat toplumy, türkmen dilinde audio ýazgylar ýok. Şu maksat bilen, model düzülende türkmen dilinde maglumatlar toplumy döredildi. Modeliň esasynda, 1500 sany söz (ýagny sözlük) we 10 sany adamyň 2 sagatlyk türkmen dilindäki audio ýazgysy durýar. “Machine learning” ulgamynda model ilki türgenleşdirilenden soňra bu model ulanmak üçin taýýar ýagdaýa gelýär. Model türkmen diliniň maglumat toplumy (Dataset) arkaly türgenleşdirilýär.

Sesi tekste öwürmegiň yzygiderligi

Ses bu analog signal bolup durýar. Ses signaly matematiki taýdan sinusoidalaryň jemidir [6]. Kompýuter bolsa analog däl-de, sanly (digital) signallar bilen işleýär. Diýmek, sesi ilki bilen analog görnüşinden sanly görnüşe geçirmeli. Ýagny, haýsy sinusoidanyiň haýsy fonema (sese) degişlidigini anyklamaly. Onuň üçin bolsa sesi spektor analizden (spektrogrammadan) geçirmeli. Emma aşakdaky ýaly sinusoidaly (1-nji surat) sesi spektogrammadan geçirip bolmaýar. Sebäbi ol periodiki däldir (stasionar däl). Furýeniň özgertmeleri arkaly biz ony spektogrammadan geçirip bilmeýäris, sebäbi ses uly aralykda, ýagny bir sekunt aralykda periodik däldir [7]. 25 millisekuntlyk böleklere bölünenden soňra onuň grafiginde periodlary görüp bolýar.

Analizden soň, arassalan spektr alynýar we ondan sesiň alamatlaryny saýgarmak bolýar. Sesiň alamatlary anyklanylandan soňra şol alamatlar esasynda fonemalary anyklamaly. Fonema bu sesiň iň kiçi dil elementidir (ses). Harp sözüň iň kiçi elementi bolşy ýaly, fonema hem janly gepleşigiň iň kiçi elementi bolup durýar.

Bu programma esasan 30 sany fonema girizildi (aslynda bolsa, ondan hem köp bolup biler, sebäbi a:k (at), bilen ak (işlik) ikisinde-de tapawutly ses fonemasy bar) [8]. Ondan başga-da çekimli harplara basym düşende we düşmedik ýagdaýyndaky görnüşleri hem tapawutlanýar.

Programmany ulanmagyň yzygiderligi

Programma üpjünçiliginde gürlemek arkaly sesiňi tekste geçirmek hem-de ozal bar bolan ses ýazgylaryny tekste geçirip bilmek mümkinçiligi bar. Programmany işe goýberenimizde aşakdaky penjire açylýar.

“Gürle” düwmesini basyp gürlap başlamaly, şonda programma işläp başlaýar. Gürläp bolnandan soňra, programmanyň penjiresinde gürlenen sözler, tekst görnüşinde ýazylýar. Ses ýazgy edilýän wagty artykmaç dürli gohlar bar bolsa, ol programmanyň sözleri anyklap biliş derejesine täsir edýär. Has takyk netije almak üçin “Filtr” düwmesi sesiň gohlaryny aýryp berýär. “Diňle” düwmesini basmak arkaly soňky ýazgy edilen sesi eşidip bolýar.

 “Öwür” düwmesi ozal bar bolan ses ýazgylaryny tekste öwürmek üçin ulanylýar. Onuň üçin, ses ýazgy bar bolan faýlyň adyny girizmeli we “Öwür” düwmesine basmaly. Faýldaky ses ýazgysy tekste öwrüler. Bu programma üpjüçiligi diňe sözleri däl, eýsem birnäçe türkmen dilinde aýdylan sözlemleri hem tekste geçirip bilmek mümkinçiligini berýär.

 

  Ýuldaşbaý Kurambaýew,

Türkmenistanyň Oguzhan adyndaky

Inžener-tehnologiýalar uniwersitetiniň

Kompýuter ylymlary we maglumat tehnologiýalar

kafedrasynyň mugallymy.

“Ýaşlaryň ylmy we tehnikasy” žurnaly 2021ý. 2-nji sanynda çapa çykdy.



Information

  • tel: +99312 391617
  • e-mail: contact@etut.edu.tm