Մասնակից:AniGaranyan/Ավազարկղ1

Վիքիպեդիայից՝ ազատ հանրագիտարանից

Խոսքի թարգմանություն[խմբագրել | խմբագրել կոդը]

Խոսքի թարգմանությունն այն գործընթացն է, որով խոսակցական արտահայտությունները ակնթարթորեն թարգմանվում և բարձրաձայն արտասանվում են երկրորդ լեզվով: Սա տարբերվում է արտահայտությունների թարգմանությունից, որտեղ համակարգը թարգմանում է միայն համակարգում ձեռքով մուտքագրված արտահայտությունների ֆիքսված և սահմանափակ շարքը: Խոսքի թարգմանության տեխնոլոգիան տարբեր լեզուներով խոսողներին շփվելու հնարավորություն է տալիս: Այսպիսով, այն հսկայական արժեք է մարդկության համար գիտության, միջմշակութային փոխանակման և համաշխարհային բիզնեսի տեսանկյունից:

Ինչպես է դա աշխատում[խմբագրել | խմբագրել կոդը]

Խոսքի թարգմանության համակարգը սովորաբար ներառում է հետևյալ երեք ծրագրային տեխնոլոգիաները՝խոսքի ավտոմատ ճանաչում (ASR), մեքենայական թարգմանություն (MT) և ձայնի սինթեզ (TTS):

Ա լեզվով խոսողը խոսում է խոսափողով, իսկ խոսքի ճանաչման մոդուլը ճանաչում է խոսվածքը/ասույթը[AA1] : Այն համեմատում է ներմուծված խոսքը հնչյունաբանական մոդելի հետ, որը բաղկացած է մի քանի խոսողներից ստացված խոսքի տվյալների մեծ կորպուսից: Այնուհետև ներմուծված խոսքը վերածվում է բառերի շարանի՝օգտագործելով Ա լեզվի բառապաշարն ու քերականությունը՝հիմնվելով Ա լեզվի տեքստի հսկայական կորպուսի վրա:

Այնուհետև մեքենայական թարգմանության մոդուլը թարգմանում է այս շարանը: Վաղ համակարգերը յուրաքանչյուր բառը փոխարինում էին Բ լեզվի համապատասխան բառով: Ներկայիս համակարգերը չեն օգտագործում բառացի թարգմանություն, այլ ավելի շուտ հաշվի են առնում ներմուծված խոսքի ամբողջ համատեքստը՝համապատասխան թարգմանություն ստեղծելու համար: Ստեղծված թարգմանական արտահայտությունն ուղարկվում է խոսքի սինթեզի մոդուլ, որը գնահատում է բառերի շարանին համապատասխանող արտասանությունն ու հնչերանգը՝հիմնվելով Բ լեզվի խոսքի տվյալների կորպուսի վրա: Տեքստին համապատասխանող ալիքները ընտրվում են այս տվյալների շտեմարանից, և խոսքի սինթեզը դուրս է գալիս և միանում է նրանց:[1]

Պատմություն[խմբագրել | խմբագրել կոդը]

1983 թվականին NEC ընկերությունը ցուցադրեց խոսքի թարգմանությունը որպես հայեցակարգային նմուշ ITU Telecom World-ում (Telecom '83):[2]

1999թ.-ին C-Star-2 կոնսորցիումը ցուցադրեց 5 լեզուների խոսքից խոսք թարգմանություն, այդ թվում՝ անգլերեն, ճապոներեն, իտալերեն, կորեերեն և գերմաներեն:[3][4]

Հատկություններ[խմբագրել | խմբագրել կոդը]

Բացի տեքստի թարգմանության հետ կապված խնդիրներից, այն նաև պետք է լուծի հատուկ խնդիրներ, որոնք առաջանում են խոսքից-խոսք թարգմանության մեջ՝ ներառելով խոսակցական լեզվի անկապակցությունը, խոսակցական լեզվի քերականական սահմանափակումները, խոսակցական լեզվի անհասկանալի բառային սահմանը, խոսքի ճանաչման սխալների ուղղումը և բազմաթիվ ընտրովի ներմուծված խոսքի տարբերակներ: Բացի այդ, խոսքից-խոսք թարգմանությունն ունի նաև իր առավելությունները՝ համեմատած տեքստի թարգմանության հետ, ներառյալ խոսակցական լեզվի պակաս բարդ կառուցվածքը և խոսակցական լեզվի ավելի քիչ բառապաշարը:[փա՞ստ]

Հետազոտություն և զարգացում[խմբագրել | խմբագրել կոդը]

Հետազոտությունն ու զարգացումը անցում են կատարել համեմատաբար պարզից ավելի առաջանցիկ թարգմանության: Հիմնադրվել են միջազգային գնահատման աշխատաժողովներ՝ խոսքի թարգմանության տեխնոլոգիայի զարգացմանն աջակցելու համար: Նրանք գիտահետազոտական ինստիտուտներին թույլ են տալիս միաժամանակ համագործակցել և մրցել միմյանց դեմ: Այդ աշխատաժողովի հայեցակարգը մրցութային է. Կազմակերպիչների կողմից տրամադրվում է ընդհանուր տվյալների շտեմարան, իսկ մասնակից գիտահետազոտական ինստիտուտները ստեղծում են համակարգեր, որոնք գնահատվում են: Այս կերպ խթանվում է արդյունավետ հետազոտությունը։

Խոսքի թարգմանության հետազոտությունների միջազգային կոնսորցիում C-STAR-ի կողմից կազմակերպված Խոսակցական լեզվի թարգմանության միջազգային աշխատաժողովը(IWSLT) անցկացվում է 2004 թվականից ի վեր: «Ամեն տարի ավելանում է մասնակից ինստիտուտների թիվը, և այն դարձել է առանցքային իրադարձություն խոսքի թարգմանության հետազոտության համար»:[1]

Չափորոշիչներ[խմբագրել | խմբագրել կոդը]

Երբ շատ երկրներ սկսեն ուսումնասիրել և զարգացնել խոսքի թարգմանությունը, անհրաժեշտ կլինի ստանդարտացնել միջերեսները և տվյալների ձևաչափերը՝ ապահովելու համակարգերի փոխհամատեղելիությունը: Միջազգային համատեղ հետազոտությունները խրախուսվում են խոսքի թարգմանության կոնսորցիումների կողմից (օրինակ՝ C-STAR միջազգային կոնսորցիումը խոսքի թարգմանության համատեղ հետազոտությունների համար և A-STAR-ը Ասիա-խաղաղօվկիանոսյան տարածաշրջանի համար): Նրանք հիմնադրվել են որպես «միջազգային համատեղ հետազոտական կազմակերպություններ՝ երկլեզու կորպուսների ձևաչափեր մշակելու համար, որոնք կարևոր են այս տեխնոլոգիայի հետազոտությունն ու զարգացումն առաջ մղելու... և միջերեսներն ու տվյալների ձևաչափերը ստանդարտացնելու համար՝ միջազգայնորեն խոսքի թարգմանության մոդուլը միացնելու նպատակով»:[1]

Կիրառություններ[խմբագրել | խմբագրել կոդը]

Այսօր խոսքի թարգմանության համակարգերը կիրառվում են ամբողջ աշխարհում: Օրինակները ներառում են բժշկական հաստատություններ, դպրոցներ, ոստիկանություն, հյուրանոցներ, մանրածախ խանութներ և գործարաններ: Այս համակարգերը կիրառելի են ցանկացած վայրում, որտեղ խոսակցական լեզուն օգտագործվում է հաղորդակցվելու համար: Հայտնի հավելվածը Jibbigo-ն է, որն աշխատում է անցանց:

Մարտահրավերներ և ապագա հեռանկարներ[խմբագրել | խմբագրել կոդը]

Ներկայումս խոսքի թարգմանության տեխնոլոգիան հասանելի է որպես արտադրանք, որն ակնթարթորեն անվճար թարգմանում է բազմալեզու խոսակցություններ: Այս համակարգերը ակնթարթորեն թարգմանում են շարունակական խոսքը: Դրան հասնելու դժվարությունները ներառում են խոսողից կախված խոսելաոճի կամ արտասանության փոփոխությունների հաղթահարումը: Սրանք այն խնդիրներն են, որոնք պետք է լուծվեն՝ բոլոր օգտատերերի համար բարձր որակ թարգմանություն ապահովելու նպատակով: Ավելին, խոսքի ճանաչման համակարգերը պետք է կարողանան շտկել արտաքին գործոնները, ինչպիսիք են ակուստիկ աղմուկը կամ այլ խոսողների խոսքը խոսքի թարգմանության համակարգերի իրական օգտագործման ժամանակ:

Այն պատճառով, որ օգտատերը չի հասկանում թիրախ լեզուն, երբ օգտագործվում է խոսքի թարգմանություն, «օգտատիրոջը պետք է տրամադրվի մեթոդ՝ ստուգելու, թե արդյոք թարգմանությունը ճիշտ է, այնպիսի միջոցներով, ինչպիսիք են այն նորից թարգմանելը օգտատիրոջ լեզու»:[ 1] Ամբողջ աշխարհում լեզվական արգելքը վերացնելու նպատակին հասնելու համար համակարգը պետք է ներառի բազմաթիվ լեզուներ: Սա պահանջում է խոսքի կորպուսներ, երկլեզու կորպուսներ և տեքստային կորպուսներ մոտ 6000 լեզուներից յուրաքանչյուրի համար, որն այսօր գոյություն ունի մեր մոլորակի վրա:

Քանի որ կորպուսների հավաքագրումը չափազանց թանկ է, համացանցից տվյալների հավաքումը կլինի սովորական մեթոդների այլընտրանք: «Բազմաթիվ լեզուներով հրապարակված նորությունների կամ այլ լրատվամիջոցների երկրորդական օգտագործումը արդյունավետ միջոց կլինի խոսքի թարգմանության կատարողականը բարելավելու համար»: Այնուամենայնիվ, «հեղինակային իրավունքի մասին գործող օրենքը հաշվի չի առնում երկրորդական կիրառությունները, ինչպիսիք են կորպուսների այս տեսակները», և այդպիսով, «անհրաժեշտ կլինի վերանայել այն` դարձնելով ավելի ճկուն»:[1]

See also[խմբագրել | խմբագրել կոդը]

References[խմբագրել | խմբագրել կոդը]

  1. 1,0 1,1 1,2 1,3 "Overcoming the Language Barrier with Speech Translation Technology" by Satoshi, Nakamura in Science & Technology Trends - Quarterly Review No.31 April 2009
  2. NEC/021219-1. «NEC Global - Press Release». www.nec.co.jp (անգլերեն). Վերցված է 2017-09-23-ին.{{cite web}}: CS1 սպաս․ թվային անուններ: authors list (link)
  3. «C-Star». NPR.
  4. "A Japanese-to-English Speech Translation System: ATR-MATRIX" by Takezawa, Morimoto, Sagisaka, Campbell, Iida, Sugaya, Yokoo, Yamamoto in Proceedings of the International Conference on Spoken Language Processing 1998