2019. 01. 18. - 15:15

Fordító intelligencia – nyelvek átjárhatósága az MI segítségével

Fordító intelligencia – nyelvek átjárhatósága az MI segítségével
A mesterséges intelligencia mind a tudományos-művészi, mind a hétköznapi élet formálásában egyre jelentősebb kulcsszerepet kap. A fordítás tekintetében szinte valamennyi embernek szüksége lehet rá – széles alkalmazási lefedettsége folytán egyáltalán nem lényegtelen kérdés a fordítás milyensége. Jelen cikkünkben az MI és fordítás témakörét jártuk körül, megvizsgálva a fejlesztendő területeket, és a jövőbeni kitekintés sem maradhatott ki ezúttal sem.
 
 
I. Egészen a közelmúltig
Google és Facebook

A Digitalistmag.com „Artificial Intelligence Is Changing The Translation Industry. But Will It Work?” című cikkében a szerző arra keresi a választ, mennyire megbízható a technológia, ha fordításról van szó.
Minden bizonnyal mindenki találkozott már olyan fordítórendszerekkel, mint a Google Translator, de a Facebook is kínál ilyen lehetőséget.  A Microsoft a közelmúltban kifejlesztette saját fordítóalkalmazását, amely nem csak a szöveget, hanem a beszédet, a képeket és az utcatáblákat is képes lefordítani. A Microsoft nagy áttörése ezzel az alkalmazással az a tény, miszerint a Translator offline módban futtatható, ami ideális valós előnyökkel rendelkezik azok számára, akik korlátozott csatlakoztathatóságú területeken utaznak.

A Facebook fordítási rendszere tavaly nyáron jelentős fejlesztéseken ment keresztül, és az MI-t vezette be elsődleges módszerként. Miközben a rendszer kezdetben kifejezéseket fordított, az MI figyelembe veszi a teljes mondat kontextusát, így sokkal pontosabb eredményeket hoz.

Kihívások

Egy Google kutató megjegyezte, hogy „az emberek naivan azt hiszik, hogy a mélytanulásos rendszer, a neurális háló 1000-szer több adattal képes dolgozni, és sokkal többre képes, mint az ember valaha is, ez azonban így nem igaz”.

Növekvő népszerűsége ellenére az MI fordítás még mindig nem hasonlítható össze a tapasztalt emberi fordítók teljesítményével. – írja a Digitalismag.com.

Egy Dél-Koreában rendezett verseny során a gépi fordítóeszközök szakemberekkel mérték össze tudásukat. A két „csapat” két szöveget fordított koreai nyelvről angolra és fordítva. Az eredmények azt mutatták, hogy „90% -a az NMT (neurális gép fordítása] által fordított szöveg nyelvtanilag helytelennek bizonyult, vagy éppen  biztosan nem afféle fordításnak, amelyeket bármely művelt anyanyelvű beszél.”

 Mi is a neurális gépi fordítás (NMT) röviden?

A gépi fordítás az MI azon ága, amely a szoftver használatával kapcsolatos szöveget egy nyelvről a másikra fordítja. A neurális gépi fordítás (NMT) egy viszonylag új módszer, amely a neuronhálózatokat használja a gépi fordítás elvégzésére. A neurális hálózat olyan rendszer, amely képes az adatminták felismerésére, ezáltal néhány bemeneti adatot (pl. Egy francia mondatot) egy kívánt kimenetre (például az angolra) – áll a Skynet Today cikkében.

A nehézségeket  kiemeli a Skynet Today is „Az MI jobban fordít, mint az ember? Közel nem biztos!” című cikke, ahol szóba kerül az a jelenség is, ami szerint a neurális hálózatok fordítási rendszerei még mindig számos jelentős kérdéssel rendelkeznek, amelyek által még lemaradást mutatnak az emberi fordítóktól.

A jelenleg fejlesztendő jellemzők a megbízhatóság („érthetőség”), memória („időbeliség, összekapcsolás”) és józan ész („világ ismerete”).
A cikk kiemeli, hogy a kontextusérzékenység a legfontosabb szempont az emberi fordítókat megközelítő minőségű teljesítmény nyújtására.

A jó fordítás ismérvei

Jelenleg a leggyakoribb módja a BLEU pontszám használata a jó fordítás mérésére . A BLEU pontszám kiszámításához az NMT rendszer által készített fordításokat vesszük alapul, és összehasonlítjuk az ugyanazon mondatok emberi írásbeli fordításával. Ha a gépírású fordítások sok szót és kifejezést tartalmaznak a humán írásbeli fordításokkal együtt, akkor a rendszer magasabb BLEU-pontszámot kap.

A BLEU pontszám hasznos fordítási minőség, különösen az alacsonyabb teljesítményű rendszerek esetében. A kutatók azonban megállapították, hogy a BLEU pontszám gyakran nem ért egyet az emberi bírákkal a fordítási minőség tekintetében. Ez azt jelenti, hogy míg a BLEU-metrika segíthet abban, hogy megkülönböztessük a leginkább a rosszul teljesítő rendszerek között, ez általában nem elegendő a jobb teljesítményű rendszerek értékeléséhez.

Összegezve a fő különbséget emberi és gépi fordítás között az automatikusság és következetesség szempontja képezi. (lásd: kontextusérzékenység kérdése)

 
II. Átmeneti időszak
Nyomonkövethető fejlődés

Az NMT gyors ütemben fejlődik, és minden hónapban új fejleményeket jelentenek. Az új kutatások a azokkal a feladatokkal foglalkoznak, amelyek a megbízhatóság, az adattorzítás, az értelmetlen kimenet, a memória, a józan ész és az értékelési mutatók problemtaikáját megoldják majd.

A jó hír az, hogy az elmúlt évben az NMT is jelentős javulást mutatott a hatékonyság terén. Ez olyan új rendszerek bevezetésével jött létre, amelyeknek már nem kell az adatokat egymás után feldolgozni (pl. Balról jobbra vagy jobbra balra.) Ezek a rendszerek egyszerre kezelik a bemeneti mondatokat, így könnyedén lehet párhuzamosítani az adatképzést. Így ugyanabban az idő alatt több adatot tudunk mozgásban tartani és végül hatékonyabb fordításokat készíthetünk.

Az egyre fejlettebb neurális hálózati technikáknak és nagy mennyiségű adatnak köszönhetően az NMT rendszerek fordításai manapság már gyakran gördülékenyen és emberin működnek. A látszólag A hosszabb szövegek fordítása még mindig kihívásnak számít.

A téma sem mindegy: más szövegkomponenseket követel a diplomácia, és mást az elegáns, művészi szöveg.


Egy páratlan szoftver bemutatása

A komolyabb céllal történő fordítás vágya nem elegendő, ha nincs hozzá megfelelő szoftver. Az alábbiakban egy olyan szoftvert mutatunk be, amelynél a múltból tanulás és innovatív szemlélet párban jár.

A Tywi az első olyan szoftver, amely teljes sebességgel lehetővé teszi a többnyelvű kommunikációt. A hang a másik nyelvre vált, és akár 78 nyelven is feliratkozhat. A másik személy hangja is le van fordítva, mint hang és szöveg.

A Tywi, azaz Translate Your World International szoftver funkciói a következők:


xEgyidejű beszédfordítás, többnyelvű ügyfélszolgálat és támogatás biztosítása
xOktatás, alkalmazottképzés – a világ minden tájáról
xEgyidejű (emberi) tolmácsok a helyszínen és on-line
xMás nyelvű alkalmazottakkal és külföldi kollégákkal kommunikáció
xEgy beszélt akcentus egy másikra cserélése (pl. Indiai akcentus az Egyesült Királyság akcentussal)
xKözvetlen beszéd vendégekkel
xSiketekkel és a siket-vakokkal történő kommunikáció


III. A világos jövő – az emberi fordítók az elkövetkező évtizedekben

A Microsoft a közelmúltban kijelentette, hogy gépi fordítási kutatócsoportja elérte az „emberi fordítási minőséget”. Ez pedig felveti a sokszor felvetett kérdést: lehetséges-e, hogy a gépek a fordítás területén is átveszik a vezető szerepet?

A Microsoft cikkéből azonban az is kiderül, hogy állításuk csak a kínai és angol nyelvű hírek fordítására terjed ki. A kutatók még azt sem tudják, hogy minden nyelvi pár esetében lehetséges-e az emberi minőségű fordítás. Más szakértők megkérdőjelezik a gépi fordítási minőségét. Az igazsághoz valóban hozzátartozik, hogy az alacsony minőségű emberi fordítások referenciaként szolgálnak az értékeléshez. Jelenleg az NMT úgy tűnik, hogy a legjobb eredményeket mesterséges körülmények között érinti, amikor a környezetet ellenőrzik.

Létezhet-e egyáltalán reálisabb nézet az MI  és az NMT számára a nyelvi iparágban? A kutatók jóslata szerint a fordítók képesek lesznek a gépi fordítást a mindennapi életükben olyan munkaeszközként használni, amely ismétlődő feladatokat lát el. Ez azt jelenti, hogy a gépek rutinfeladatokat hajtanak végre.
Manapság a fordítók már mesterséges intelligenciával dolgoznak. Az utószerkesztés a legtöbb fordító napi életének része, de gyakran nem képesek befolyásolni a folyamatot és annak eredményeit.

A kutatók azt jósolják, hogy a technológia és az NMT kulcsszerepet játszik a fordítók és a nyelvészek jövőjében. Az olyan technológiák mellett, mint a fordítási memória és a terminológia menedzsment, a fordítók előnyt élveznek az adaptív idegrendszeri fordítás és az automatizált tartalom-gazdagítás területén.
Az automatizált tartalom-gazdagítás segít a fordítónak, ha kétértelmű szavakat ad meg, és segít a fordítóknak, hogy számos kultúrára lokalizálják a tartalmat. Erősen kapcsolódik a terminológiai menedzsmenthez, mivel egy terminológiai adatbázisban keres.
A jövőben a fordítók azonnali hozzáférést kapnak minden olyan fontos információhoz, amely a fordítás során szükséges, azaz nem kell keresniük egy olyan szó korábbi fordítását, amely nem szerepel a terminológiában. A szavakat különböző szótárakkal és számtalan internetes kereséssel lehet megkülönböztetni. A fordítók végül képesek lesznek befolyásolni a neurális gépi fordítási rendszerek javaslatait.

Gép és ember kölcsönhatása, együttműködése, sőt, megbarátkozása tehát ezen a területen is a legeredményesebb hozzáállás.


 - Vasas Marianna - 
 

Hírlevél feliratkozás

Kérjük, add meg adataidat a hírlevélre történő feliratkozáshoz! A megadott adatokat bizalmasan kezeljük, azokat harmadik félnek át nem adjuk.
hungarospa_logo_kicsi
gyulai_vafurdo

profight_banner.