Statisztikai gépi fordítás felé párhuzamos korpuszok nélkül

Johns Hopkins Egyetem

felé

Johns Hopkins Egyetem

Johns Hopkins Egyetem

Johns Hopkins Egyetem

Johns Hopkins Egyetem

Johns Hopkins Egyetem

Johns Hopkins Egyetem

Johns Hopkins Egyetem

Új hivatkozási figyelmeztetés hozzáadva!

Ezt a riasztást sikeresen hozzáadtuk, és elküldjük a következő címre:

Értesítést kapunk, ha az Ön által kiválasztott rekordot idézik.

A riasztási beállítások kezeléséhez kattintson az alábbi gombra.

Új idézőjelzés!

Mentés a Binder-be
EACL '12: A Számítástechnikai Nyelvészeti Szövetség európai fejezetének 13. konferenciájának anyagai

ABSZTRAKT

A kifejezésalapú statisztikai gépi fordítási rendszer paramétereit abból becsüljük egynyelvű korpuszok helyett a kétnyelvű párhuzamos korpusz. A kétnyelvű lexikon indukcióval kapcsolatos jelenlegi kutatásokat kibővítjük a becsléshez mindkét lexikális és frázisos fordítási valószínűségek MT-skálájú mondattáblákhoz Javasoljuk egy új algoritmust az egynyelvű adatok alapján történő átrendeződési valószínűségek becslésére. Egy végpontok közötti fordítási rendszer fordítási eredményeiről számolunk be, egyedül ezeket az egynyelvű szolgáltatásokat felhasználva. Módszerünk csak egynyelvű korpuszokat igényel a forrás- és a célnyelven, egy kis kétnyelvű szótárt és egy kis bitext-et a funkciósúlyok hangolásához. Ebben a cikkben egy idealizálást vizsgálunk, ahol kifejezés-táblázatot adunk meg. Megvizsgáljuk a fordítási teljesítmény romlását, amikor a kétnyelvűen becsült fordítási valószínűségeket eltávolítjuk, és megmutatjuk, hogy a veszteség 80% -a + csak egynyelvűen becsült jellemzőkkel állítható helyre. Továbbá megmutatjuk, hogy egynyelvű szolgáltatásaink 1,5 BLEU pontot adnak, ha a kétnyelvűen becsült szokásos mondattáblázat jellemzőivel kombináljuk.