Кайтра - Caitra

Кайтра Бұл аударма Компьютерлік көмекші құрал немесе CAT, әзірлеген Эдинбург университеті. Онлайн платформадан ұсынылған Caitra негізделген AJAX Web.2 технологиялары және Муса декодері. Құралдың веб-парағы орындалады Rails on Rails, ашық көзі бар веб-фреймворк және C ++.

Caitra адам аудармашыларына ұсыныстар мен балама аудармаларды ұсына отырып көмектеседі.

Тарих

Машиналық аударма (MT) жүйелерін әдетте толық аударманы қажет етпейтін және шет тіліне тез қол жеткізуді қалайтын оқырмандар пайдаланады. Кәсіби аудармашылар өз жұмысын жеңілдету және клиенттеріне жоғары сапалы аударма беру үшін, әдетте, машинадан аударудың жетілдірілген құралдарын қажет етеді. Trans-Type жобасы (Langlais және басқалар, 2000) адам аудармашыларына көмек ретінде MT-ге пионер көзқарасын ұсынды. . Бұл аударма құралы аудармашыға ұсынылған аударманы қабылдауға немесе оны өзінің аудармасымен қайта жазуға мүмкіндік беріп, сегмент үшін әр түрлі аудармаларды ұсынады, бұл өз кезегінде құралға жаңа әлеуетті аудармаларды іске қосады. Бұл кәсіби аудармашылар үшін міндетті емес. Шығарылымнан кейінгі құрал-жабдықтар MT және адам аудармаларын біріктіру және қажетті нәтижелерге қол жеткізу үшін типтік MT және адам аудармашылары арасындағы аралық өріс ретінде дамыды. Информатика мектебі және Эдинбург Университетінің «Машиналар аудармасы» тобы әр түрлі типтегі МТ-ның артықшылықтарын талдау және жаңа технологияны дамыту үшін машина мен пайдаланушының өзара әрекеттесуін зерттеу үшін CAITRA зерттеу бағдарламасын құрды. CAT құралдары.

Қасиеттері

Caitra бағдарламалық жасақтамасы Ruby on Rails (Thomasand Hansson, 2008) көзі ашық веб-шеңберімен бағдарламаланған. Онлайн-платформа қолданады Ajax стиліндегі Web 2.0 технологиялары (Raymond, 2007) а MySQL дерекқорға негізделген ақырғы. Машиналық аударманың түпнұсқасы статистикалық сөйлемге негізделген MT, Мұса (Koehn және басқалар, 2007). C ++ аударма ұсыныстарының жылдамдығын жақсарту үшін біріктірілген.Құралды Информатика Мектебі қолданушының құралмен өзара әрекеттесуін, сонымен қатар мүшелер үшін бағдарламаға қосымша мүмкіндіктер мен түзетулер ұсына алатындығын зерттеу ретінде онлайн режимінде ұсынады. .

Пайдаланушы берілген мәтін ұясына мәтін енгізеді. Caitra мәтінді өңдейді, өйткені пайдаланушы «Жүктеу» белгішесін басады. Процесс бірнеше минутқа созылуы мүмкін, ал Кайтра аударманың әртүрлі нұсқаларын табады, олардың бірі әдепкі бойынша қабылданады. Процесс аяқталғаннан кейін аудармашыларда интерфейсте ұсынылатын бірнеше көмек нұсқалары болады. Аудармаға арналған сегмент - сөйлем, сондықтан Кейтра бір уақытта тек бір сөйлеммен жұмыс істейді.

Интерактивті машиналық аударма

Trans-Type жобасы (Langlais et al., 2000) тергеу жүргізді Интерактивті машиналық аударма а көмектесетін сөйлем-сегменттік аудармадан тұрады CAT құралы, бұл аударманың бірнеше түрлі нұсқаларын ұсынады. Аудармашылар ұсынылған аудармаларды ұнатпаса, олардың біреуін таңдай алады немесе өз аудармаларын ұсына алады. Бұл процесс ұқсас автоматты аяқтау бірнеше кеңсе бағдарламаларында қолданылатын құрал.

The статистикалық аударма жүйесі аудармаға болжам жасау үшін орындалады. Бұл болжамдар қысқа сөз тіркестерімен берілген статистикалық фразаларға негізделген аударма моделі. Бұл модель пайдаланушыға болжамдарды оқуды жеңілдетеді. Ұсыныстар мен пайдаланушының әрекеттері үлкен мәліметтер базасында сақталады. Пайдаланушылармен өзара әрекеттесу кезінде Caitra жолдарды өңдеу қашықтығын өлшеу арқылы пайдаланушының енгізілуін графикке сәйкес келеді. Болжам - бұл пайдаланушының енгізуіне сәйкес келетін (a) жолдарды өңдеудің ең аз қашықтығымен және (b) сөйлемдерді аудару ықтималдығының ең жоғары деңгейіне сәйкес келетін оңтайлы жол. Бұл есептеу серверде орын алады және C ++ тілінде жүзеге асырылады, деп түсіндіреді Филипп Кён.[1]Пайдаланушы ұсынысты қабылдағаннан кейін жаңасы, сонымен қатар жаңа сегменттің терілуі көрсетіледі, ұсыныстардың қабылдануы тілдердің жұбына және мәтіннің күрделілігіне байланысты. CAITRA туралы алдын-ала зерттеулер пайдаланушылар әдетте жүйе жасаған болжамдардың 50-80% -ын қабылдайды деп болжайды.

Аударма процесі

Мәтін жүктелгеннен кейін, пайдаланушылар машиналық аударманың нәтижесін көре алады және болжамға негізделген мәтінді өңдей алады. Болжау кестесі өңдеу белгішесін басу арқылы көрсетіледі. Мәтін сөйлемдерге бөлінеді, олар да кішігірім бірліктерге бөлінеді. Бұл бірліктерге арналған болжамдар өрісте пайда болады, ал кестенің ең жоғарғы бөлігінде ұсыныстың түсі басқаша болады. Болжамдар оларды басу арқылы қабылданады және жүйе сайлауды пайдаланушының кірісіне дейін жаңартады. Мәліметтер қоры бірнеше аударылған мәтіндер мен аудармалардан тұрады. Болжам - бұл базадағы алдыңғы матчтардың нәтижесі. Деректер базасында пайдаланушының таңдауы болашақ аудармада қолдану үшін есептеледі. Бұл болжамдар кәсіби аудармашыларға ғана емес, сөздік қорын білмейтін және шет тілін білмейтін адамдарға жаңадан келген аудармашыларға да көмектеседі.

Өңдеуден кейінгі машиналық аударма процесі

Пайдаланушылар жасай алады шолу оларды аудару және мүмкін болатын қателерді түзету үшін кез-келген өзгеріс енгізу. Өзгерістер дисплейде пайда болады.

Пайдаланушының белсенділігі

Caitra пайдаланушылар болжамды қабылдайтын немесе өз аудармасын жазатын бөлінген уақытты сақтайды, іс-әрекеттер болашақ болжау үшін пайдаланушының іс-әрекетіне және аударманы орындау уақытына байланысты әр түрлі мәнге ие. Әрбір әрекет, кідіріс немесе қозғалыс болашақ аудармаларды жақсарту үшін маңызды.

Әдебиеттер тізімі

  1. ^ Кён, Филлип. «Вебке негізделген интерактивті компьютерлік аударма құралы» (PDF). Информатика мектебі, Эдинбург университеті.
  • Филипп Кён, Хиу Хоанг, Александра Берч, Крис Каллисон-Берч, Марчелло Федерико, Никола Бертолди, Брук Коуан, Уэйд Шен, Кристин Моран, Ричард Зенс, Крис Дайер, Ондрей Божар, Александра Константин, Эван Хербст. (2007) «Мұса: Статистикалық машиналық аудармаға арналған ашық қайнар көз құралы». Есептеу лингвистикасы қауымдастығының (ACL) жыл сайынғы отырысы, демонстрациялық сессия, Прага, Чехия, 2007 ж.
  • Оливия Крачиунеску, «Машиналық аударма және компьютерлік аударма: аударманың жаңа тәсілі ме?»

Сыртқы сілтемелер

Сондай-ақ қараңыз