Анусаарака - Anusaaraka

Анусаарака
Anusaaraka машиналық аударма output.jpg
ЖазылғанCLIPS, Python, Perl, C, C ++
Операциялық жүйеPOSIX үйлесімді
Қол жетімдіАғылшын-хинди
ТүріМашиналық аударма
ЛицензияGNU жалпыға ортақ лицензиясы
Веб-сайтhttps://ltrc.iiit.ac.in/Anusaaraka/anu_home.html

Анусаарака болып табылады Ағылшыннан хинди тіліне алынған алгоритмдерді қолданатын тілге қол жеткізу (аударма) бағдарламалық жасақтамасы Панини Аштадхяи (грамматикалық ережелер).[1][2] Бағдарламалық жасақтаманы Чинмая халықаралық қоры (CIF)[3] кезінде Халықаралық ақпараттық технологиялар институты, Хайдарабад (IIIT-H) және Хайдарабад университеті (санскриттану бөлімі).[4] Анусаарака дәстүрлі дамыған үндістанның бірігуі ретінде қарастырылады шастралар және озық заманауи технологиялар.

Анусаарака қолданушыларға кез-келген мәтінге қол жеткізуге мүмкіндік беруге арналған Үнді тілі түпнұсқа тілден аударылғаннан кейін (яғни ағылшын немесе кез келген басқа аймақтық үнді тілі).[5] Ақпараттық дәуірде ағылшын тілінде үлкен көлемдегі ақпарат бар - ол конкурстық емтиханға немесе жалпы оқуға арналған ақпарат болсын. Алайда, негізгі тілі хинди немесе кез-келген басқа үнді тілі болып табылатын көптеген адамдар ағылшын тілінде ақпарат ала алмайды. Anusaaraka пайдаланушыға Anusaaraka-ға ағылшынша мәтін енгізіп, оны өз қалауы бойынша үнді тілінде оқуға мүмкіндік беру арқылы осы тілдік тосқауылды жоюға бағытталған.

Анусаарака өз атауын санскрит тіліндегі «анусаран» сөзінен алып, «ұстану» дегенді білдіреді. Анусараканың аударылған шығысы қабаттарда пайда болатындықтан, осылай аталады, яғни пайдаланушыға соңғы аударма көрсетілгенге дейін бір-бірінен кейін жүретін қадамдар тізбегі.

Ерекшеліктер

Мәтінді бастапқы тілде адал ұсыну

Anusaaraka шығарылымының әр түрлі қабаттарында пайдаланушының ағылшынша сөйлемдегі ақпаратты түсіну мүмкіндігін қамтамасыз етуге күш салынады. Бұл күш-жігерге хинди тіліндегі мінсіз сөйлемдер беруден гөрі үлкен мән беріледі, өйткені жақсы оқылатын, бірақ бастапқы мәтіннің ақпаратын шынымен ала алмайтын аударма болу мағынасыз болар еді.

Қабатты өнім тек Анусааракаға ғана тән. Осылайша, пайдаланушының мәтіні туралы бастапқы ақпарат пен хинди тіліне аударма қалай жүзеге асырылатындығы туралы ақпарат алуға болады. Қатпарлы шығарылымның маңызды ерекшелігі - ақпарат беру кез-келген қадамда басқарылатын тәсілмен жүзеге асырылады, бұл ақпаратты жоғалтпай қайтаруға мүмкіндік береді. Сондай-ақ, аударма барысында алдын-алуға болмайтын ақпараттың кез-келген зияны біртіндеп жасалады. Демек, аударылған сөйлем адам аудармасы сияқты «мінсіз» болмаса да, Анусаарака шығармасын оқуға біраз күш салған және бағдарланған, жеке адам сол сөйлемнің қабаттары мен контекстіне қарап мәтіннің нені білдіретінін түсіне алады.

Қайтымдылық

Ақпаратты бір қабаттан екіншісіне біртіндеп тасымалдау ерекшелігі Анусааракаға аударма процесінде қайтымдылықты әкелудің қосымша артықшылығы - әдеттегі машиналық аударма жүйесі қол жеткізе алмайтын мүмкіндік береді. Anusaaraka қос тілді қолданушысы кез-келген уақытта шығыс мөлдір болғандықтан ағылшын тіліндегі бастапқы мәтінге қол жеткізе алады. Ол үшін Anusaaraka шығармасын қалай оқуға болатындығы туралы біраз ақпарат қажет болады.

Мөлдірлік

Қадамдық аударма қабаттарын көрсету пайдаланушыға сенімділіктің жоғарылауын арттырады, өйткені ол дереккөзді іздеп, шығыс қабаттарын талдау және мәтінмәнге сілтеме жасау арқылы аударылған мәтінге қатысты анықтық ала алады.

Үлгі шығару

Anusaaraka жүйесінің үлгі шығарылымы.

Шығармадағы түстер сөз категориясын білдіреді:

зат есім
етістік-сөз тіркесі
сын есім-сөз тіркесі
адвербиалды-фраза
предлог
жалғаулықтар
кесінділер

Сондай-ақ қараңыз

Сыртқы сілтемелер

Әдебиеттер тізімі

  1. ^ http://ltrc.iiit.ac.in/~anusaaraka/PUBLICATIONS/rsvp_symposium.html Мұрағатталды 2011-07-21 сағ Wayback Machine RSVP симпозиумы
  2. ^ http://ltrc.iiit.ac.in/downloads/nlpbook/nlp-panini.pdf Панини
  3. ^ «Мұрағатталған көшірме». Архивтелген түпнұсқа 2011-07-17. Алынған 2010-05-21.CS1 maint: тақырып ретінде мұрағатталған көшірме (сілтеме) www.chinfo.org/Anusaaraka.html
  4. ^ «Мұрағатталған көшірме». Архивтелген түпнұсқа 2011-07-17. Алынған 2010-05-21.CS1 maint: тақырып ретінде мұрағатталған көшірме (сілтеме)
  5. ^ «Мұрағатталған көшірме». Архивтелген түпнұсқа 2009-07-17. Алынған 2011-01-31.CS1 maint: тақырып ретінде мұрағатталған көшірме (сілтеме)