CMU айтылатын сөздік - CMU Pronouncing Dictionary

CMU айтылатын сөздік
ӘзірлеушілерКарнеги Меллон университеті
Тұрақты шығарылым
0.7b / 19 қараша, 2014 ж; 6 жыл бұрын (2014-11-19)
Қол жетімдіАғылшын
ЛицензияBSD
Веб-сайтwww.сөйлеу.cs.cmu.edu/ cgi-bin/ кінәлі

The CMU айтылатын сөздік (сонымен бірге CMUictict) болып табылады ашық көзі айтылу сөздік бастапқыда сөйлеу тобы at Карнеги Меллон университеті Пайдалану үшін (CMU) сөйлеуді тану зерттеу.

CMUdict картаға солтүстік американдық айтылымдардағы ағылшын сөздерінің орфографиялық / фонетикалық картасын ұсынады. Әдетте бұл үшін ұсыныстар жасау үшін қолданылады сөйлеуді тану (ASR), мысалы. The Сфинкс CMU жүйесі, және сөйлеу синтезі (TTS), мысалы. The Фестиваль жүйе. CMUdict графикалық фонемаға (g2p) статистикалық модельдер құруға арналған оқу корпусы ретінде қолданыла алады[1] сөздікке енбеген сөздер үшін айтылым тудырады.

Соңғы шығарылымы - 0,7b; онда 134 000-нан астам жазба бар. Интерактивті іздеу нұсқасы қол жетімді.[2]

Мәліметтер базасының форматы

Мәліметтер базасы қарапайым мәтіндік файл түрінде жолға бір жазба түрінде форматта таратылады »WORD <айтылым>«бөліктер арасында екі кеңістікті бөлгіш бар. Егер сөз үшін бірнеше айтылым болса, нұсқалар нөмірленген нұсқалар көмегімен анықталады (мысалы.) СӨЗ (1)). Айтылымның өзгертілген түрін пайдаланып кодталады ARPABET 0, 1 және 2 деңгейіндегі дауыстыларға кернеулерді қосқандағы жүйе ;;; таңбалауыш түсініктемені білдіреді. Тарату бөлігі ретінде сөйлеуді тану қозғалтқыштары үшін тікелей қолайлы алынған формат та қол жетімді; бұл формат стресс айырмашылықтарын жояды (әдетте ASR-де қолданылмайды).

Тарих

НұсқаШығару күні[3]Лицензия
0.116 қыркүйек 1993 жҚоғамдық домен
0.210 наурыз 1994 жҚоғамдық домен
0.328 қыркүйек 1994 жҚоғамдық домен
0.48 қараша 1995 жҚоғамдық домен
0.5Қоғамдық шығарылым жоқҚоғамдық домен
0.611 тамыз 1998Қоғамдық домен
0.7Қоғамдық шығарылым жоқҚоғамдық домен
0,7а18 ақпан 2008 ж2-тармақ BSD
0.7b19 қараша 2014 ж[4]2-тармақ BSD

Қолданбалар

  • The Unifon түрлендіргіш CMU-дың айтылым сөздігіне негізделген.
  • The Табиғи тілдер құралы CMU Pronunciationing сөздігінің интерфейсін қамтиды.
  • Карнеги Меллон Логиялар[5] құрал CMU-дың айтылым сөздігін қамтиды.
  • PronunDict, американдық ағылшын тілінің айтылу сөздігі, деректер көзі ретінде CMU Pronouncing Dictionary қолданады. Дауыс айту транскрипцияға алынады IPA шартты белгілер. Бұл сөздік те қолдайды айтылым бойынша іздеу.
  • Кейбір дауыстық синтезатор бағдарламалары ұнайды CeVIO шығармашылық студиясы және Синтезатор V ағылшын тіліндегі ән дауыстарын синтездеу үшін CMU Pronunciationing Dictionary модификацияланған нұсқасын қолданады.
  • Транскрипер, толық мәтіндік фонетикалық транскрипцияға арналған құрал CMU Pronunciationing Dictionary қолданады


Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ http://www-i6.informatik.rwth-aachen.de/web/Software/g2p.html
  2. ^ «CMU-дің айтылатын сөздігі».
  3. ^ ftp://ftp.cs.cmu.edu/project/speech/dict/[тұрақты өлі сілтеме ]
  4. ^ http://svn.code.sf.net/p/cmusphinx/code/trunk/cmudict/00README_FIRST.txt
  5. ^ «Мұрағатталған көшірме». Архивтелген түпнұсқа 2011-05-20. Алынған 2009-12-19.CS1 maint: тақырып ретінде мұрағатталған көшірме (сілтеме)

Сыртқы сілтемелер