Google Text-to-speech - Википедия - Google Text-to-Speech

Google Text-to-speech
Google Text to Speech logo.svg
ӘзірлеушілерGoogle Inc.
Бастапқы шығарылым2013 жылғы 13 қараша; 7 жыл бұрын (2013-11-13)
Тұрақты шығарылым
23.12.333383720 / 7 қазан 2020 ж; 2 ай бұрын (2020-10-07)
Операциялық жүйеAndroid
Өлшемішамамен 20 МБ
ТүріЭкранды оқу құралы

Google Text-to-speech Бұл экрандық оқу құралы қосымшасы әзірледі Google ол үшін Android операциялық жүйе. Ол қосымшаларға экрандағы мәтіндерді дауыстап оқуға (сөйлеуге) мүмкіндік береді, көптеген тілдерді қолдайды. «Мәтіннен сөйлеуге» сияқты қолданбалар қолданылуы мүмкін Google Play Books кітаптарды дауыстап оқуға арналған Google Аудармашы сөздердің айтылуы туралы пайдалы түсінік беретін аудармаларды дауыстап оқу үшін Google Talkback қол жетімділікке негізделген басқа айтылған кері байланыстың қосымшалары, сондай-ақ үшінші тарап қолданбалары. Пайдаланушылар әр тіл үшін дауыстық деректерді орнатуы керек.

Қолдау көрсетілетін тілдер

Google Text-to-Speech Android қосымшасы

Араб, Бенгали (Бангладеш), Бенгалия (Үндістан), Кантон (Гонконг), Қытай (Қытай), Қытай (Тайвань), Чех (Чехия), Дания (Дания), Нидерланды (Нидерланды), Ағылшын (Австралия), Ағылшын ( Үндістан), ағылшын (Нигерия), ағылшын (Ұлыбритания), ағылшын (Америка Құрама Штаттары), эстон (Эстония), Филиппин (Филиппин), фин (Финляндия), француз (Канада), француз (Франция), неміс (Германия), Грек (Греция), Гуджарати (Үндістан), Хинди (Үндістан), Венгр (Венгрия), Индонезия (Индонезия), Итальян (Италия), Жапон (Жапония), Яван (Индонезия), Каннада (Үндістан), Кашмири (Үндістан), Қазақ (Қазақстан), Кхмер (Камбоджа), Корей (Оңтүстік Корея), Ладахи (Үндістан), Литва (Литва), Люксембург (Люксембург), Малагаси (Мадагаскар), Малаялам (Индия), Марати (Үндістан), Непал (Непал) , Норвегиялық Бомкаль (Норвегия), Одия (Үндістан), Парсы (Иран), Поляк (Польша), Португалия (Бразилия), Португалия (Португалия), Пенджаби (Үндістан), Румыния (Румыния), Орыс (Ресей), Синди (Пәкістан) ), Сингала (Шри-Ланка), Словакия (Слов.) akia), испан (Испания), испан (Америка Құрама Штаттары), сундан (Индонезия), швед (Швеция), Тамил (Үндістан), Телугу (Үндістан), Тай (Таиланд), түрік (Түркия), украин (Украина), урду (Пәкістан), Өзбек (Өзбекстан), Вьетнам (Вьетнам) [1]

Google Cloud Text-to-Speech

Бенгали (Үндістан), Бирма (Мьянма), Қытай (Гонконг), Чех (Чехия), Дания (Дания), Голландия (Нидерланды), Ағылшын (Австралия), Ағылшын (Үндістан), Ағылшын (Ұлыбритания), Ағылшын ( Америка Құрама Штаттары), Филиппин (Филиппин), Фин (Финляндия), Француз (Канада), Француз (Франция), Неміс (Германия), Грек (Греция), Гуджарат (Индия), Хинди (Үндістан), Венгр (Венгрия), Индонезия (Индонезия), Итальян (Италия), Жапон (Жапония), Каннада (Үндістан), Корея (Оңтүстік Корея), Малаялам (Үндістан), Мандарин Қытай, Норвегия (Норвегия), Поляк (Польша), Португалия (Бразилия), Португал ( Португалия), Орыс (Ресей), Словакия (Словакия), Испан (Испания), Швеция (Швеция), Тамил (Индия), Телугу (Үндістан), Тай (Таиланд), Түрік (Түркия), Украин (Украина) және Вьетнам ( Вьетнам)[2]

Эволюция

Кейбір қосымшаларды әзірлеушілер Android Auto қосымшаларын 2015 жылы Hyundai сияқты мәтіннен сөйлеуге дейін бейімдеуді және өзгертуді бастады.[3] TextPlus және сияқты қосымшалар WhatsApp хабарламаларды дауыстап оқу және дауыстық жауап беру функциясын қамтамасыз ету үшін «Мәтіннен сөйлеуге» қолданыңыз.

Бұлтты мәтіннен сөйлеуге арналған WaveNet, Google-дің Ұлыбританиядағы AI еншілес компаниясы жасаған бағдарламалық жасақтама DeepMind. Google DeepMind-ті 2014 жылы сатып алғаннан бері, компанияның жасанды интеллект талантын материалдық өнімдерге айналдыру жолдарын қарастыруда. WaveNet-ті бұлттық қызметке қосу маңызды, өйткені Google бұлт бизнесін Amazon мен Microsoft-тан алшақтатып, өзінің интеллектуалды дағдыларын дифференциалдау факторы ретінде ұсынады.

DeepMind-тің интеллектуалды синтездеу технологиясы айтарлықтай дамыған және шынайы. Дауыстық синтезаторлардың көпшілігі (соның ішінде Apple Siri) қолданылады контенатикалық синтез, онда бағдарлама жеке слогдарды - «ба», «шт» және «оо» сияқты дыбыстарды сақтайды және оларды сөздер мен сөйлемдер құру үшін біріктіреді. WaveNet оның орнына сөйлеуді қалыптастыру үшін машиналық оқытуды қолданады. Содан кейін ол адамның сөйлеу дерекқорынан толқын формаларын қалыптастырады және оларды секундына 24000 үлгі жылдамдығымен қайта жасайды. Түпкілікті нәтижеге ерінге арналған смактер мен акцент сияқты нәзіктіктер кіреді. Google 2016 жылы WaveNet-ті алғаш рет ашқан кезде, ол ғылыми ортадан тыс жұмыс істеуге тым есептелген еді, бірақ ол айтарлықтай қысқартылып, зерттеуден өнімге дейінгі нақты құбыр желісі көрсетілді. Google Cloud Text-to-Speech мәтінді адамға ұқсас сөйлеуге айналдырып, 180-ден астам дауыста 30-дан астам тіл мен нұсқада қолданады. Ол сөйлеу синтезіндегі (WaveNet) және Google-дің қуатты жүйке желілеріндегі жаңашыл зерттеулерді жоғары сенімділікті қамтамасыз ететін аудионы қолданады. WaveNet технологиясына эксклюзивті қол жетімділікті қамтиды DeepMind адамның дауысы мен табиғи дыбыстарын имитациялайтын сөйлеуді қалыптастыру үшін машиналық оқыту модельдерінде жаңашыл зерттеулер жүргізіп, адамның жұмысындағы алшақтықты 70% төмендетеді. Бұлтты мәтіннен сөйлеуге 90-нан астам WaveNet дауыстарына эксклюзивті қол жетімділік ұсынылады және уақыт өте келе көбірек қосыла береді.

Нұсқа тарихы

Қараша 2013

  • Қазір корей тілін қолдайды.[4]

Наурыз 2014

  • Google деп жариялады Араб 467 миллионнан астам ана тілінде сөйлеушілер болғанына қарамастан, ешқашан қолдау көрсетілмейді.
  • 3.0 нұсқасы табиғи жоғары сапалы дауыстарға қолдау көрсетті. Ағылшын тілінде (Америка Құрама Штаттары) жоғары сапалы дауыстар әйел (жоғары сапалы), ал ағылшын (Ұлыбритания) үш жаңа сапалы дауыспен шықты; Еркек, әйел (жоғары сапалы) және еркек (жоғары сапалы). Бұл жоғары сапалы дауыстар алдыңғы нұсқалардан гөрі файл өлшемі жағынан анағұрлым жоғары, АҚШ-тың әйел дауысы үшін 244МБ (жоғары сапалы) қарапайым әйелдер дауыстық нұсқасы үшін 6,8МБ-қа қарағанда. Бұл жоғары сапалы дауыстар табиғи интонациялармен жоғары сапалы айтылу мен айтылымды қамтамасыз ету үшін қосылды.
  • Бразилия, португал және испан тілдерін (Америка Құрама Штаттары) қолдау қазіргі кезде қолданыстағы тілдердің жалпы санын тоғызға жеткізді. (Неміс, ағылшын (Ұлыбритания), ағылшын (АҚШ), испан (ES), испан (АҚШ), француз, итальян, корей және португал (BR). Тек ағылшын (АҚШ)) мен ағылшын (Ұлыбритания) жоғары сапалы дауысқа ие болды бумалар.) Неміс, ағылшын Ұлыбритания, ағылшын АҚШ, испан ES, испан АҚШ, француз, итальян, корей және португал (BR). Ағылшын АҚШ пен Ұлыбританияда ғана жоғары сапалы дауыстық пакеттер әзірге болған.[5]
  • Пайдаланушы интерфейсіндегі өзгертулер: кейбір тілдер үшін бірнеше дауыстың болуына байланысты 2 немесе одан да көп дауыс бумалары бар дауыстарға ауыстырғыш қосылды.

Мамыр 2014

  • Орыс, голланд, поляк және ағылшын (үнді) қолданыстағы тілдер тізіміне қосылды.[6]

Қыркүйек 2014

  • Жапондық өндірісті қолдау қосылды.[7]

Желтоқсан 2014

  • 4-нұсқасы қол жетімді (6.0 Marshmallow және одан жоғары нұсқалары үшін)
  • Хинди және Индонезия өнімдерін қолдау.
  • Өнімнің сапасы жақсарды. Стандартты дауыстар қазір алдыңғы шығарылымдардағы жоғары сапалы дауыстардан асып түседі.[8]

Шілде 2015

  • Төрт жаңа тіл қолданады: кантон (Гонконг), мандарин (Қытай), тай (Таиланд) және түрік (Түркия).
  • Қателерді түзету және басқа жақсартулар.

Ақпан 2016

  • Дауыс сапасы жақсарды.
  • Бенгалия (Бангладеш), Дания (Дания), Ағылшын (Австралия), Фин (Финляндия), Венгрия (Венгрия), Норвегия (Норвегия) және Мандарин (Тайвань) мен Шведке қолдау қосылды.
  • Офлайн дауыстар енді жылдамырақ сөйлей алады.
  • Көптеген қателерді түзету және өнімділікті жақсарту.

Маусым 2016

  • Шведтер мен вьетнамдықтарға қолдау қосылды.
  • Қателерді түзету және жақсарту.

Қазан 2016

  • Дауыстың альтернативті нұсқалары қазір барлық құрылғыларда қол жетімді.
  • Сөйлеу көлемін басқа аудиоға қарағанда күшейтуге қолдау қосылды.
  • Қытай, голланд, дат, ағылшын, француз, неміс, итальян, жапон, корей, поляк, португал, орыс және испан тілдеріндегі эмодзи вербализациясына кеңейтілген қолдау.
  • Қателерді түзету және жақсарту.

Сәуір 2017

  • Бенгал (Үндістан), чех, кхмер, непал, сингал және украин тілдеріне қолдау қосылды.
  • Енді параметрлерді өңдеуді өшіруге болады. Бұл мәтіннің сөзбе-сөз айтылуын тудырады. Мысалы, 09/10/2017 oh do slash ten деп оқылады ... Тек ағылшын дауысы үшін қол жетімді.
  • Интонацияны басқару енді көп дауыстар үшін қол жетімді.
  • Әр түрлі дауыстарды жақсарту.

Қазан 2017

  • Филиппин және грек тілдеріне қолдау қосылды.

Қаңтар 2018

  • Эстон, румын және словак тілдеріне қолдау қосылды.
  • Біздің дауыстарды жақсартудың басқа түрлері.

Шілде 2018

  • Француз (Канада), Ява және Сундан тілдеріне қолдау қосылды.
  • Таңдау үшін көбірек дауыстар: ағылшын (австралия), ағылшын (Ұлыбритания) және француз (Франция)
  • Енді тілге арналған барлық дауыстар бірге жүктеледі, бұл құрылғыдағы сақтау орнын үнемдейді.
  • 64 биттік құрылғылардың жұмысын жақсарту.
  • Дауыстарды жақсартудың басқа түрлері.

Тамыз 2019

  • Ағылшын (Нигерия), Гуджарат, Каннада, Малаялам, Марати, Португал (Португалия), Тамил, Телугу және Урду тілдеріне қолдау қосылды.
  • Жаңа қосымшаның белгішесі және көптеген мүмкіндіктер

Шілде 2020

  • Араб тіліне қолдау көрсету.

Қазан 2020

  • Одия, Лаос және Люксембургқа қолдау қосылды

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ Google Text-to-Speech - Google Play қолданбалары
  2. ^ Қолдау көрсетілетін дауыстар мен тілдер | Сөзден мәтінге арналған бұлтты құжаттама
  3. ^ «Google және Hyundai жаңа Android Auto қосымшаларын ұсынады». CNET. CBS интерактивті. Алынған 17 қаңтар 2015.
  4. ^ «Google Text-to-Speech қозғалтқышы Google Play-ге келеді». Android Authority. Алынған 23 қараша 2014.
  5. ^ Богдан Петрован (6 наурыз 2014). «Google мәтінді сөйлеуге арналған моторды жаңа және сапалы дауыстармен жаңартады». Android Authority.
  6. ^ «Google Text-to-speech жаңа тілдермен, соның ішінде голланд, поляк және орыс тілдерімен жаңартылды». Android және Мен. Архивтелген түпнұсқа 3 маусым 2014 ж. Алынған 23 қараша 2014.
  7. ^ «Google-дің мәтіннен сөйлеуге арналған механизмі енді жапондық өнімді қолдайды». Android Police. Алынған 23 қараша 2014.
  8. ^ «Google мәтіндік сөйлеуге енді соңғы жаңартуда жоғары сапалы дауыстар қажет емес дейді». Android Central. Архивтелген түпнұсқа 31 желтоқсан 2014 ж. Алынған 16 желтоқсан 2014.