1 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Pico tts что это за программа

Содержание

990x.top

Простой компьютерный блог для души)

Pico TTS что это за программа на Андроид?

Всем привет. В сегодняшнем выпуске мы поговорим о программе Pico TTS, которую можно встретить на Андроид-девайсе. Итак, что это за программа? Что она делает, для чего она? Все эти вопросы сегодня будут рассмотрены мной, не сомневайтесь. Постараюсь все написать простым человеческим языком =)

Итак, вот первые данные. Pico TTS это приложение типа синтезатор речи, при помощи этого приложения можно озвучивать текст. Однако есть один мощный косяк, это то, что в Pico TTS нет русского языка. Кстати в альтернативном синтезаторе Google Text-to-Speech русский язык есть!

Кстати TTS расшифровывается как Text To Speech, что в свою очередь переводится как Текст В Речь =)

Но вообще зачем нужен синтезатор речи? Он позволяет озвучивать текст в приложениях. Вот к примеру синтезатор Google Text-to-Speech может озвучивать текст в гугловском переводчике, в TalkBack, или в каких-то приложениях, которые используют синтез речи. Хм, синтез речи? А звучит то мощно!

Удалить приложение Pico TTS в принципе как бэ можно, однако лучше его заморозить. Потом, если вы убедитесь, что оно вам стопудово не нужно и не пригодиться в будущем, то потом уже можно удалить. Для заморозки и удаления советую приложение Titanium Backup (учтите, что для этого нужны рут-права).

Вот еще читаю, что качество Pico TTS не очень, и что приложение не развивается и присутствует в Андроиде тупо для галочки.. =(

Если вам в принципе нужно отключить преобразование текста в речь, то нужно пойти в настройки > голосовой ввод и вывод > преобразование текста в речь > снять там все галочки =)

Правда это или нет я не знаю, однако один чел написал сообщение, что он лично удалять Pico TTS не стал. Говорит что на одном телефоне удалил Pico TTS, после чего, какой бы он синтезатор речи не поставил, то ни один не работал. Правда это или бред? Не знаю. Но сообщение такое на андроидном форуме я нашел, решил что стоит и вам эту инфу передать.

Вот нашел картинку, это настройка, где можно выбрать TTS:

Как видите есть даже и Samsung TTS =) А вот кстати почти такая же картинка, но тут есть SVOX Classic TTS:

То есть синтезаторы могут быть разные, но Pico TTS идет типа как встроенный, а другие можно самостоятельно поставить.

А вот эта картинка, это тоже настройки, но видимо уже на планшете, и тут все почти также:

TTS выбирается в разделе Язык и ввод =)

Ну вот и все ребята, я вроде все сказал, что такое Pico TTS теперь вы знаете, верно? А значит моя задача успешно выполнена. Напоследок скажу берегите себя и удачи!

Pico tts что это за программа

Обсуждения

Информация для тех пользователей, у кого не работает озвучка на Android

30 сообщений

Здравствуйте, уважаемые пользователи!

В данной теме мы размещаем информацию для тех пользователей, у которых возникли трудности с озвучкой в нашем приложении на устройствах под управлением операционной системы Android
**При этом у пользователей на экране устройства выводится сообщение «Для озвучивания необходимо установить компоненты английского языка English (United States)».**

Для настройки озвучки на Android-устройствах мы рекомендуем вам выполнить следующие действия:

1. Зайти в раздел «Настройки» («Settings») своего устройства.
2. В меню настроек выбрать пункт «Язык и ввод» («Language & Input») или «Язык и клавиатура» («Language & Keyboard»)
3. Далее в меню настроек языка найти раздел «Голосовой ввод» («Speech»). В данном разделе выбрать пункт «Синтез речи» («Text-to-speech output»).

**Примечание: если раздел «Голосовой ввод» («Speech») пуст, необходимо перейти к пункту 5.**

4. В меню настроек «Синтез речи» в разделе «Система по умолчанию» («Default system») выбрать пункт «Синтезатор речи Google».

**Примечание: в случае, если в меню настроек «Синтез речи» отсутствует пункт «Синтезатор речи Google», необходимо перейти к пункту 5.**

5. В магазине Google Play необходимо найти и скачать приложение «Синтезатор речи Google». Это приложение бесплатное, его разработчиком является компания Google.

6. После установки «Синтезатора речи Google» необходимо проделать шаги 1-4.

После выполнения данных действий озвучка должна заработать.

В случае, если у вас возникнут вопросы касательно данной инструкции или проблемы с настройкой, то просим Вас связаться с нами по эл. почте itadmin@noxx.ru или в данной теме для обсуждений, чтобы мы оперативно смогли помочь Вам в решении вопросов по настройке озвучки.

C уважением,
команда разработчиков «Партнера»!

Как добавить звук в движок Android pico TTS?

Я использую pico default android TTS engine с персонажами IPA, делающими это

Обычно он работает, но для некоторых букв ему не нравятся «ã» или «ɑ» и т. Д.

Поэтому мой вопрос: как добавить тезисы / звуки к этому движку TTS?

Эй, вы можете использовать addEarcon() для добавления звуков в ссылку testToSpeech . Это medthod используется для добавления earcons.It будет связывать текст с речевым звуковым файлом. Вы также можете найти пример.

Существует также очень хорошее объяснение addEarcon в книге Professional Android Sensor Programming от Greg Milette, Adam Stroud на странице № 366 и 367.

Вы также можете найти пример по этой ссылке .

Pico tts что это за программа

Если ваш родной язык не английский и вы не пишете приложения только для iPhone, то вам придется достаточно трудно, если вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.

В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine[1].

Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.

Для удобства разделим движки TTS на три класса:

  1. коммерческие;
  2. свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
  3. встроенные (средства, предоставляемые самой операционной системой).

Коммерческие движки

SVOX Mobile TTS (http://www.svox.com/)

  • Цена: n/a
  • Языки: 26, включая русский
  • Субъективная оценка качества звучания: высокое
  • Мобильные ОС: Android, Symbian, Windows CE / Windows Mobile, BREW
  • Возможность разработки коммерческих продуктов: есть

Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт —SVOX Mobile TTS.

Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.

Acapela TTS (http://www.acapela-group.com/)

  • Цена: 2800€ плюс так называемая run-time license, за которую в самом лучшем случае придется платить по 49€ за каждое распространенное приложение
  • Языки: 23, включая русский
  • Субъективная оценка качества звучания: высокое
  • Мобильные ОС: Symbian, Windows CE / Windows Mobile, Embedded Linux, iOS
  • Возможность разработки коммерческих продуктов: есть
Читать еще:  Программа чтобы сделать загрузочную флешку win 7

Сотрудники Acapela Group оказались намного более общительными и ответили буквально через полчаса после заполнения вотсоответствующей заявки.

Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайтhttp://www.acapela-for-iphone.com/.

Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Также с каждого проданного Вами в App Store приложения снимаются немалые проценты.

Отмечу, что Acapela предоставляет «облачный» синтез речи, а также портирование SDK под любую платформу.

Loquendo Embedded TTS (http://www.loquendo.com/)

  • Цена: 3000€ плюс проценты с каждого проданного Вами мобильного приложения
  • Языки: 26, включая русский
  • Субъективная оценка качества звучания: высокое
  • Мобильные ОС: Android, Symbian, Windows CE / Windows Mobile, Embedded Linux, iOS, Maemo, Moblin, MeeGo, PalmOS
  • Возможность разработки коммерческих продуктов: есть

Движок Loquendo обладает специальными тегами, позволяющими делать речь более естественной, подмешивая такие не совсем «речевые» фишки как кашель, смех и прочее.

Их движок отвечает спецификацииSSML 1.0, рекомендованной W3C.

Sakrament TTS (http://www.sakrament.com/)

  • Цена: 1500€ для одной ОС, при покупке пакета сразу для двух языков предоставляется скидка в размере 25%, что составляет 2250€
  • Языки: английский, русский
  • Субъективная оценка качества звучания: среднее
  • Мобильные ОС: Symbian, Windows Mobile
  • Возможность разработки коммерческих продуктов: есть

Качества синтеза речи Sakrament TTS вполне достаточно, что бы озвучивать короткие фразы типа номеров телефонов или названий приложений.[2]

Свободные движки

  • Цена: нет
  • Языки: английский плюс возможность компиляции языков FestVox
  • Субъективная оценка качества звучания: низкое
  • Мобильные ОС: Android, Windows CE / Windows Mobile, iOS, PalmOS
  • Возможность разработки коммерческих продуктов: есть (CMU licence

В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названиемFlite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуютпорты для Windows CE / Windows Mobile,PalmOS, AndroidиiOS.

eSpeak (http://espeak.sourceforge.net/)

  • Цена: нет
  • Языки: 39, включая русский
  • Субъективная оценка качества звучания: среднее
  • Мобильные ОС: Android, Windows CE / Windows Mobile [3]
  • Возможность разработки коммерческих продуктов: нет (GNU GPL

Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить по ссылкеhttp://www.efficasoft.com/download/eSpeak-1.29-wm.cab).

Самый простой способ его попробовать — это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.

Встроенные решения

Встроенные решения присутствуют только в Symbian и Android.[4]. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).

Symbian (http://www.symbian.org/)

  • Цена: нет
  • Языки: английский
  • Субъективная оценка качества звучания: крайне низкое
  • Возможность разработки коммерческих продуктов: есть

Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотяв его документации

ничего об этом не сказано, он все же позволяет синтезировать речь (см.http://wiki.forum.nokia.com/index.php/Text_to_speech_in_Symbian_2nd_and_3rd_edition_phones. К сожалению, русский язык не поддерживается.[5].

Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.

Дополнительные языковые пакеты можно загрузить по ссылке http://europe.nokia.com/support/download-software/text-to-speech, однако список поддерживаемых телефонов крайне мал.

Установка пакетов для русского языка на устройство под управлением Symbian OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.

Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти по ссылкеhttp://wiki.forum.nokia.com/index.php/CS001031_-_NSSTTS_Utility_API.

Android (http://www.android.com/)

  • Цена: нет
  • Языки: английский, французский, немецкий, итальянский, испанский
  • Субъективная оценка качества звучания: среднее
  • Возможность разработки коммерческих продуктов: есть

Встроенная функциональность синтеза речи в Android доступна с версии 1.6. Прекрасное введение в тему можно найтив блоге разработчиков. Android TTS API является не чем иным, как оберткой над SVOX Pico, русский язык, которым, к сожалению, не поддерживается.

Заключение

Выводы каждому придется делать в зависимости от требований к разрабатываемому продукту. Для коммерческих решений крайне важно качество синтеза речи, поэтому выбирать стоит из двух движков – Acapela TTS и Loquendo Embedded TTS. При выборе движка для open source проекта крайне важную роль будет играть список целевых ОС.

Лично для себя я выбрал eSpeak, поскольку мой проект академического толка и я могу себе позволить использование продукта лицензированного по GNU GPL.

Примечания

Приводимые ниже примечания не являются составной частью статьи. Мы сочли необходимым опубликовать их здесь, чтобы дополнить отдельные утверждения автора.

  1. Приводимый обзор не является исчерпывающим. В частности в нём не отражены продукты компании Nuance, которые обладают достаточно высоким качеством синтезируемой речи (в том числе и русской) и используются на таких мобильных операционных системах как Android, BlackBerry, iOS, Symbian.
    Вернуться к тексту
  2. Как показывает практика, голоса от ООО «Сакрамент» пригодны и для большего, нежели озвучивание коротких фраз. В сфере адаптивных мобильных технологий для пользователей с нарушениями зрения они получили широкое признание. Например, данные TTS Engines использованы в качестве основных русских голосов в таких продуктах, как screenreader Mobile Speak, программа чтения текстов Мобильный рассказчик и тифлоорганайзер Pronto.
    Вернуться к тексту
  3. Помимо названных, eSpeak также портирован под мобильную операционную систему Maemo.
    Вернуться к тексту
  4. Здесь автор противоречит сам себе, так как встроенная технология Text-To-Speech имеется также в iOS.
    Вернуться к тексту
  5. На самом деле, встроенный синтез русской речи реализован в Symbian, начиная ещё с 8.1. В относительно новых версиях мобильных программ экранного доступа даже реализовано использование этого голоса в качестве основного. Вы можете загрузить запись русского голоса, читающего строку из стихотворения А. С. Пушкина (качество голоса как раз такое, чтобы проверить своё знание творчества великого русского поэта).
    Вернуться к тексту

The picotts text-to-speech platform uses offline pico Text-to-Speech engine to read a text with natural sounding voices. This requires to install the pico tts library on the system, typically on debian just do sudo apt-get install libttspico-utils On some Raspbian release, this package is missing but you can just copy the arm deb package from debian.

On Debian Buster, the package is missing, use the following commands to install it:

Configuration

To enable text-to-speech with Pico, add the following lines to your configuration.yaml :

Configuration Variables

The language to use. Supported languages are en-US , en-GB , de-DE , es-ES , fr-FR and it-IT .

Full configuration example

The configuration sample below shows how an entry can look like:

Vocalizer TTS

вкл. 20 Февраль 2016 . Опубликовано в Другое

Vocalizer TTS — чтение текста голосом для других приложений без подключения к интернету.

Установка: Распаковать скачанный архив ( Голос Милены ), скопировать папку Nuance в любое удобное место карты памяти телефона, далее настройка телефона — Язык и ввод — Параметры TTS — активировать Vocalizer TTS и перезагрузить телефон, только после этого снова зайти в Параметры TTS нажать шестеренку выбранного модуля — зайти в настройки для Vocalizer TTS — выбрать папку с голосами например /storage/extSdCard/Nuance и снова перезагрузить телефон, после этого в модуле TTS, во вкладке Язык, выбрать любой язык например MilenaPremiumHigh
Скачать приложение Vocalizer TTS на Андроид вы можете по ссылке ниже.

Разработчик: Vocalizer Nuance
Платформа: Android 2.0 и выше
Язык интерфейса: Русский (RUS)
Состояние: Free (Бесплатно)
Root: Не нужен

Как настроить синтезатор речи Google на Android

В то время как Google фокусируется на Помощнике, владельцы Android не должны забывать о функции синтеза речи (TTS). Она преобразует текст из Ваших приложений для Android, но Вам может потребоваться изменить его, чтобы речь звучала так, как Вы этого хотите.

Изменение синтеза речи легко сделать из меню настроек специальных возможностей Android. Вы можете изменить скорость и тон выбранного Вами голоса, а также используемый голосовой движок.

Читать еще:  Bytefog что это за программа

Синтезатор речи Google — это голосовой движок по умолчанию, который предварительно установлен на большинстве устройств Android. Если на Вашем Android-устройстве он не установлен, Вы можете загрузить приложение Синтезатор речи Google из Google Play Store.

Изменение скорости речи и высоты тона

Android будет использовать настройки по умолчанию для Синтезатора речи Google, но Вам может потребоваться изменить скорость и высоту голоса, чтобы Вам было легче его понять.

Изменение скорости речи и высоты тона TTS требует, чтобы Вы попали в меню настроек специальных возможностей Google. Шаги для этого могут незначительно отличаться, в зависимости от Вашей версии Android и производителя Вашего устройства. В данной статье используется устройство Honor 8 lite, работающее на Android 8.0.

Чтобы открыть меню специальных возможностей Android, перейдите в меню «Настройки» Android. Это можно сделать, проведя пальцем вниз по экрану для доступа к панели уведомлений и нажав значок шестеренки в правом верхнем углу, или запустив приложение «Настройки» в своем списке приложений.

В меню «Настройки» нажмите «Управление», а оттуда «Специальные возможности».

Выберите «Синтез речи».

Отсюда Вы сможете изменить настройки преобразования текста в речь.

Изменение скорости речи

Скорость речи — это скорость, с которой будет говорить синтезатор речи. Если Ваш TTS движок слишком быстрый (или слишком медленный), речь может звучать искаженно или плохо для понимания.

Если Вы выполнили вышеуказанные действия, Вы должны увидеть слайдер под заголовком «Скорость речи» в меню «Синтез речи». Проведите пальцем вправо или влево, чтобы повысить или понизить скорость.

Нажмите кнопку «Прослушать пример», чтобы проверить новый уровень речи.

Изменение высоты тона

Если Вы чувствуете, что тон преобразованного текста в речь слишком высок (или низок), Вы можете изменить это, следуя тому же процессу, что и при изменении скорости речи.

Как и выше, в меню настроек «Синтез речи» отрегулируйте ползунок «Тон» в соответствии с желаемой высотой тона.

Когда Вы будете готовы, нажмите «Прослушать пример», чтобы попробовать новый вариант.

Продолжайте этот процесс, пока Вы не будете довольны настройками скорости речи и высоты тона, или нажмите «Сбросить скорость речи» и/или «Сбросить настройки тона», чтобы вернуться к настройкам TTS по умолчанию.

Выбор голоса синтезатора речи

Вы можете не только изменить тон и скорость своего речевого движка TTS, но и изменить голос. Некоторые языковые пакеты, включенные в стандартный движок Синтезатор речи Google, имеют разные голоса, которые звучат как мужской, так и женский.

Если Вы используете Синтезатор речи Google, нажмите кнопку «i» рядом названием.

В меню «Настройки» нажмите «Установка голосовых данных».

Нажмите на выбранный Вами язык.

Вы увидите различные голоса, перечисленные и пронумерованные, начиная с «Голоса I». Нажмите на каждый, чтобы услышать, как он звучит. Вы должны убедиться, что на Вашем устройстве включен звук.

Выберите голос, который Вас устраивает в качестве Вашего окончательного выбора.

Ваш выбор будет автоматически сохранен, хотя, если Вы выбрали другой язык по умолчанию для Вашего устройства, Вам также придется изменить его.

Переключение языков

Если Вам нужно переключить язык, Вы можете легко сделать это из меню настроек Синтеза речи. Возможно, Вы захотите сделать это, если Вы выбрали язык в Вашем движке TTS, отличный от языка Вашей системы по умолчанию.

Вы должны увидеть опцию «Язык». Нажмите, чтобы открыть меню.

Выберите свой язык из списка, нажав на него.

Сторонние движки синтезатора речи

Если Синтезатор речи Google Вам не подходит, Вы можете установить альтернативные варианты.

Их можно установить из Google Play Store или установить вручную. Примеры движков TTS, которые Вы можете установить, включают Acapela и eSpeak TTS, хотя доступны и другие.

Somethings

problems and solutions

суббота, 23 июля 2011 г.

Синтез речи в Android-приложении

Не так давно пришлось прикручивать к нашему приложению озвучку с помощью Text-to-Speech (TTS). Об этом-то я и хочу сегодня рассказать.

Quick Start

TTS можно использовать двумя способами. Во-первых, можно завязываться на конкретный движок, покупать библиотеку и работать через неё. Про этот вариант ничего не могу сказать, знаю только теоретически. Второй, общеизвестный вариант — использовать стандартное API. Голоса в этом случае являются просто приложениями, установленными в системе.

Вообще-то заставить приложение говорить не так сложно, и мануалов по этому поводу полно. Но для полноты картины приведу начальные сведения.

Начиная с версии 1.6 в SDK есть стандартный класс TextToSpeech .

Подключение в приложение

Простейшая схема такова:

MainActivity.java

Все вроде понятно. Создали экземпляр TextToSpeech , инициализировали в специальном листенере (задавать голос мы можем только в onInit ), и с тех пор можем синтезировать и проигрывать речь с помощью метода speak . Обращу внимание, что это только схема, более приближенное к реальности приложение можно найти в примере к статье.

Метод speak

Рассмотрим подробнее сигнатуру метода speak :

speak(String text, int queueMode, HashMap params)

text Текст, который нужно прочитать queueMode

  • TextToSpeech.QUEUE_FLUSH , если хочется, чтобы предыдущая фраза прерывалась и сразу начиналась следующая
  • TextToSpeech.QUEUE_ADD , если хочется, чтобы предыдущая фраза договорилась до конца только после этого началась следующая

params Массив дополнительных параметров. Возможные параметры:

  • TextToSpeech.Engine.KEY_PARAM_STREAM — поток, в котором будет воспроизводиться звук.
  • TextToSpeech.Engine.KEY_PARAM_UTTERANCE_ID — идентификатор фразы. Пригодится, если хочется обрабатывать событие окончания говорения, и при этом не запутаться в произносимых фразах.

Другие полезные методы

TTS engines

Вкратце расскажу об известных TTS-движках. Как уже говорилось ранее, голоса — это просто сторонние приложения. Посмотрим, что у нас есть под Android.

Pico Стандартный TTS-движок, знает 5 языков, поставляется бесплатно. Говорит неплохо, но русского не знает. eSpeak Свободный TTS-движок. Знает очень много языков. По-русски тоже говорит, но отвратительно. SVOX Довольно известный движок. Под Android распространяется следующим образом. Есть бесплатная программа-оболочка и платные голоса, которыми можно управлять из этой оболочки. Голосов очень много. Достаточно неплохо говорит по-русски, хотя есть проблемы с ударениями. В общем-то голос SVOX оказался единственным вариантом для русской озвучки приложения. Loquendo Также известный и качественный движок. К сожалению, в Android представлен мало. Для английского языка есть голос Susan, а вот для русского языка приложения нет, хотя вообще-то Loquendo говорить по-русски умеет.

А теперь немного о сложностях.

Проверка наличия голосовых данных

Pico TTS поставляется по умолчанию с системой. Но на некоторых моделях телефонов не установлены голосовые пакеты. Внешне это проявляется, например, в том, что в системных настройках синтеза речи всё задизаблено и предлагается скачать и установить некие ресурсы:

В официальном мануале описан способ обработки этой ситуации.

CheckVoiceActivity.java

Особенности работы под Android 2.1

Наше приложение должно было разговаривать не абы каким голосом, а исключительно красивым. Соответственно, была задача выбрать нужный нам TTS-движок из всех установленных у пользователя. В Android 2.2 у класса TextToSpeech есть метод setEngineByPackageName , но что делать в 2.1, где такого метода нет?

Существует известный обход этой проблемы, с использованием дополнительной программы и дополнительной библиотеки. В плане юзабилити, конечно, не ахти, ведь придется заставлять пользователя ставить какой-то сторонний софт. Зато работает. Итак:

  • Устанавливаем на телефон приложение Text-to-speech Extended (ссылка на маркет: market://details?id=com.google.tts )
  • Подключаем к нашему приложению библиотеку от eyes-free.
  • Вместо привычного TextToSpeech используем класс TextToSpeechBeta из этой библиотеки

Имеет смысл написать класс-оболочку такого примерно вида:

TextToSpeechWrapper

Конкретная реализация может быть и другой.

Конфигурируем TTS

Нам нужно сконфигурировать TTS определенным голосом. Голос, в свою очередь, определяется следующими параметрами:

  • Engine — задается функцией setEngineByPackageName .
  • Locale — задается функцией setLanguage .

Вариант 1, легкий, но редкий

Так работает Loquendo. Пишем:

И всё начинает работать.

Вариант 2, сложный и частый

Так работают Pico и SVOX. У них есть оболочка (engine) и подключаемые модули (голоса). Рассмотрим на примере Pico

Тоже вроде все работает. Проблемы начинаются, когда у одной локали оказывается несколько голосов. Такое имеет место для SVOX. У одного языка может быть мужской, женский и детский голос. Это разные приложения, у них разные названия пакетов, но с точки зрения TTS все это одно и то же.

Если установлено несколько голосов для одной локали, выбран будет тот, который указан в настройках SVOX как дефолтный. Однако, мы это никак отследить не можем. Печально.

Общие проблемы для обоих вариантов

TTS-движок задизаблен в настройках TextToSpeech

У меня так и не получилось отловить эту ситуацию. По идее, setEngineByPackageName должен бы вернуть ERROR , и мы бы догадались, что что-то не так. Но он отрабатывает на ура, и приложение разговаривает, чем попало.

Читать еще:  Как узнать какие программы тормозят работу компьютера

Галочка «Использовать мои настройки»

Это тоже достаточно вредная штука, и её нужно учитывать. Дело в том, что пользователь может выставить собственные настройки TTS и эту галочку.

И тогда вся ваша конфигурация не будет применяться. Отслеживать состояние этой настройки можно с помощью метода areDefaultsEnforced (в Android 2.2 и выше. Если версия меньше, нужен TTSE и метод areDefaultsEnforcedExtended )

Заключение

Собственно, вот и все, что накопилось за те две недели, что я занимаюсь озвучкой приложения. Субъективное ощущение от этого API — сыровато. Не хватает доступа ко всем настройкам TTS в системе. Для пользователя они слишком сложные и неочевидные («Мои настройки» — яркий пример). Разнобой в опциях различных TTS-движков также печалит. В общем, использовать TTS не так сложно, а вот обрабатывать различные его состояния — целое дело.

Ссылки

Пример

Исходники к статье прилагаются. Там рассмотрены следующие ситуации:

  • Простая инициализация TTS
  • Проверка голосовых данных Pico
  • Использование TextToSpeechBeta

[Android] Синтезатор речи от Google. Ваш телефон заговорит по-русски

Для повседневного использования требовались определенные усилия, а уж для мобильных платформ, в первую очередь Android, они подходили лишь в связке с персональным компьютером, заставляя перегонять текст в звук, чтобы позднее воспроизводить стандартным Mp3 плеером на конечном устройстве.

Некоторую надежду на прогресс, как это часто бывает, дарила корпорация добра Google, см. наш материал:
Site Link: Русские голосовые движки и применение Google Api TTS. До недавнего времени максимум возможностей, предоставляемых поисковым гигантом, сводился к онлайн работе с их синтезатором. Результат, откровенно говоря, не был чем-то революционным. С примером работы Google API TTS вы можете ознакомиться на странице с общей информацией о Клубе.

Существовало и еще несколько решений, заточенных непосредственно под использование со смартфонами:

  • Поставляемый по умолчанию Pico TTS — без русского языка
  • IVONA Text-to-Speech — к сожалению, поддержка русского пока не реализована, хотя официальный голос Татьяна представлен на сайте разработчика
  • SVOX Classic Text To Speech Engine — единственная рабочая модель. Установка софта — бесплатная, пробный период на ознакомление. Конечная цена

3USD

Как видите, реально работает только решение SVOX. При всей «реальности», работает система из рук вон плохо. То есть основное свое предназначение — читать по-русски, формально она выполняет, но читает плохо.

И вот, в конце мая 2014 года в Google Play появляется их новый абсолютно бесплатный Синтезатор речи Google. Этот продукт легко затыкает за пояс прошлые решения с использованием русских систем TTS, более того, по моему скромному мнению, этот женский голос лучше доступных решений для персональных компьютеров.

Ниже приведен небольшой демофрагмент полученный со смартфона с установленным синтезатором речи Google — русский женский голос (пока единственный из доступных)

Запись получена через стандартную программу для fb2 FBReader с подключенным модулем чтения TTS+ от Hyperionics Technology. Запись велась напрямую с телефона.

Если есть желание и необходимость, можно использовать любые читалки, так популярная Moonreader уже в дистрибутиве содержит модуль чтения, сами же создатели модуля TTS+ для FBReader настойчиво рекламируют свое приложение Voice Reader.

    Преимущества использования голосового синтеза Google для Android:
  • Качество. Лично для меня digalo Николай уходит в прошлое
  • Универсальность и совместимость с большинством читалок для смартфонов и планшетов. Дальнейшие удобства пользователя (например таймер сна, триггеры включения, паузы и пр.) — зависят от программы посредника
  • Стабильность работы. За 12 часов тестирования в разных условиях синтезатор ни разу не вылетал, чего нельзя сказать о программах читалках
  • Синтезатор не привязан к сети интернет и не потребляет дополнительных ресурсов на беспроводную передачу данных

Даже если вы не воспринимаете компьютерную речь в контексте озвучивания книг, это решение позволит вам апгрейдить своего мобильного друга. Гугль навигация начнет читать вам названия улиц, специальные приложения смогут озвучивать текст СМС и номера при входящих звонках.

Кроме того, и это весьма полезно для слабовидящих или незрячих пользователей, теперь можно полноценно использовать TalkBack — аналог знакомого многим по работе на персоналках скрин-ридера Jaws. Эта система реализует потенциал Android для голосового оповещения о всех событиях на телефоне, позволяющего управлять им, не видя экрана.

    Недостатки в работе с синтезатором
  • Существенный минус для любителя аудиокниг — повышенное энергопотребление, за пару часов озвучивания вы потеряете до половины заряда аккумулятора
  • Неприятность, зафиксированная лишь во время проигрывания через динамик телефона: легкий fade in — затухание уровня звука в начале предложения. Через проводную гарнитуру, внешнее устройство и bluetooth этот эффект отсутствует
  • Нет поддержки пользовательских ударений и словарей

Особенных чудес ждать не приходится — это всего лишь компьютер, впрочем, некоторая холодность во время чтения кому-то может показаться приятным отдохновением после избытка театральности в работе отдельных исполнителей.

Установка синтезатора предельно проста.
Заходим на страницу продукта в магазине. Google Play, как обычно, известит вас о совместимости с вашим устройством — требуется Android 4.0.3 и выше, затем произойдет загрузка и установка. После чего нужно скачать «голос»: Настройки -> Специальные возможности -> Вывод функции текста в речь -> Синтезатор речи Google (не пугайтесь грозного предупреждения, ничего нового о вас производитель через эту программу не узнает, ему и так все доподлинно известно) -> скачать. И для спокойствия — перезагрузить.

    UPD.: октябрь 2016

Для андроид 4,2 (лучше 4,4) и выше к базовому женскому голосу добавлено 6 новых — три мужских и три женских:

Обзор синтезаторов речи для Андроид

Приложения-синтезаторы речи – удобные и надежные помощники для Андроид пользователей. С их помощью можно «озвучить» приложения на самые популярные языки мира, настроить тембр голоса и другие важные параметры, а также учить языки, прослушивать звучание разных слов. Большинство TTS приложений для Android доступны бесплатно, однако за установку отдельных голосов и функций нужно доплатить. Мы подобрали для вас наиболее удобные синтезаторы речи, скачать которые можно на нашем сайте.

Синтез речи от Google


Наиболее популярная и доступная TTS-утилита, совместимая со многими Андроид-девайсами. С помощью программы вы можете озвучивать текст на экране, а также выполнять ряд важных функций:

  • Озвучивать книги приложения Google Play Книги.
  • Переводить и озвучивать слова из Google Переводчика.
  • Включать голосовые подсказки при помощи сервиса TalkBack.

Активировать приложение Синтез речи от Google можно прямо на своем девайсе. Для этого откройте пункт меню «Настройки», где зайдите в подраздел «Язык и методы ввода», а там – «Синтез речи». Выберите систему синтеза речи от Google, после чего приложение активируется автоматически.

Программа поддерживает более 40 языков, среди которых английский, русский, французский, немецкий, японский, испанский, датский, хинди и много других. В последней версии утилиты добавлено 3 новые языка – румынский, эстонский и словацкий, а также улучшено качество голоса в целом.

Acapela TTS Voices


Еще один качественный синтезатор речи на Андроид, который доступен на нашем портале. Программа является условно бесплатной, при этом перед тем, как купить приложение, вы можете прослушать демо-версии мужских и женских голосов в режиме онлайн. Утилита позволяет покупать и устанавливать программы с голосом высокого качества, такие как Google TalkBack, переводчики приложений для чтения книг и озвучивания новостей.

Для выбора и установки голоса в приложении войдите в меню, после чего нажмите на голос и удерживайте несколько секунд. Возле выбранного голоса появится значок желтой звезды, и он будет установлен по умолчанию. Теперь вы можете использовать эту программу с вашей любимой читалкой книг.

Приложение Acapela TTS Voices можно активировать следующими действиями.

  • Загрузите сервис на нашем сайте или портале Google Play.
  • После установки приложения кликните на иконку программы. Убедитесь в наличии Интернет-соединения.
  • Ознакомьтесь со списком голосов, которые загружены с сервера.
  • Нажмите на меню напротив каждого голоса, где можно прослушать собственный текст или сразу перейти к покупке.
  • После покупки и оплаты голос будет загружен, и вы сможете пользоваться им в любое время.

Приложение Acapela TTS Voices совместимо с ОС Android 2.2 и более поздними версиями.

Ссылка на основную публикацию
Статьи c упоминанием слов:
Adblock
detector