Язык tts русский pico tts
990x.top
Простой компьютерный блог для души)
Pico TTS что это за программа на Андроид?
Всем привет. В сегодняшнем выпуске мы поговорим о программе Pico TTS, которую можно встретить на Андроид-девайсе. Итак, что это за программа? Что она делает, для чего она? Все эти вопросы сегодня будут рассмотрены мной, не сомневайтесь. Постараюсь все написать простым человеческим языком
Итак, вот первые данные. Pico TTS это приложение типа синтезатор речи, при помощи этого приложения можно озвучивать текст. Однако есть один мощный косяк, это то, что в Pico TTS нет русского языка. Кстати в альтернативном синтезаторе Google Text-to-Speech русский язык есть!
Кстати TTS расшифровывается как Text To Speech, что в свою очередь переводится как Текст В Речь
Но вообще зачем нужен синтезатор речи? Он позволяет озвучивать текст в приложениях. Вот к примеру синтезатор Google Text-to-Speech может озвучивать текст в гугловском переводчике, в TalkBack, или в каких-то приложениях, которые используют синтез речи. Хм, синтез речи? А звучит то мощно!
Удалить приложение Pico TTS в принципе как бэ можно, однако лучше его заморозить. Потом, если вы убедитесь, что оно вам стопудово не нужно и не пригодиться в будущем, то потом уже можно удалить. Для заморозки и удаления советую приложение Titanium Backup (учтите, что для этого нужны рут-права).
Вот еще читаю, что качество Pico TTS не очень, и что приложение не развивается и присутствует в Андроиде тупо для галочки..
Если вам в принципе нужно отключить преобразование текста в речь, то нужно пойти в настройки > голосовой ввод и вывод > преобразование текста в речь > снять там все галочки
Правда это или нет я не знаю, однако один чел написал сообщение, что он лично удалять Pico TTS не стал. Говорит что на одном телефоне удалил Pico TTS, после чего, какой бы он синтезатор речи не поставил, то ни один не работал. Правда это или бред? Не знаю. Но сообщение такое на андроидном форуме я нашел, решил что стоит и вам эту инфу передать.
Вот нашел картинку, это настройка, где можно выбрать TTS:
Как видите есть даже и Samsung TTS А вот кстати почти такая же картинка, но тут есть SVOX Classic TTS:
То есть синтезаторы могут быть разные, но Pico TTS идет типа как встроенный, а другие можно самостоятельно поставить.
А вот эта картинка, это тоже настройки, но видимо уже на планшете, и тут все почти также:
TTS выбирается в разделе Язык и ввод
Ну вот и все ребята, я вроде все сказал, что такое Pico TTS теперь вы знаете, верно? А значит моя задача успешно выполнена. Напоследок скажу берегите себя и удачи!
Экранный диктор для Андроид или смартфон для незрячего
Для незрячих и слабовидящих пользователей устройств на системе Android основным источником информации о происходящем на экране является синтезатор речи. До тех пор, пока поддержка тактильных дисплеев не будет окончательно разработана и отлажена, TTS (text to speech) имеет большое значение для пользователей с особыми потребностями.
Выбор русскоязычного синтезатора речи
Для ОС Android выпущено много синтезаторов речи, однако поддержка русского языка обеспечена далеко не у всех. Основная проблема – многоязычные тексты, с которыми некоторым голосовым движкам трудно справиться. Рассмотрим основные TTS системы.
Acapela TTS Voices
Один из самых популярных мультиязычных синтезаторов речи от Acapela Group доступен и для Android. Для синтезированных голосов характерно высокое качество речи и хорошая стабильность работы.
Движок Acapela TTS Voices можно без проблем найти и установить из Play Market. Программа бесплатная, но после ее первого запуска будет предложено купить и установить русский голос «Alyona» стоимостью 3,99 €.
SVOX Classic TTS
На втором месте среди коммерческих движков стоит SVOX Classic TTS. Синтезированная речь неплохого качества, но программа иногда не распознает заглавные латинские буквы. Также возникают вопросы в чтении цифр.
На Play Market есть бесплатная триальная версия русского голоса, которую можно свободно загрузить и протестировать в течение 2 недель.
eSpeak
Благодаря группе Eyes-Free Project на ОС Android, начиная с версии 1.6, был портирован кроссплатформенный Open-Source синтезатор eSpeak, поддерживающий русский язык. По сравнению с коммерческими программами, скорость и качество речи не сильно велики, но вполне приемлемы.
Первоначальная настройка
Установив TTS, нужно произвести его первоначальные настройки. Идем в такой последовательности:
Далее выбираем движок по умолчанию и выставляем желаемую скорость произношения. Запускаем приложение, проверяем чтение образца текста в боксе. С помощью ползунков выставляем дополнительные опции.
Использование экранного диктора
Функции программы TalkBack:
В своей работе утилита использует интерфейс TTS, установленный в системе по умолчанию. И хотя TalkBack уже относится к системным программам, она все же имеет один недостаток – для первоначальной активации нужен визуальный контроль, поэтому позаботьтесь о присутствии друга или члена семьи при первом знакомстве с приложением!
Управление Android-устройством с помощью TalkBack
Для девайсов с Android 4.0 и старше возможно управление с помощью прослушивания элементов экрана, которые находятся непосредственно под пальцем при его движении. Для этого в настройках TalkBack следует включить опцию «Изучение касанием».
После включения запустится демонстрационный ролик в двух частях, позволяющий обучиться:
После обучения управление Android-устройством на ощупь обычно не вызывает затруднений:
Подытоживая можно отметить: при правильно выбранной начальной настройке системы работа с устройствами под ОС Android для слабовидящих или слепых пользователей не сильно отличается от работы в стандартном режиме.
Русский язык для pico tts. Обзор синтезаторов речи для андроид. Синтез речи от Google
Всем привет. В сегодняшнем выпуске мы поговорим о программе Pico TTS, которую можно встретить на Андроид-девайсе. Итак, что это за программа? Что она делает, для чего она? Все эти вопросы сегодня будут рассмотрены мной, не сомневайтесь. Постараюсь все написать простым человеческим языком =)
Итак, вот первые данные. Pico TTS это приложение типа синтезатор речи, при помощи этого приложения можно озвучивать текст. Однако есть один мощный косяк, это то, что в Pico TTS нет русского языка. Кстати в альтернативном синтезаторе Google Text-to-Speech русский язык есть!
Кстати TTS расшифровывается как Text To Speech, что в свою очередь переводится как Текст В Речь =)
Но вообще зачем нужен синтезатор речи? Он позволяет озвучивать текст в приложениях. Вот к примеру синтезатор Google Text-to-Speech может озвучивать текст в гугловском переводчике, в TalkBack, или в каких-то приложениях, которые используют синтез речи. Хм, синтез речи? А звучит то мощно!
Удалить приложение Pico TTS в принципе как бэ можно, однако лучше его заморозить. Потом, если вы убедитесь, что оно вам стопудово не нужно и не пригодиться в будущем, то потом уже можно удалить. Для заморозки и удаления советую приложение Titanium Backup (учтите, что для этого нужны рут-права).
Вот еще читаю, что качество Pico TTS не очень, и что приложение не развивается и присутствует в Андроиде тупо для галочки.. =(
Если вам в принципе нужно отключить преобразование текста в речь, то нужно пойти в настройки > голосовой ввод и вывод > преобразование текста в речь > снять там все галочки =)
Правда это или нет я не знаю, однако один чел написал сообщение, что он лично удалять Pico TTS не стал. Говорит что на одном телефоне удалил Pico TTS, после чего, какой бы он синтезатор речи не поставил, то ни один не работал. Правда это или бред? Не знаю. Но сообщение такое на андроидном форуме я нашел, решил что стоит и вам эту инфу передать.
Вот нашел картинку, это настройка, где можно выбрать TTS:
Как видите есть даже и Samsung TTS =) А вот кстати почти такая же картинка, но тут есть SVOX Classic TTS:
То есть синтезаторы могут быть разные, но Pico TTS идет типа как встроенный, а другие можно самостоятельно поставить.
А вот эта картинка, это тоже настройки, но видимо уже на планшете, и тут все почти также:
TTS выбирается в разделе Язык и ввод =)
Ну вот и все ребята, я вроде все сказал, что такое Pico TTS теперь вы знаете, верно? А значит моя задача успешно выполнена. Напоследок скажу берегите себя и удачи!
Для повседневного использования требовались определенные усилия, а уж для мобильных платформ, в первую очередь Android, они подходили лишь в связке с персональным компьютером, заставляя перегонять текст в звук, чтобы позднее воспроизводить стандартным Mp3 плеером на конечном устройстве.
Некоторую надежду на прогресс, как это часто бывает, дарила корпорация добра Google, см. наш материал:
. До недавнего времени максимум возможностей, предоставляемых поисковым гигантом, сводился к онлайн работе с их синтезатором. Результат, откровенно говоря, не был чем-то революционным. С примером работы Google API TTS вы можете ознакомиться на с общей информацией о Клубе.
Существовало и еще несколько решений, заточенных непосредственно под использование со смартфонами:
Запись получена через стандартную программу для fb2 FBReader с подключенным модулем чтения Даже если вы не воспринимаете компьютерную речь в контексте озвучивания книг, это решение позволит вам апгрейдить своего мобильного друга. Гугль навигация начнет читать вам названия улиц, специальные приложения смогут озвучивать текст СМС и номера при входящих звонках.
Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.
В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.
Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.
Для удобства разделим движки TTS на три класса:
Коммерческие движки
SVOX Mobile TTS
Свободные движки
Flite
Встроенные решения
Symbian
Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.
Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти
Экранный диктор для Андроид или смартфон для слабовидящего или незрячего человека
Программное обеспечение синтезатора речи выглядит в виде приложения, которое обеспечивает перевод текстовой информации в голосовую.
Большое разнообразие данной продукции не перестает удивлять пользователей, предлагаю подробно рассмотреть самые популярные.
Классификация приложений
Уже разработано и выпущено большое количество синтезаторов речи, с их помощью одно удовольствие не только воспринимать зрительно полезную информацию, но и слышать.
Данные программы делятся на два вида: платные и бесплатные.
Те программы, которые «шаровые» имеют более скудный арсенал возможностей, но тоже подлежат к использованию, с платными версиями дела обстоят повеселее, их обширность не знает предела.
Русскоязычные синтезаторы речи
Для таких операционных систем как Android, есть очень много вариантов синтезаторов речи, но большинство из них не имеют русскоязычных версий.
Рассмотрим несколько самых популярных экранных дикторов:
Данная программа разработана для Android. Обладает высокими показателями синтеза речи, многоязычная, насчитывает 25 разных языков, в том числе и русифицирована.
Разработчиками является Acapela Group S.A.. Примерная стоимость составляет 4 евро.
Мультиязычный синтезатор речи, который не является коммерческим. Обработка информации на 37-ми языках, озвучка хорошая есть много вариантов голосов.
Работает на нескольких операционных системах Linux, Mac OS, Microsoft Windows и RISC OS. Для правильного голосового воспроизведения, был разработан расширенный словарь.
Из-за некоммерческой деятельности программа работает немного хуже, чем платные приложения, но в планах у разработчиков есть идеи для улучшения работоспособности.
Настройка TTS
Первоначально необходимо определиться, какой из синтезаторов речи подходит больше всего. Скачать и установить приложение, после чего перейти к настройкам TTS. Разберем пошаговую инструкцию:
Когда все параметры выставлены, по необходимости, можно приступать к эксплуатации.
TalkBack — это стандартный утилит, который обычно встроен в ОС Android. Данная функция была разработана для людей с проблемным зрением, слабовидящие люди благодаря TalkBack, могут пользоваться гаджетами без особых проблем.
При первоначальном запуске программы можно воспользоваться инструкцией. В экранном дикторе очень обширные настройки. Во всех устройствах, на разных видах прошивки, есть небольшие отличия настроек сервиса.
Основными возможностями TalkBack считаются:
Это основные возможности, но есть и большое разнообразие второстепенных.
TalkBack — незаменимое приложение для людей, которые утратили возможность видеть, пользоваться теми же устройствами, что и зрячие
Для слабовидящих это настоящая находка. Людям с полноценным зрением данное приложение не будет удобным, оно может раздражать, и замедлять процесс работы на устройстве.
Человеку, который не может ничего видеть, будет достаточно сложно настроить программу самостоятельно, поэтому лучше всего обратиться за помощью к окружающим людям.
Для гаджетов, работающих на Android, есть возможность голосовой помощи в управлении. TalkBack произносит все иконки, на которые можно кликать пальцем, или просто во время передвижения по экрану.
В этом помогает функция «Изучение при касании». Есть подробная инструкция, как именно пользоваться этой функцией.
После ознакомления с инструкций, у пользователей не возникает проблем с работой в устройстве.
Для того, чтобы выбрать нужную иконку и активировать элемент, достаточно нажать пальцем на значок, при этом произойдет воспроизведение голосовой подсказки. Так же удобства придает скроллинг, сопровождение которого происходит разной тональности.
Видео: Acapela Tts Voices для Android
Заключение
Разобравшись с работой и функционалом экранных дикторов, можно сделать следующие выводы:
Nuance VocalizerEx TTS Milena Rus – это система озвучивания текста голосом, которую ты можешь скачать бесплатно, является полноценным синтезатором речи для Андроид.
Твои SMS, текстовые файлы, книги и имена абонентов, которые тебе звонят, с помощью данного приложения для Андроид смогут быть озвучены красивым и правильным женским голосом Милена. Приложение Вокалайзер работает не только с телефонами и планшетами, поддерживающими технологию TTS, но и с таким приложениями, как:
Как установить синтезатор речи для Андроид – Nuance VocalizerEx TTS Milena Rus?
Обзор мобильных Text-To-Speech движков
Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.
В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.
Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.
Коммерческие движки
SVOX Mobile TTS
Цена: n/a
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW
Возможность разработки коммерческих продуктов: есть
Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт — SVOX Mobile TTS. Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.
Acapela TTS
Цена: 2800€ плюс так называемая run-time license, за которую в самом лучшем случае придется платить по 49€ за каждое распространенное приложение
Языки: 23, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS
Возможность разработки коммерческих продуктов: есть
Сотрудники Acapela Group оказались намного более общительными и ответили буквально через полчаса после заполнения вот этой заявки.
Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт. Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.
Отмечу, что Acapela предоставляет «облачный» синтез речи, а так-же портирование SDK под любую платформу.
Loquendo Embedded TTS
Цена: 3000€ плюс проценты с каждого проданного Вами мобильного приложения
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS, Maemo, Moblin, MeeGo, PalmOS
Возможность разработки коммерческих продуктов: есть
Движок Loquendo обладает специальными тегами, позволяющими делать речь более естественной, подмешивая такие не совсем «речевые» фишки как кашель, смех и прочее.
Их движок отвечает спецификации SSML 1.0 рекомендованной W3C.
Sakrament TTS
Цена: 1500€ для одной ОС, при покупке пакета сразу для двух языков предоставляется скидка в размере 25%, что составляет 2250€
Языки: английский, русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Symbian, Windows Mobile
Возможность разработки коммерческих продуктов: есть
Качества синтеза речи Sakrament TTS вполне достаточно, что бы озвучивать короткие фразы типа номеров телефонов или названий приложений. Описание всех версий SDK можно получить здесь.
Свободные движки
Flite
Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)
В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile, PalmOS, Android и iOS.
eSpeak
Цена: нет
Языки: 39, включая русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Android, Windows CE/Windows Mobile
Возможность разработки коммерческих продуктов: нет (GNU GPL)
Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить здесь.
eSpeak портирован на Android. Самый простой способ его попробовать — это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.
Встроенные решения
Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).
Symbian
Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его документации ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.
Дополнительные языковые пакеты можно загрузить здесь, однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.
Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти здесь.
Android
Цена: нет
Языки: английский, французский, немецкий, итальянский, испанский
Субъективная оценка качества звучания: среднее
Возможность разработки коммерческих продуктов: есть
Встроенная функциональность синтеза речи в Android доступна с версии 1.6. Прекрасное введение в тему можно найти в блоге разработчиков. Android TTS API является не чем иным, как оберткой над SVOX Pico, русский язык, которым, к сожалению, не поддерживается.
Заключение
Выводы каждому придется делать в зависимости от требований к разрабатываемому продукту. Для коммерческих решений крайне важно качество синтеза речи, поэтому выбирать стоит из двух движков – Acapela TTS и Loquendo Embedded TTS. При выборе движка для open source проекта крайне важную роль будет играть список целевых ОС.
Лично для себя я выбрал eSpeak, поскольку мой проект академического толка и я могу себе позволить использование продукта лицензированного по GNU GPL.