Менестрель - читалка российских электронных книжек голосом на Линукс и кросс-платформенная


Рубрика: Новости Linux
Метки:
Просмотров: 11307

Менестрель - читалка российских электронных книжек голосом на Линукс и кросс-платформенная

Целью проекта является создание утилиты чтения и озвучивания электронных, в основном художественных, книжек.

Очень хочется претворить в жизнь кросс-платформенную версию, однако применение SAPI в Windows в этом не содействует, однако кросс-платформенность Festival дает на это чаяния.

Проект реализован с использованием библиотеки QT 4.7 и использует ряд кросс-платформенных открытых и свободных утилит, таких как sox, antiword, unzip, lame. Все это дает возможность сделать текст, единый как для Линукс, так и для Windows на С++. Менестрель- утилита предназначенная для озвучки разных текстов по большей части на русском языке и имеющая графический интерфейс. Тексты предполагаются художественного содержания. В Windows этих программ не мало, однако для Линукс на русском языке и для чтения российских книжек я так и не встретил. Мне кажется, что эта утилита I-я подобного рода для Линукс.


Лирическое отступление:

SAPI имеет достаточно специфический интерфейс, в отличии от простейшего коммандного интерфейся, который в т.ч. есть в Festival, что дает возможность большему числу девелоперов в большем количестве приложений применять TTS- интерфейс. Это возможно определить следующей метафорой:

Британский лук и дробовик в сложности изготовления и дальности прицельной стрельбы приблизительно идентичны, однако чтоб уметь неплохо стрелять из английского лука, нужно затратить 5 лет, а чтоб научиться стрелять из дробовика- довольно 3-х суток.

В Windows довольно немало всевозможных программ- говорилок с использованием SAPI с бесплатными и платными русскими голосами. Есть утилиты для Windows и от беларусской компании Sacrament с достаточным количеством голосов и с своим движком и интерфейсом.

Утилита называлась "Рассказчiк". Есть и мобильные версии этой утилиты. Мне эта утилита понравилась в использовании- в ней есть возможность открывать несколько видов текстовых файлов, при прочтении, подсвечиваются читаемые участки текста, возможно установить закладки по тексту (неограниченное количество) и осуществлять переходы на закладки. После закрытия утилиты и ее открытия ч/з некоторое время - текст открывается в месте предыдущей остановки, и озвучка производится с того же места. Все это мне показалось удобным и захотелось отыскать нечто похожее в Линукс и по русски, лучше. Как оказалось, ничего такого по какой-то причине не находилось ни в платном, ни в бесплатном сегменте. Нашлись лишь 3 голосовых движка, имеющих русские голоса- Espeak, ru-tts и Festival. Отталкиваясь от этого и захотелось сделать на базе подходящих TTS-движков что-то похожее по функциональности вышеописанной программе.

А сейчас поговорим о качестве голосов

Английских голосов хорошего качества достаточно немало, а вот с русскими все трудно. Ни 1 из рассийских голосов полноценно не интонирует, впрочем и делают это в разной степени.

В Windows бесплатные голоса имеют качество- определяемое лишь ненормативной лексикой и применять их весьма трудно, лишь в крайней потребности их возможно применять. В платных системах (Djigalo и Sacrament) голоса существенно лучше и при привыкании ими даже условно-комфортно пользоваться, они в разной степени интонированы, однако ни 1 не поддерживает воросительную и восклицательную интонациию. В мобильных системах просутствует на WINMOBILE и Symbiane лишь Sacrament с собственными голосами, с неплохими, однако отнюдь не лучшими, а вот на Android есть весьма хороший российский женский голос, практически совершенный. Естественное качество синтеза, неплохо и довольно конечно интонированный, единственно лишь не выделяет интонацией восклицательные и вопросительные предложения.

А сейчас рассмотрим Линукс

Найденные движки с русскими голосами все бесплатные. Платный движок лишь 1- тот же Sacrament, с теми же голосами, однако по какой-то причине неподъемно дорого, по этой причине я остановился на 3-х бесплатных.

Espeak хоть и имеет весьма хорошие голоса на различных языках - российский у него просто жуткий, хуже бесплатных из Windows, потому я от него отказался

ru_tts монолитный, неприхотливый, достаточно быстрый, однако по качеству слегка хуже "Николая" из Djigalo, имеет собственный словарь ударений. Принимает текст из стандартного входного потока в кодировке KOI-8r и результат отправляет в стандартный выходной поток, представляющий из себя звуковой полуфабрикат в RAW формате. Движок и голос совмещены. Лишь российский и более ничего.

Festival с голосом msu_ru_nsh_clunits. Достаточно качественный, довольно неплохо интонированный, кросплатформенный. Принимает текст в кодировке UTF-8, как из файла, так и из входного потока. Озвучивать может как именно в звуковую систем, так и в wav-файл. Однако он имеет и недочеты. Качество у него имеет оборотную сторону- небольшую скорость преобразования текста. Текст перед озвучкой нужно обрабатывать- так как любые знаки, за исключением букв, цифр и знаков препинания приводят российский festival в ступор и отдельные комбинации дозволенных знаков так же может вызвать ступор. Этих проблем нет у иных движков и даже у Festival у иных, не рассийских дикторов.

Графические утилиты Линукс

Kttsd, Jovie, KMOUTH и иные аналогичные утилиты в общем так себе удобны для целей чтения художественных произведений, да и за исключением Кttsd не совсем совместимы с выбранными движками, а Kttsd лишь для KDE 3.x.

На SOURCEFOFGE я отыскал проект "Голос", который пока не готов к работе, однако он натолкнул меня на то, что я сам могу требуемый продукт сделать, т.к. без разницы в QT4 на Qt-Creator я делаю всяческие программы для системного менеджмента, BACKUP и т.д.

Так и возник данный проект и несколько его модификаций: Менестрель, Менестрель Демон, Скоморох.

Описания: - ТУТ 83

Тексты и бинарные модули: - ТУТ 83

Комментариев: 2 RSS

  • Комментариев: 2

  • Вконтакте

  • Facebook:

  •  RW | 16 августа 2011 в 15:30:23

    Все это хорошо, сам пробовал устанавливать. Но как то без особого успеха, хотелось бы инструкцию по самым успешным опытам.

    Что и в какой последовательности лучше ставить.

  •  BuxarNET | 5 сентября 2011 в 00:10:22

    Я ничего особого в этой проге по описанию не нашел, есть масса работающих аналогов, по этому не думаю что стоит заниматься разбором полетов по установке сего "чуда"

Оставьте комментарий!

grin LOL cheese smile wink smirk rolleyes confused surprised big surprise tongue laugh tongue rolleye tongue wink raspberry blank stare long face ohh grrr gulp oh oh downer red face sick shut eye hmmm mad angry zipper kiss shock cool smile cool smirk cool grin cool hmm cool mad cool cheese vampire snake excaim question

Используйте нормальные имена. Ваш комментарий будет опубликован после проверки.

Имя и сайт используются только при регистрации

Если вы уже зарегистрированы как комментатор или хотите зарегистрироваться, укажите пароль и свой действующий email. При регистрации на указанный адрес придет письмо с кодом активации и ссылкой на ваш персональный аккаунт, где вы сможете изменить свои данные, включая адрес сайта, ник, описание, контакты и т.д., а также подписку на новые комментарии.

Авторизация 

MaxSiteAuth.

(обязательно)