[Приложение] Tell.exe

Разработка дополнительных модулей, подключение различных приложений.

Модератор: immortal

Аватара пользователя
Bagir
Сообщения: 1613
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Программа читает текст, проигрывает звук и распознает ре

Сообщение Bagir » Пт янв 09, 2015 4:10 am

Обновил архив Tell.zip
1. Настройки сервера, утилит sox и flac вынесены в файл tell.ini и теперь могут быть изменены.
2. Ранее текст передавался в метод commandReceived, теперь используется вариант command.php?qry=текст
3. Добавлен параметр командной строки для начала записи и распознавания.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Аватара пользователя
Bagir
Сообщения: 1613
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Программа читает текст, проигрывает звук и распознает ре

Сообщение Bagir » Сб янв 10, 2015 9:46 pm

Еще маленькое обновление. Отправка пакета sNULL при тишине теперь вынесена в ini файл и по умолчанию отключена.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Аватара пользователя
Bagir
Сообщения: 1613
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Получить api-keys Гугла

Сообщение Bagir » Пн янв 12, 2015 2:28 am

Моя программа для распознавания речи использует api Гугла. Но с не столь давних времен, Гугл закрыл свои api1 и теперь работает только api2. Но пользовать можно только указав ключ. Ключ этот можно получить бесплатно. Я помню, что обещал подробную инструкцию как это сделать, но вот сам забыл чего да как ))
Сейчас, изрядно покопавшись в своей истории браузера, я нашел нужные ссылки. Но увы, ту самую, где было по шагам все расписано я не нашел.
Давайте пробовать. К первопроходцем будет просьба дополнить пошаговое описание.
Вот тут можно прочитать про все это на буржуйском.
А вот тут весьма неплохо описан сам процесс регистрации. Приведу цитату с этого сайта:
Получить API ключ довольно просто (хотя и не тривиально). Необходимо залогиниться под своей учетной записью, зайти на консоль разработчиков, создать новый проект. Перейти слева в раздел APIs и попытаться найти там Speech API. Когда вы его там в списке не нашли, заходим в группу Chromium Dev, вступаем в нее. Снова обновляем страничку APIs, видимо, что Speech API там появился. Радостно включаем его. Google говорит нам, что у нас есть 50 запросов в сутки, но мы ему не верим, ибо это не правда. Скорее всего после релиза бесплатно будет доступно 50-500 запросов, остальное за деньги. А пока можно наслаждаться халявой (подсказывают в тырнетах что 500 запросов в день).
API-key создается в Creditionals -> Create new Key -> Server key -> Create. Все. Ключ готов.
Еще стоит добавить, что я сам лично зарегистрировался на совою гугловскую почту. Если не будите афишировать свой ключик в Интернете, то думаю что в этом нет ничего страшного.
При регистрации где то будет галочка, означающая, что мы хотели бы получать письма от разработчиков. Я не предал ей особого внимания, и не снял ее. После этого, письма валили кучами и днем и ночью. Хорошо хоть почта гугла складывала их в одну группу. Письма этого сообщества все на буржуйском, и для нас не представляют интереса.
Отключить можно и потом. Нужно зайти в группы на своем аккаунте и отписаться. Вот гуглвская ссыль для входа в свои группы.
Не знаю как вы, но мне кажется, то у Гугла с этими ссылками немного напряжно. Как то у меня плохо получается зайти на главную страничку и путешествовать по разным места. Вместо этого я держу все нужные ссылки на панели, и перехожу по ним. Ну это уж кому как удобнее.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Аватара пользователя
Amarok
Сообщения: 1425
Зарегистрирован: Пт дек 14, 2012 12:24 pm
Откуда: Россия, Нижняя Тура
Благодарил (а): 460 раз
Поблагодарили: 126 раз
Контактная информация:

Re: Программа читает текст, проигрывает звук и распознает ре

Сообщение Amarok » Пн янв 12, 2015 5:33 am

А что с офф-лайн расспознаванием?
Алиска живёт на Ubuntu Server 14.04.3 LTS
connect, группа в Telegram, Яндекс.Деньги для благодарностей за помощь: 41001355945165
Аватара пользователя
Bagir
Сообщения: 1613
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Программа читает текст, проигрывает звук и распознает ре

Сообщение Bagir » Вт янв 13, 2015 3:56 pm

BlackWarrior писал(а):А что с офф-лайн расспознаванием?
Глухо как в танке, ибо не кто не хочет помогать. Я пробовал разные варианты, но они все были бестолковые. Но надо. очень бы надо. Отсутствие этой запчасти убивает всю идею.
А еще надо более правильно настроить sox на запись звука. Сейчас у меня вариант с немедленным началом записи и до паузы в 2 секунды. Работает, но все же интересней был вариант с записью звука тоже после паузы. Пример тут есть, но у меня он отрывает самое начало записи, и это очень плохо сказывается на распознавании.

Еще было бы ну ооочень полезно анализировать записанный файл на полную тишину перед отправкой его в Гугл. И если звука нет, то и нечего его отправлять. Все же корпорация добра обещает только 50 запросов в сутки, хоть пока что работает и до 500. Но при диалоге вопрос-ответ этот счетчик довольно быстро крутится.

Почистить шум на основе своего файла с записанным шумом на этом же микрофоне.

Может кто нибудь хоть немного знает sox? А то изучение этой диковинки методом тыка и гугловым переводом английских сайтов движется у меня весьма затруднительно.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Аватара пользователя
Bagir
Сообщения: 1613
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Программа читает текст, проигрывает звук и распознает ре

Сообщение Bagir » Вт янв 13, 2015 10:48 pm

Друзья! Я таки нашел версию sox с поддержкой flac под винды. Голову сломал почему не работает. Спасибо одному доброму человеку.
This answer may be a bit late, but you want version 14.4.1a (available here). FLAC was disabled accidentally in 14.4.1 which is still the default on SourceForge.
Как он пишет, что поддержку flac случайно удалили из версии 14.4.1 которой сейчас забит весь Интернет.
Вообщем вот поставьте ответившему человеку плюсик пожалуйста кто может, а то там закрытая вечеринка.
Скачать sox 14.4.1a можно тут
Сегодня добавлю в свою программу и обновлю. Качество записи сразу во flac намного лучше, чем переконвертированный файл. Предвкушаю улучшения качества распознавания. И еще я нашел как сделать фильтр на фоновый шум.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Аватара пользователя
Bagir
Сообщения: 1613
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Программа читает текст, проигрывает звук и распознает ре

Сообщение Bagir » Ср янв 14, 2015 1:36 am

Обновлен архив Tell.exe
Файлы старой программы можно полностью удалить. В этом архиве содержится все что нужно. Новая версия sox теперь сама умеет работать с форматом flac. Файлы с микрофона сразу пишутся в этом формате с частотой 48000Hz и Гугл их отлично есть. Это позволило немного сократить время на обработку и повысить качество распознавания.
В ini файле можно настроить дополнительные параметры.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Аватара пользователя
Amarok
Сообщения: 1425
Зарегистрирован: Пт дек 14, 2012 12:24 pm
Откуда: Россия, Нижняя Тура
Благодарил (а): 460 раз
Поблагодарили: 126 раз
Контактная информация:

Re: Программа читает текст, проигрывает звук и распознает ре

Сообщение Amarok » Ср янв 14, 2015 8:24 am

Bagir писал(а):
BlackWarrior писал(а):А что с офф-лайн расспознаванием?
Глухо как в танке, ибо не кто не хочет помогать. Я пробовал разные варианты, но они все были бестолковые. Но надо. очень бы надо. Отсутствие этой запчасти убивает всю идею.
А если привинтить для этого библиотеки гугла? Андроиды ведь распознают без инета
Алиска живёт на Ubuntu Server 14.04.3 LTS
connect, группа в Telegram, Яндекс.Деньги для благодарностей за помощь: 41001355945165
Аватара пользователя
Bagir
Сообщения: 1613
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Программа читает текст, проигрывает звук и распознает ре

Сообщение Bagir » Ср янв 14, 2015 1:16 pm

Да был бы понятный пример. Прога моя на VB6 написана. Работает очень стабильно. висит в режиме сервера приема сообщений неделями пока сам не закроешь. С библиотеками работать там просто, но нужно описание библиотеки. А лучше пример. Но я пока не нашел.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Аватара пользователя
Bagir
Сообщения: 1613
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Программа читает текст, проигрывает звук и распознает ре

Сообщение Bagir » Ср янв 14, 2015 1:25 pm

Так то по сути распознавание ключевого слова - полностью отдельная задача, которую можно поручить совершенно другому приложению, и все это потом удачно обыграть в МД.
Некая прога распознает ключевое слово и сообщает МД
Алиса здоровается и кидает моей проге команду начать диалог. Дальше уже все по протоптанной тропинке. Тут даже мультирум уже не проблема.
Конечно, если получится научить прогу слушать микрофон и распознавать Имя, будет большой плюс. Но стоит учесть, что прога висит на сервере, а какой то из микрофонов может быть где угодно. Например в другой комнате. Впрочем нет большой проблемы собрать там простенький компик из утиля для этого. Или же писать звук на стороне клиента, и отправлять проге. Если кому это понадобится раньше чем мне, пишите, чего нибудь придумаем.
За это сообщение автора Bagir поблагодарил:
Amarok (Ср янв 14, 2015 1:45 pm)
Рейтинг: 1.16%
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Закрыто