[Приложение] Tell.exe
Модератор: immortal
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Программа читает текст, проигрывает звук и распознает ре
Обновил архив Tell.zip
1. Настройки сервера, утилит sox и flac вынесены в файл tell.ini и теперь могут быть изменены.
2. Ранее текст передавался в метод commandReceived, теперь используется вариант command.php?qry=текст
3. Добавлен параметр командной строки для начала записи и распознавания.
1. Настройки сервера, утилит sox и flac вынесены в файл tell.ini и теперь могут быть изменены.
2. Ранее текст передавался в метод commandReceived, теперь используется вариант command.php?qry=текст
3. Добавлен параметр командной строки для начала записи и распознавания.
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Программа читает текст, проигрывает звук и распознает ре
Еще маленькое обновление. Отправка пакета sNULL при тишине теперь вынесена в ini файл и по умолчанию отключена.
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Получить api-keys Гугла
Моя программа для распознавания речи использует api Гугла. Но с не столь давних времен, Гугл закрыл свои api1 и теперь работает только api2. Но пользовать можно только указав ключ. Ключ этот можно получить бесплатно. Я помню, что обещал подробную инструкцию как это сделать, но вот сам забыл чего да как ))
Сейчас, изрядно покопавшись в своей истории браузера, я нашел нужные ссылки. Но увы, ту самую, где было по шагам все расписано я не нашел.
Давайте пробовать. К первопроходцем будет просьба дополнить пошаговое описание.
Вот тут можно прочитать про все это на буржуйском.
А вот тут весьма неплохо описан сам процесс регистрации. Приведу цитату с этого сайта:
При регистрации где то будет галочка, означающая, что мы хотели бы получать письма от разработчиков. Я не предал ей особого внимания, и не снял ее. После этого, письма валили кучами и днем и ночью. Хорошо хоть почта гугла складывала их в одну группу. Письма этого сообщества все на буржуйском, и для нас не представляют интереса.
Отключить можно и потом. Нужно зайти в группы на своем аккаунте и отписаться. Вот гуглвская ссыль для входа в свои группы.
Не знаю как вы, но мне кажется, то у Гугла с этими ссылками немного напряжно. Как то у меня плохо получается зайти на главную страничку и путешествовать по разным места. Вместо этого я держу все нужные ссылки на панели, и перехожу по ним. Ну это уж кому как удобнее.
Сейчас, изрядно покопавшись в своей истории браузера, я нашел нужные ссылки. Но увы, ту самую, где было по шагам все расписано я не нашел.
Давайте пробовать. К первопроходцем будет просьба дополнить пошаговое описание.
Вот тут можно прочитать про все это на буржуйском.
А вот тут весьма неплохо описан сам процесс регистрации. Приведу цитату с этого сайта:
Еще стоит добавить, что я сам лично зарегистрировался на совою гугловскую почту. Если не будите афишировать свой ключик в Интернете, то думаю что в этом нет ничего страшного.Получить API ключ довольно просто (хотя и не тривиально). Необходимо залогиниться под своей учетной записью, зайти на консоль разработчиков, создать новый проект. Перейти слева в раздел APIs и попытаться найти там Speech API. Когда вы его там в списке не нашли, заходим в группу Chromium Dev, вступаем в нее. Снова обновляем страничку APIs, видимо, что Speech API там появился. Радостно включаем его. Google говорит нам, что у нас есть 50 запросов в сутки, но мы ему не верим, ибо это не правда. Скорее всего после релиза бесплатно будет доступно 50-500 запросов, остальное за деньги. А пока можно наслаждаться халявой (подсказывают в тырнетах что 500 запросов в день).
API-key создается в Creditionals -> Create new Key -> Server key -> Create. Все. Ключ готов.
При регистрации где то будет галочка, означающая, что мы хотели бы получать письма от разработчиков. Я не предал ей особого внимания, и не снял ее. После этого, письма валили кучами и днем и ночью. Хорошо хоть почта гугла складывала их в одну группу. Письма этого сообщества все на буржуйском, и для нас не представляют интереса.
Отключить можно и потом. Нужно зайти в группы на своем аккаунте и отписаться. Вот гуглвская ссыль для входа в свои группы.
Не знаю как вы, но мне кажется, то у Гугла с этими ссылками немного напряжно. Как то у меня плохо получается зайти на главную страничку и путешествовать по разным места. Вместо этого я держу все нужные ссылки на панели, и перехожу по ним. Ну это уж кому как удобнее.
- Amarok
- Сообщения: 1425
- Зарегистрирован: Пт дек 14, 2012 12:24 pm
- Откуда: Россия, Нижняя Тура
- Благодарил (а): 460 раз
- Поблагодарили: 126 раз
- Контактная информация:
Re: Программа читает текст, проигрывает звук и распознает ре
А что с офф-лайн расспознаванием?
Алиска живёт на Ubuntu Server 14.04.3 LTS
connect, группа в Telegram, Яндекс.Деньги для благодарностей за помощь: 41001355945165
connect, группа в Telegram, Яндекс.Деньги для благодарностей за помощь: 41001355945165
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Программа читает текст, проигрывает звук и распознает ре
Глухо как в танке, ибо не кто не хочет помогать. Я пробовал разные варианты, но они все были бестолковые. Но надо. очень бы надо. Отсутствие этой запчасти убивает всю идею.BlackWarrior писал(а):А что с офф-лайн расспознаванием?
А еще надо более правильно настроить sox на запись звука. Сейчас у меня вариант с немедленным началом записи и до паузы в 2 секунды. Работает, но все же интересней был вариант с записью звука тоже после паузы. Пример тут есть, но у меня он отрывает самое начало записи, и это очень плохо сказывается на распознавании.
Еще было бы ну ооочень полезно анализировать записанный файл на полную тишину перед отправкой его в Гугл. И если звука нет, то и нечего его отправлять. Все же корпорация добра обещает только 50 запросов в сутки, хоть пока что работает и до 500. Но при диалоге вопрос-ответ этот счетчик довольно быстро крутится.
Почистить шум на основе своего файла с записанным шумом на этом же микрофоне.
Может кто нибудь хоть немного знает sox? А то изучение этой диковинки методом тыка и гугловым переводом английских сайтов движется у меня весьма затруднительно.
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Программа читает текст, проигрывает звук и распознает ре
Друзья! Я таки нашел версию sox с поддержкой flac под винды. Голову сломал почему не работает. Спасибо одному доброму человеку.
Вообщем вот поставьте ответившему человеку плюсик пожалуйста кто может, а то там закрытая вечеринка.
Скачать sox 14.4.1a можно тут
Сегодня добавлю в свою программу и обновлю. Качество записи сразу во flac намного лучше, чем переконвертированный файл. Предвкушаю улучшения качества распознавания. И еще я нашел как сделать фильтр на фоновый шум.
Как он пишет, что поддержку flac случайно удалили из версии 14.4.1 которой сейчас забит весь Интернет.This answer may be a bit late, but you want version 14.4.1a (available here). FLAC was disabled accidentally in 14.4.1 which is still the default on SourceForge.
Вообщем вот поставьте ответившему человеку плюсик пожалуйста кто может, а то там закрытая вечеринка.
Скачать sox 14.4.1a можно тут
Сегодня добавлю в свою программу и обновлю. Качество записи сразу во flac намного лучше, чем переконвертированный файл. Предвкушаю улучшения качества распознавания. И еще я нашел как сделать фильтр на фоновый шум.
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Программа читает текст, проигрывает звук и распознает ре
Обновлен архив Tell.exe
Файлы старой программы можно полностью удалить. В этом архиве содержится все что нужно. Новая версия sox теперь сама умеет работать с форматом flac. Файлы с микрофона сразу пишутся в этом формате с частотой 48000Hz и Гугл их отлично есть. Это позволило немного сократить время на обработку и повысить качество распознавания.
В ini файле можно настроить дополнительные параметры.
Файлы старой программы можно полностью удалить. В этом архиве содержится все что нужно. Новая версия sox теперь сама умеет работать с форматом flac. Файлы с микрофона сразу пишутся в этом формате с частотой 48000Hz и Гугл их отлично есть. Это позволило немного сократить время на обработку и повысить качество распознавания.
В ini файле можно настроить дополнительные параметры.
- Amarok
- Сообщения: 1425
- Зарегистрирован: Пт дек 14, 2012 12:24 pm
- Откуда: Россия, Нижняя Тура
- Благодарил (а): 460 раз
- Поблагодарили: 126 раз
- Контактная информация:
Re: Программа читает текст, проигрывает звук и распознает ре
А если привинтить для этого библиотеки гугла? Андроиды ведь распознают без инетаBagir писал(а):Глухо как в танке, ибо не кто не хочет помогать. Я пробовал разные варианты, но они все были бестолковые. Но надо. очень бы надо. Отсутствие этой запчасти убивает всю идею.BlackWarrior писал(а):А что с офф-лайн расспознаванием?
Алиска живёт на Ubuntu Server 14.04.3 LTS
connect, группа в Telegram, Яндекс.Деньги для благодарностей за помощь: 41001355945165
connect, группа в Telegram, Яндекс.Деньги для благодарностей за помощь: 41001355945165
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Программа читает текст, проигрывает звук и распознает ре
Да был бы понятный пример. Прога моя на VB6 написана. Работает очень стабильно. висит в режиме сервера приема сообщений неделями пока сам не закроешь. С библиотеками работать там просто, но нужно описание библиотеки. А лучше пример. Но я пока не нашел.
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Программа читает текст, проигрывает звук и распознает ре
Так то по сути распознавание ключевого слова - полностью отдельная задача, которую можно поручить совершенно другому приложению, и все это потом удачно обыграть в МД.
Некая прога распознает ключевое слово и сообщает МД
Алиса здоровается и кидает моей проге команду начать диалог. Дальше уже все по протоптанной тропинке. Тут даже мультирум уже не проблема.
Конечно, если получится научить прогу слушать микрофон и распознавать Имя, будет большой плюс. Но стоит учесть, что прога висит на сервере, а какой то из микрофонов может быть где угодно. Например в другой комнате. Впрочем нет большой проблемы собрать там простенький компик из утиля для этого. Или же писать звук на стороне клиента, и отправлять проге. Если кому это понадобится раньше чем мне, пишите, чего нибудь придумаем.
Некая прога распознает ключевое слово и сообщает МД
Алиса здоровается и кидает моей проге команду начать диалог. Дальше уже все по протоптанной тропинке. Тут даже мультирум уже не проблема.
Конечно, если получится научить прогу слушать микрофон и распознавать Имя, будет большой плюс. Но стоит учесть, что прога висит на сервере, а какой то из микрофонов может быть где угодно. Например в другой комнате. Впрочем нет большой проблемы собрать там простенький компик из утиля для этого. Или же писать звук на стороне клиента, и отправлять проге. Если кому это понадобится раньше чем мне, пишите, чего нибудь придумаем.
- Рейтинг: 1.16%