Простое оффлайн распознавание голоса на Windows

Использование системы в различных ситуациях, вопросы программирования сценариев.

Модератор: immortal

Ответить
TbIKBA
Сообщения: 21
Зарегистрирован: Пн фев 29, 2016 10:21 pm
Благодарил (а): 0
Поблагодарили: 3 раза

Простое оффлайн распознавание голоса на Windows

Сообщение TbIKBA » Сб ноя 05, 2016 3:02 am

Привет! У Microsoft есть своя платформа для распознавания голоса (которая используется в т.ч Kortana), называется Microsoft Speech Platform.

На ее основе сделана программа VoxCommando. Плюсы:
  • Распознает голос оффлайн
  • Есть возможность использовать фактор-слово для активации голосовой команды (программа ждет ключевое слово и выполняет только после его присутствия)
  • Довольно неплохо распознает
  • Легко интегрируется в Majordomo
Если у вас Win система, то как минимум стоит попробовать.
Очень подробная инструкция есть по этой ссылке, я устанавливал по ней дважды - https://www.youtube.com/watch?v=5od-SsxuiCw. Часть функционала программы платный, но стоит обратить внимание на архив под видео.

После установки стоит посмотреть видео с объяснением функционала - https://www.youtube.com/watch?v=2jIh0vrp3rA

Если кратко, то мы добавляем новое действие которое программа должна выполнить, и привязываем к нему фразы, которые мы для этого должны произнести.
Для интеграции с MD при добавлении действия я использовал функцию Scrape, она выполняет HTTP запрос. Соответственно, в первое поле пишем Scrape, во второе ссылку на нужный метод/сценарий.

Из моего опыта на текущий момент - сначала пробовал со стандартным микрофоном на ноутбуке и внешним дешевым Logithech микрофоном, все работает (при произнесении впритык). Сейчас купил активный микрофон Stelberry M-60, но столкнулся с проблемой - программа распознает в метре-полутора, по мере удаления почему-то перестает воспринимать звуковой сигнал, хотя проверял через наушники (и запись) - сигнал довольно сильный, голос читается четко. Может у кого-то есть опыт использования данного микрофона, если дело в нем - поделитесь пожалуйста. Как-то так, если будут вопросы - пишите.

Официальный сайт - voxcommando.com
Полная цена - 40$ (доступна бесплатная версия)
За это сообщение автора TbIKBA поблагодарил:
Amarok (Сб ноя 05, 2016 9:46 am)
Рейтинг: 1.16%
Bluefox
Сообщения: 9
Зарегистрирован: Пн авг 13, 2012 11:06 am
Благодарил (а): 0
Поблагодарили: 1 раз

Re: Простое оффлайн распознавание голоса на Windows

Сообщение Bluefox » Сб ноя 05, 2016 1:44 pm

Выглядит интересно. А может она передавать на URL распознанную фразу? С наскока не нашёл у них на сайте.
TbIKBA
Сообщения: 21
Зарегистрирован: Пн фев 29, 2016 10:21 pm
Благодарил (а): 0
Поблагодарили: 3 раза

Re: Простое оффлайн распознавание голоса на Windows

Сообщение TbIKBA » Сб ноя 05, 2016 9:46 pm

Да, можно использовать переменную LastSpoken
За это сообщение автора TbIKBA поблагодарил:
Amarok (Пн ноя 07, 2016 8:28 am)
Рейтинг: 1.16%
Аватара пользователя
Amarok
Сообщения: 1425
Зарегистрирован: Пт дек 14, 2012 12:24 pm
Откуда: Россия, Нижняя Тура
Благодарил (а): 460 раз
Поблагодарили: 126 раз
Контактная информация:

Re: Простое оффлайн распознавание голоса на Windows

Сообщение Amarok » Пн ноя 07, 2016 8:29 am

А для запуска в режиме ожидания пригодится ключ -standby
Алиска живёт на Ubuntu Server 14.04.3 LTS
connect, группа в Telegram, Яндекс.Деньги для благодарностей за помощь: 41001355945165
Аватара пользователя
Amarok
Сообщения: 1425
Зарегистрирован: Пт дек 14, 2012 12:24 pm
Откуда: Россия, Нижняя Тура
Благодарил (а): 460 раз
Поблагодарили: 126 раз
Контактная информация:

Re: Простое оффлайн распознавание голоса на Windows

Сообщение Amarok » Пн ноя 07, 2016 8:47 am

TbIKBA писал(а):Для интеграции с MD при добавлении действия я использовал функцию Scrape, она выполняет HTTP запрос. Соответственно, в первое поле пишем Scrape, во второе ссылку на нужный метод/сценарий.
Можно пример скрин с правильным указанием?
Алиска живёт на Ubuntu Server 14.04.3 LTS
connect, группа в Telegram, Яндекс.Деньги для благодарностей за помощь: 41001355945165
TbIKBA
Сообщения: 21
Зарегистрирован: Пн фев 29, 2016 10:21 pm
Благодарил (а): 0
Поблагодарили: 3 раза

Re: Простое оффлайн распознавание голоса на Windows

Сообщение TbIKBA » Пн ноя 07, 2016 10:41 pm

Amarok писал(а):Можно пример скрин с правильным указанием?
В правом поле ссылка на метод, включающий свет.

И, кстати, забыл написать! Для режима standby (ждать слово) можно задавать любое слово, соответственно, сохраняется ощущение, что мы продолжаем работать с Алисой
Вложения
vox.jpg
vox.jpg (84.09 КБ) 10037 просмотров
bat86
Сообщения: 80
Зарегистрирован: Пн ноя 30, 2015 10:20 pm
Благодарил (а): 25 раз
Поблагодарили: 6 раз

Re: Простое оффлайн распознавание голоса на Windows

Сообщение bat86 » Вт дек 20, 2016 11:01 am

Что-то я не втыкаю как это настроить...
Хочу сделать так, Говорю Алиса, и например включить свет
Хочу отправить GET запрос http://127.0.0.1:8089/command.php?qry={LastSpoken}

Соответственно мне надо, чтобы на Алиса активировалось распознавание, а следующий текст отправлялся в команды.
Сейчас отправляется только Алиса.

Хочется воспользоваться уже готовыми шаблонами, а не городить всё по новой

Помогите как это реализовать?
lysyy
Сообщения: 113
Зарегистрирован: Вт июн 09, 2015 9:41 pm
Откуда: Moscow
Благодарил (а): 15 раз
Поблагодарили: 9 раз

Re: Простое оффлайн распознавание голоса на Windows

Сообщение lysyy » Сб июн 24, 2017 12:57 am

Ребята, как автоматизировать установку программы, + залитие в настройки(реестр, ини, хз) паттернов комманд? иначе задолбаешься на каждом терминале тыкать кнопки
Ответить