Голосовые команды для Алисы (Windows)
Добавлено: Пт фев 22, 2013 11:52 am
Очень уж мне хотелось заставить Алису "зажигать и гасить" свет с помощью голосовых команд и я начал кропотливо перекапывать РУ.нет в поисках необходимого ПО.
Сразу хочу сказать, все программы тестировались на Windows 7 64-bit.
Было найдено и инсталлировано множество всевозможных программ, начиная от Горыныча 4.5 (российский разработчик) - который так и не смог разобрать ни одного моего слова, заканчивая Typle 2.0. Полный список перечислять нет смысла, подмечу только самые толковые программы.
В результате проб и ошибок - пришел к выводу, ПО для "распознания речи" не подходит, ибо технология распознания "Русской" речи (к сожалению) находиться на довольно унылом уровне. Единственное что могло бы оказаться полезным, из программ не требующих нажатий клавиш, это программа Speaker (Использующая разработку Google и к тому-же бесплатная, правда сайта у программы нет, зато есть страница вконтакте), но полагаться на нее я не стал, правильное восприятие слов примерно 70% - что в свою очередь очень слабо. У каждого человека свой тон и своя манера разговора, поэтому сделать программу распознания речи для всех - довольно проблематично.
Пришлось выбирать из программ - предназначенных для выполнения действий на конкретные голосовые команды, рассчитанные только под определенного человека.
Одной из таких программ стала Typle 2.0 - вполне функциональный вариант.
Имеет возможность запуска программ с параметрами, открытие папок, открытие веб сайтов, привязывается к ранее записанному имени и фразе. Программа очень порадовала функционалом и качеством распознавания. Я бы пожалуй остановился на этом варианте, если бы не три проблемы.
1) Программа платная, в бесплатной версии имеется возможность создания только 15 голосовых команд. (Платную версию приобрести так и не удалось, возможно были проблемы с билингом у поставщика.)
2) После долгой работы иногда задумывалась, демонстративно не желая выполнять то что я ей говорю, но приходила в себя тоже сама - как правило через мин. 2-3 снова была готова к "труду и обороне" и выполняла распоряжения в штатном режиме.
3) Восприятие команд 90% (9 из 10: это конечно хорошо, но хотелось бы большего ).
Остановиться решил на программе Game Commander 3-(GC3). Программа платная, но проект уже закрыли, так что кроме как взломанную версию вы уже не найдете.
Умеет нажимать клавиши либо нужные вам сочетания клавиш, воспроизводить Wav файлы до и\или после выполнения команды, привязывается к ранее записанной фразе, имеет очень хороший коэффициент восприятия команд ~98-99% Для настройки: создал ярлычки на рабочем столе и сделал возможность вызова через горячие клавиши, после чего сделал их скрытыми.
Программе осталось только нажать нужное сочетание клавиш для запуска программы или команды.
Работает идеально, но на близком расстоянии (1,5-2 м.) и с условием если говорить в сторону микрофона, использую микрофон Jabra SPEAK 510.
Результатом доволен, плюс - набросил ранее записанные фразы на команды и Алиса научилась отвечать словами типа - (Слушаюсь, Выполняю, Будит сделано и т.д.), очень клево выглядит со стороны
Если кому интересно и если кто то не разберется в настройке, пишите, сделаю инструкцию.
Сразу хочу сказать, все программы тестировались на Windows 7 64-bit.
Было найдено и инсталлировано множество всевозможных программ, начиная от Горыныча 4.5 (российский разработчик) - который так и не смог разобрать ни одного моего слова, заканчивая Typle 2.0. Полный список перечислять нет смысла, подмечу только самые толковые программы.
В результате проб и ошибок - пришел к выводу, ПО для "распознания речи" не подходит, ибо технология распознания "Русской" речи (к сожалению) находиться на довольно унылом уровне. Единственное что могло бы оказаться полезным, из программ не требующих нажатий клавиш, это программа Speaker (Использующая разработку Google и к тому-же бесплатная, правда сайта у программы нет, зато есть страница вконтакте), но полагаться на нее я не стал, правильное восприятие слов примерно 70% - что в свою очередь очень слабо. У каждого человека свой тон и своя манера разговора, поэтому сделать программу распознания речи для всех - довольно проблематично.
Пришлось выбирать из программ - предназначенных для выполнения действий на конкретные голосовые команды, рассчитанные только под определенного человека.
Одной из таких программ стала Typle 2.0 - вполне функциональный вариант.
Имеет возможность запуска программ с параметрами, открытие папок, открытие веб сайтов, привязывается к ранее записанному имени и фразе. Программа очень порадовала функционалом и качеством распознавания. Я бы пожалуй остановился на этом варианте, если бы не три проблемы.
1) Программа платная, в бесплатной версии имеется возможность создания только 15 голосовых команд. (Платную версию приобрести так и не удалось, возможно были проблемы с билингом у поставщика.)
2) После долгой работы иногда задумывалась, демонстративно не желая выполнять то что я ей говорю, но приходила в себя тоже сама - как правило через мин. 2-3 снова была готова к "труду и обороне" и выполняла распоряжения в штатном режиме.
3) Восприятие команд 90% (9 из 10: это конечно хорошо, но хотелось бы большего ).
Остановиться решил на программе Game Commander 3-(GC3). Программа платная, но проект уже закрыли, так что кроме как взломанную версию вы уже не найдете.
Умеет нажимать клавиши либо нужные вам сочетания клавиш, воспроизводить Wav файлы до и\или после выполнения команды, привязывается к ранее записанной фразе, имеет очень хороший коэффициент восприятия команд ~98-99% Для настройки: создал ярлычки на рабочем столе и сделал возможность вызова через горячие клавиши, после чего сделал их скрытыми.
Программе осталось только нажать нужное сочетание клавиш для запуска программы или команды.
Работает идеально, но на близком расстоянии (1,5-2 м.) и с условием если говорить в сторону микрофона, использую микрофон Jabra SPEAK 510.
Результатом доволен, плюс - набросил ранее записанные фразы на команды и Алиса научилась отвечать словами типа - (Слушаюсь, Выполняю, Будит сделано и т.д.), очень клево выглядит со стороны
Если кому интересно и если кто то не разберется в настройке, пишите, сделаю инструкцию.