Main

<<< Сценарии

Простое голосовое управление системой

Что понадобится: телефон на базе системы Android.

Голосовое управление системой можно реализовать разными способами: андроид-приложение, альтернативное андроид-приложение MajorDroid, через Tasker или описанным ниже способом.

Принцип достаточно прост -- используем распознавание голоса от Google.

Шаг 1. Устанавливаем программу Extended Search Lite для телефона.

Шаг 2. В настройках программы добавляем свой сервер в качестве поискового движка в таком виде: http://адрес_сервера/command.php

Как это работает

Программа поиска распознает голосовую команду и отправляет ей в качестве поискового запроса на наш скрипт. Скрипт переводит этот поисковый запрос в команду, которая обрабатывается методом ThisComputer->commandReceived (в коде происходит вызов getObject("ThisComputer")->raiseEvent("commandReceived", array("command"=>$qry)); ).

В самом методе commandReceived настраивается реакция системы на ту или иную команду:

В указанном на скриншоте примере, система отвечает только на команду "скажи сколько время", но набор команд можно программировать произвольный.

В продолжение темы смотрите описание модуля Шаблоны поведения -- данный метод может использоваться совместно либо альтернативно способу, описанному выше.

 
 

Обсуждение

 

emaster: Обсуждение страницы Простое голосовое управление системой Насчёт голосового поиска гугла - где-то мелькала информация о том, что их голосовой engine доступен (или будет в ближайшее время) в stand-alone виде внутри какого-то устройства, что по многим причинам гораздо интереснее, чем работа с удалённым сервером. В моей прошлой квартире за распознавание голосовых команд отвечал движок STC VoiceCom Demo - в нём можно было нарисовать дерево команд и обучить нескольких дикторов. После чего распознанные команды выводились в заголовке окна, откуда я и тянул их в свой софт. Так у нас появилась Свити :) А ещё для голосового управления хорошо уметь фильтровать "базар", т.е. буквально :) В доме у меня для этого предусмотрено по 4 потолочных микрофона в каждой комнате - с них можно обрабатывать сигнал как с фазированной антенной решетки, т.е. достаточно эффективно фильтровать и отслеживать отдельные источники. Но за ворохом более важных задач эта "математика" пока ещё ждёт своей реализации.

Alex: В доме у меня для этого предусмотрено по 4 потолочных микрофона в каждой комнате Очень интересная идея. Как я сам до такого не додумался? Видать есть ещё над чем поработать... :) - с них можно обрабатывать сигнал как с фазированной антенной решетки, т.е. достаточно эффективно фильтровать и отслеживать отдельные источники. Вот это да... Впечатлило. С такими людьми Умный Дом против нас долго не продержится :).

Vip: А можно ли реализовать распознавание речи на уровне ПК, без привлечения мобильных устройств. По примеру http://habrahabr.ru/post/117234/#comment_3812334 Как думаете, возможно?

sergejey: А можно ли реализовать распознавание речи на уровне ПК, без привлечения мобильных устройств. По примеру http://habrahabr.ru/post/117234/#comment_3812334 Как думаете, возможно? Без мобильных устройств можно сделать просто запустив хром с включенным голосовым вводом и зайдя на страницу http://ваш_сервер/command.php -- там в строке ввода нажать на микрофон и говорить команду. Но это, конечно, не очень удобно -- лучше было бы если б программа сама распознавала речь и отправляла её на гугл. На ab-log.ru в форуме есть большая дискуссия на эту тему -- там они подключают всякие фильтры и скрипты, но по-моему надёжного способа так и нет -- то распознаёт плохо, то качество записи хромает.

Vadymkyr: а есть аналог этой программы для IOS?

sergejey: а есть аналог этой программы для IOS? К сожалению, не встречал. Под iOs я слышал, что делают в домашней сети специальный proxy-сервер для Siri, чтобы можно было перехватывать для неё команды и обрабатывать собственными средствами. Вот страница проекта https://github.com/plamoni/SiriProxy

igorek4649: Кто нибудь пробывал laitis.ru возможно использовать этот софт?

vash_sa: Без мобильных устройств можно сделать просто запустив хром с включенным голосовым вводом и зайдя на страницу http://ваш_сервер/command.php -- там в строке ввода нажать на микрофон и говорить команду. Но это, конечно, не очень удобно -- лучше было бы если б программа сама распознавала речь и отправляла её на гугл. На ab-log.ru в форуме есть большая дискуссия на эту тему -- там они подключают всякие фильтры и скрипты, но по-моему надёжного способа так и нет -- то распознаёт плохо, то качество записи хромает. Нет там никакой кнопки "нажать на микрофон" и нажимать не на что. Там только одна строка ввода say Та к все-таки эта тема как-то продвинулась?

[ Обсудить на форуме ]

 

MajorDomo

Информация

Проекты

Партнёры

edit SideBar

 
 
 

 

Blix theme adapted by David Gilbert, powered by PmWiki