Main

<<< Сценарии

Простое голосовое управление системой

Что понадобится: телефон на базе системы Android.

Голосовое управление системой можно реализовать разными способами: андроид-приложение, альтернативное андроид-приложение MajorDroid, через Tasker или описанным ниже способом.

Принцип достаточно прост -- используем распознавание голоса от Google.

Шаг 1. Устанавливаем программу Extended Search Lite для телефона.

Шаг 2. В настройках программы добавляем свой сервер в качестве поискового движка в таком виде: http://адрес_сервера/command.php

Как это работает

Программа поиска распознает голосовую команду и отправляет ей в качестве поискового запроса на наш скрипт. Скрипт переводит этот поисковый запрос в команду, которая обрабатывается методом ThisComputer->commandReceived (в коде происходит вызов getObject("ThisComputer")->raiseEvent("commandReceived", array("command"=>$qry)); ).

В самом методе commandReceived настраивается реакция системы на ту или иную команду:

В указанном на скриншоте примере, система отвечает только на команду "скажи сколько время", но набор команд можно программировать произвольный.

В продолжение темы смотрите описание модуля Шаблоны поведения -- данный метод может использоваться совместно либо альтернативно способу, описанному выше.

 
 

Обсуждение

 

emaster: Обсуждение страницы Простое голосовое управление системой Насчёт голосового поиска гугла - где-то мелькала информация о том, что их голосовой engine доступен (или будет в ближайшее время) в stand-alone виде внутри какого-то устройства, что по многим причинам гораздо интереснее, чем работа с удалённым сервером. В моей прошлой квартире за распознавание голосовых команд отвечал движок STC VoiceCom Demo - в нём можно было нарисовать дерево команд и обучить нескольких дикторов. После чего распознанные команды выводились в заголовке окна, откуда я и тянул их в свой софт. Так у нас появилась Свити :) А ещё для голосового управления хорошо уметь фильтровать "базар", т.е. буквально :) В доме у меня для этого предусмотрено по 4 потолочных микрофона в каждой комнате - с них можно обрабатывать сигнал как с фазированной антенной решетки, т.е. достаточно эффективно фильтровать и отслеживать отдельные источники. Но за ворохом более важных задач эта "математика" пока ещё ждёт своей реализации.

Alex: В доме у меня для этого предусмотрено по 4 потолочных микрофона в каждой комнате Очень интересная идея. Как я сам до такого не додумался? Видать есть ещё над чем поработать... :) - с них можно обрабатывать сигнал как с фазированной антенной решетки, т.е. достаточно эффективно фильтровать и отслеживать отдельные источники. Вот это да... Впечатлило. С такими людьми Умный Дом против нас долго не продержится :).

Vip: А можно ли реализовать распознавание речи на уровне ПК, без привлечения мобильных устройств. По примеру http://habrahabr.ru/post/117234/#comment_3812334 Как думаете, возможно?

sergejey: А можно ли реализовать распознавание речи на уровне ПК, без привлечения мобильных устройств. По примеру http://habrahabr.ru/post/117234/#comment_3812334 Как думаете, возможно? Без мобильных устройств можно сделать просто запустив хром с включенным голосовым вводом и зайдя на страницу http://ваш_сервер/command.php -- там в строке ввода нажать на микрофон и говорить команду. Но это, конечно, не очень удобно -- лучше было бы если б программа сама распознавала речь и отправляла её на гугл. На ab-log.ru в форуме есть большая дискуссия на эту тему -- там они подключают всякие фильтры и скрипты, но по-моему надёжного способа так и нет -- то распознаёт плохо, то качество записи хромает.

Vadymkyr: а есть аналог этой программы для IOS?

sergejey: а есть аналог этой программы для IOS? К сожалению, не встречал. Под iOs я слышал, что делают в домашней сети специальный proxy-сервер для Siri, чтобы можно было перехватывать для неё команды и обрабатывать собственными средствами. Вот страница проекта https://github.com/plamoni/SiriProxy

igorek4649: Кто нибудь пробывал laitis.ru возможно использовать этот софт?

vash_sa: Без мобильных устройств можно сделать просто запустив хром с включенным голосовым вводом и зайдя на страницу http://ваш_сервер/command.php -- там в строке ввода нажать на микрофон и говорить команду. Но это, конечно, не очень удобно -- лучше было бы если б программа сама распознавала речь и отправляла её на гугл. На ab-log.ru в форуме есть большая дискуссия на эту тему -- там они подключают всякие фильтры и скрипты, но по-моему надёжного способа так и нет -- то распознаёт плохо, то качество записи хромает. Нет там никакой кнопки "нажать на микрофон" и нажимать не на что. Там только одна строка ввода say Та к все-таки эта тема как-то продвинулась?

[ Обсудить на форуме ]

 

Gearbest Устройства для Умного Дома из Китая
Устройства для Умного Дома из Китая
Gearbest Комплектующие для Умного Дома из Китая
Комплектующие для Умного Дома из Китая

Информация

Проекты

Партнёры

edit SideBar

 
Facebook
 
ВКонтакте
 

 

Blix theme adapted by David Gilbert, powered by PmWiki