Голосовое управление на основе SDK ОК Гугл (OK Google)

Модератор: immortal

Sas
Сообщения: 207
Зарегистрирован: Вт июл 12, 2016 6:16 pm
Благодарил (а): 2 раза
Поблагодарили: 14 раз

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение Sas » Пт апр 14, 2017 3:25 pm

резистивным делителем сделать из микрофонного линейный
За это сообщение автора Sas поблагодарил:
Tehnik053 (Ср сен 13, 2017 4:05 pm)
Рейтинг: 1.16%
Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Пт апр 14, 2017 4:48 pm

slgeo писал(а):Активный, видимо поэтому не получилось )
Надо как-то обойти внутренний усилитель
Либо, раз уж паяльником лезем внутрь, впоять после встроеного усилителя отсоединив родной.
Но это уже сложнее.

Отправлено с моего Redmi Note 3 через Tapatalk
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
directman66
Сообщения: 2801
Зарегистрирован: Пн дек 26, 2016 9:51 am
Откуда: Екатеринбург
Благодарил (а): 380 раз
Поблагодарили: 694 раза
Контактная информация:

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение directman66 » Чт май 25, 2017 9:58 am

Вроде уже много тем поднималось относительно удаленного управления, но какого-то автономного решения не нашел. Хотелось бы иметь независимое устройство, подключаемое к домашней сети, с подключенным микрофоном и слушающее фразу активации голосового управления. При активации устройство должно отправлять запрос с систему онлайн распознавания речи и передавать команду для обработки MD.

Что-то подобное реализовал Олег Герасимов с помощью esp8266, STM32F105 и микрофона.
http://www.esp8266.com/viewtopic.php?f=6&t=11427
Я далеко не радиоэлектронщик, схема коммутации https://github.com/wiieva/schematics/bl ... ESP-12.pdf для меня сложна для понимания. Никто не пробовал такой вариант управления?

дополнительные ссылки:
https://geektimes.ru/post/257382/

такие варианты никто не пробовал?
Если вам помогло данное сообщение, не поленитесь нажать кнопку "спасибо".
CONNECT | Оборудование | Блог | Дополнения | Email | Telegram
Аватара пользователя
Gelezako
Сообщения: 963
Зарегистрирован: Чт июн 02, 2016 9:33 pm
Благодарил (а): 205 раз
Поблагодарили: 106 раз
Контактная информация:

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение Gelezako » Чт май 25, 2017 3:10 pm

для тех кто не дружит с паяльником выход один - ждать руссификации Google Home или Amazon Alexa
фанат Мажордомо
тематический блог http://blog.gelezako.com
плейлист про Мажордомо на ютубе https://www.youtube.com/playlist?list=P ... EdBGtX084E
directman66
Сообщения: 2801
Зарегистрирован: Пн дек 26, 2016 9:51 am
Откуда: Екатеринбург
Благодарил (а): 380 раз
Поблагодарили: 694 раза
Контактная информация:

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение directman66 » Чт май 25, 2017 3:28 pm

а они умеют отдавать команды во внешнюю среду? Нам нужна железяка, которую можно настраивать под свои нужды, т.е. программируемая.
Если вам помогло данное сообщение, не поленитесь нажать кнопку "спасибо".
CONNECT | Оборудование | Блог | Дополнения | Email | Telegram
Аватара пользователя
Gelezako
Сообщения: 963
Зарегистрирован: Чт июн 02, 2016 9:33 pm
Благодарил (а): 205 раз
Поблагодарили: 106 раз
Контактная информация:

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение Gelezako » Чт май 25, 2017 3:41 pm

Что вы подразумеваете под внешней средой? Если МЖД, то это уже сейчас реализовывается с помошью сервиса API.AI, но т.к. Google ассистент, который встроен в Google Home пока не поддерживает русский, то обработка команд происходить небудет, зато уже сейчас можно создавать сценарии с использованием API.AI, благо МЖД его поддерживает, а в качестве устройства по отсылке команд использовать телефон с приложением Majordroid. Демонстрацию все этого на простеньком примере вы можете посмотреть тут к примеру _https://www.youtube.com/watch?v=mB0fdDYdvEI
Надеюсь что вкоре поддержка русского заработает и все сценари, которые уже созданы в API.AI почти сразу подхватятся Google Home.
фанат Мажордомо
тематический блог http://blog.gelezako.com
плейлист про Мажордомо на ютубе https://www.youtube.com/playlist?list=P ... EdBGtX084E
directman66
Сообщения: 2801
Зарегистрирован: Пн дек 26, 2016 9:51 am
Откуда: Екатеринбург
Благодарил (а): 380 раз
Поблагодарили: 694 раза
Контактная информация:

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение directman66 » Чт май 25, 2017 10:37 pm

терминалы планшеты телефоны на стене это не наш вариант. То, что вы показали уже работает. Речь идет именно о захвате голоса и его распознавании.
Если вам помогло данное сообщение, не поленитесь нажать кнопку "спасибо".
CONNECT | Оборудование | Блог | Дополнения | Email | Telegram
Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Пт май 26, 2017 8:54 am

На форуме присутствуют очень продвинутые в железе люди. Если идея им понравиться то можно создать свою умную колонку програмируюмую под свои нужды. Благодаря моим опытам привожу базу для технического решениея:

1. Для реагирования на ключевое слово можно задействовать железку, далее по тексту Железяка, из первого поста данного топика. Тестирование мною ето железки показало работу на твердил пятерку. Ни разу не реклама.

2. Для сжатия звука, так как мощи Ардуинки и ЕСП не жватает, использовать либо железку на основе чипа UDA1380, далее по тексту МП3железка, либо разрабатывая свою железку можно сразу учесть опыт использования и доработок людей из форумов уже познакомившижся с едим чипом. Основываясь на изучении результатами поиска упоминаний двух доступныж чипов из поста №9 данного топика пришёл к выводу что именно UDA1380 от Philips является достаточно качественным и стабильным.

3. Ну и конечно же мозги, далее по тексту Мозги, для управления данным дуэтем Либо Ардуино в связке с ЕСП если не жочется больше возможностей. Либо ЕСП.

Алгоритм очевиден:
Железяка Слушает ефир. Услышав ключевое слово дергает прерывание Мозгов. Мозги через динамик что либо говорят либо питают для понимания человеком что его поняли и слушают, дают команду МП3железке жать то что слышит микрофон. После определённой паузы в виде тишины (ниже определённого уровня сигнала) отправляем сжатый звук на распознования в гугл или яндекс или куда Вам угодно. Получив текст команды радуемся и обрабатываем как душе угодно

Посмотрите последние выпуски ВЕСТИ.NET там в почти в каждом выпуске про умные колонки говорят. Очень развевающийся рынок. Тобиш очень популярны они.

Надеяться на Брендованные колонки считая нельзя по простой причине. Все они в первую очередь заточены на пользование своими сервисами. Очень сомневаюсь что они дадут возможность направлять команды на свои давайте а не в иж облако. Если конечно кто-нибудь не жакнет иж и даст возможность загонять туда свои прошивки. А тут полная свобода.

Пост в первую очередь в адрес такиж замечательныж людей как Иван и Калина. Башка у ниж варит по железу на 5 с плюсом.

Отправлено с моего MI PAD 2 через Tapatalk
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
Аватара пользователя
sergejey
Site Admin
Сообщения: 4284
Зарегистрирован: Пн сен 05, 2011 6:48 pm
Откуда: Минск, Беларусь
Благодарил (а): 75 раз
Поблагодарили: 1559 раз
Контактная информация:

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение sergejey » Пт май 26, 2017 11:56 am

Закину ещё одну идею в качестве варианта -- использовать просенький микрофон с fm-транслятором (на али полно готовых модулей, делаем из него брелок с кнопкой и батарейкой) + модуль fm-приёмника с автоматическим включением/выключением в зависимости от наличия передающего сигнала (приёмник подключаем к компьютеру). Алгоритм такой -- если держать кнопку на брелке, то включается передатчик и транслирует голос на приёмник. Приёмник отдаёт аудио в компьютер, на котором стоит тот же chrome с плагином. Плагин немного переделать, чтоб он не требовал ключевого слова, а распознавал всё подряд, ведь по идее кроме режима передачи с брелка на входе должна быть полная тишина.

Из плюсов -- простота конструкции
Из минусов -- любой, кто знает частоту работы приёмника-передатчик, может отдавать команды вашему дому :)

По желанию переносной микрофон можно переделать в стационарный, добавив в него упомянутую на форуме приблуду для голосовой активации передатчика.

Но это теория, на практике как оно будет работать я пока не знаю, но заказал комплект приёмник+передатчик для экспериментов.
За это сообщение автора sergejey поблагодарил:
Gelezako (Пт май 26, 2017 3:11 pm)
Рейтинг: 1.16%

Сергей Джейгало, разработчик MajorDoMo
Идеи, ошибки -- за предложениями по исправлению и развитию слежу только здесь!
Профиль Connect -- информация, сотрудничество, услуги
directman66
Сообщения: 2801
Зарегистрирован: Пн дек 26, 2016 9:51 am
Откуда: Екатеринбург
Благодарил (а): 380 раз
Поблагодарили: 694 раза
Контактная информация:

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение directman66 » Пт май 26, 2017 12:01 pm

Сергей, ссылки не выложите?
Если вам помогло данное сообщение, не поленитесь нажать кнопку "спасибо".
CONNECT | Оборудование | Блог | Дополнения | Email | Telegram
Ответить