Оффлайн распознавание речи. PocketSphinx.

Использование системы в различных ситуациях, вопросы программирования сценариев.

Модератор: immortal

coolermister
Сообщения: 49
Зарегистрирован: Пт июл 31, 2015 9:23 am
Благодарил (а): 12 раз
Поблагодарили: 17 раз

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение coolermister » Вт окт 24, 2017 12:26 am

на arm железяках наверное лучше использовать ptm модели, тк они намного легче. К тому же уважаемый Nickolay V. Shmyrev уже давно грозился их допилить) Интересно что ptm модели для русского языка почему то выпилили с официального сайта. Если хотите их попробовать, пишите, пришлю ссылку
directman66
Сообщения: 2801
Зарегистрирован: Пн дек 26, 2016 9:51 am
Откуда: Екатеринбург
Благодарил (а): 380 раз
Поблагодарили: 693 раза
Контактная информация:

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение directman66 » Вт окт 24, 2017 7:45 am

2coolermister Конечно есть желание попробовать.

upd: ребята, хотел попробовать монстра сфинкс также под виндой, ссылки на выложенные ранее сборки не активны. Вообще под виндой это все работает? Вроде попытался по инсрукции установить питон и сфинкс, вроде установился, но ниче не работает и я не понимаю как питоном пользоваться в виндах. Если есть готовые варианты, просьба поделиться.
Если вам помогло данное сообщение, не поленитесь нажать кнопку "спасибо".
CONNECT | Оборудование | Блог | Дополнения | Email | Telegram
AndrewS
Сообщения: 123
Зарегистрирован: Пт апр 15, 2016 10:18 am
Откуда: 21RU
Благодарил (а): 5 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение AndrewS » Вс мар 25, 2018 5:20 pm

Подниму немного тему распознавания
1. Беда всех электретных микрофонов в том, что они неправильно эксплуатируются. Посмотрите на эту статью - http://cxo.lv/index.php/solder/micamp/111-micamp01. Сейчас провожу эксперименты на телефоне Самсунг с андроид 4.4.2 API 19 и PocketSphinx. Качество распознавания выше удовлетворительного, предполагаю, что можно добиться и лучшего. Но меня и так устраивает, распознает даже при включенном ютубе на компьютере и музыке в соседней комнате. Правда приходится говорить чуть громче ютуба.
Вообще в говорящих колонках гугл хоме и хоме под по 6 микрофонов,
2. Мое мнение нужно собирать под старенькие телефоны, с андроидом 4.2 и выше. Во первых они доступны, наверняка у каждого завалялся такой, во вторых это будет универсальное решение, т.к. одно приложение будет выполнять нужные функции. Данные отправлять на сервер по вай фай, блютуз или через иннет на свой аккаунт Connect.
3. Вообще, можно легко менять ключевые слова, если забивать их заранее при сборке приложения, а в приложении просто сравнивать с тем, что пожелал пользователь в настройках. Я не думаю, что их там будет тысяча, может сотня другая, а это не проблема для распознавания. Если слов в приложении нет, можно добавить их при следующей сборке. Или если пользователь сам может собрать в андроид студио, то пусть собирает с Github-a.
4. Вообще напрашивается системная архитектура голосовых сообщений для умного дома. Это должен быть отдельный сервер, допустим коннект, по аналогии с яндекс сервером содержать шаблоны сообщений, на которые у пользователя не заведены шаблоны поведения. Т.е. у пользователя свои оффлайн шаблоны, но если он хочет расширить, то может синхронизировать с онлайн сервером незаведенные шаблоны.
Слабость - велика, а сила - ничтожна.
ARMBIAN 5.38 stable Debian GNU/Linux 9 (stretch) 4.14.18-sunxi
System load: 2.03 1.85 1.78 Up time: 23 days
Memory usage: 65 % of 2014MB CPU temp: 37°C
Orange Pi Plus 2 H3 Quad Core 1.6GHZ 2GB
Alekss II
Сообщения: 3
Зарегистрирован: Чт мар 29, 2018 10:53 pm
Благодарил (а): 1 раз
Поблагодарили: 0

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение Alekss II » Чт мар 29, 2018 11:45 pm

Модуль на микросхеме MAX9812 очень хорош (перепробовал много разных микрофонов) , есть еще на MAX9814 c АРУ (но мне больше нравится 9812 по звуку), но эксперименты продолжаются.

Изображение
Изображение

при питании от 2 батареек АА звук немного чище

цена модуля - ниже нет, отдельно микросхема max9812 стоит дороже ))

Пытаюсь строить на нем систему подключаю к Nano PI Neo , процессор Allwinner H3 512 мб, Armbian, DietPi (их несколько в домашной сети)
Питания через тороидальный трансформатор (2 раздельные вторичные обмотки), 1 - стабилизатор LM1085 (3А) плата, 2 - 7805 для управление реле и другой силовой частью
http://www.friendlyarm.com/image/catalo ... _en_01.jpg
Изображение

Использовать для сфинкса только с радиатором.

Насчет нехватки памяти для pocketsphinx, то например в DietPi http://dietpi.com (очень облегченный Linux на Debian) включен swap file (хорошо ли это для Sd карты ))- но он помогает)
Также чтоб уменьшить проблемы с памятью надо в русской языковой модели файл ru.lm перегнать в формат lm.bin
sphinx_lm_convert -i ru.lm -o ru.lm.bin
Во первых размер - .lm версия весит 529 мб , а перегнанная в формат lm.bin весит 109 мб - как говорится почувствуйте разницу ))
В итоге загружается быстрее, занимает места меньше..

Вообщем слушает pocketsphinx
Отвечает RHVoice
NooBAsTiK
Сообщения: 10
Зарегистрирован: Пн июл 09, 2018 12:34 am
Откуда: Иваново
Благодарил (а): 0
Поблагодарили: 0
Контактная информация:

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение NooBAsTiK » Пн июл 09, 2018 4:30 pm

У кого то получилось реализовать? Правильно я понимаю если делить микрофоны на помещения то лучше ставить на каждое из них что то типа мини пк с звуковой картой? И дальше уже отправлять результат распознования по сети?
Аватара пользователя
tarasfrompir
Сообщения: 3216
Зарегистрирован: Ср мар 02, 2016 8:18 pm
Откуда: Украина Пирятин
Благодарил (а): 223 раза
Поблагодарили: 815 раз

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение tarasfrompir » Пн июл 09, 2018 4:44 pm

Ну пойми , тут проблем много и на малинке-калинке это будет изврат .
Тут и ПС не всегда хватает....
Во вторых покетсфинкс тяжеловат будет...
в третьих - все эти обучения-мучения... ну капец просто...
в четвертых - точность распознавания - пока что не очень, НО при правильных настройках - терпимо. (При чем это не со всем зоопарком микрофонов и устройств разных)...

Хотя на нейронных сетях я так думаю в перспективе должно быть получше, но тут же опять мощностя еще больше надо...
Вобщем пока как по мне никак...
Спасибо нам ПОМОЖЕТ..!
zoldaten
Сообщения: 158
Зарегистрирован: Вт авг 23, 2016 3:08 pm
Откуда: Москва
Благодарил (а): 5 раз
Поблагодарили: 22 раза
Контактная информация:

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение zoldaten » Пн июл 09, 2018 5:38 pm

NooBAsTiK писал(а):
Пн июл 09, 2018 4:30 pm
У кого то получилось реализовать? Правильно я понимаю если делить микрофоны на помещения то лучше ставить на каждое из них что то типа мини пк с звуковой картой? И дальше уже отправлять результат распознования по сети?
кто как решает задачу - кто-то активные микрофоны тянет из одной точки. поищите по форуму - голосовое управление.
если будете искать микрофон, лучше сразу отказаться от тех перделок, которыми забит aliexpress,maxы и т.п.

самая простая схема реализации (мой рабочий вариант), которую можно использовать - respeaker шапка на raspberry или схожий форм-фактор,
chromegatemjd - "родное приложение" mjd. расстояние до микрофона - до 5 м, распознает правда только английский, но для
вкл/выкл подойдет.

ps. обучать там ничего не надо - сразу добавил сценарий -слово light - включил свет. dark - выключил
Raspberry pi3 на X820 с собственного образа MJD, broadlink rm mini3, sonoff basic, самодельные погодные станции и wi-fi розетки на esp8266 esp-01.физический robot-дворецкий.
NooBAsTiK
Сообщения: 10
Зарегистрирован: Пн июл 09, 2018 12:34 am
Откуда: Иваново
Благодарил (а): 0
Поблагодарили: 0
Контактная информация:

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение NooBAsTiK » Пн июл 09, 2018 6:08 pm

А кто то пользовался вот такой штукой?
https://www.youtube.com/watch?v=A0pdT1TE7uQ
NooBAsTiK
Сообщения: 10
Зарегистрирован: Пн июл 09, 2018 12:34 am
Откуда: Иваново
Благодарил (а): 0
Поблагодарили: 0
Контактная информация:

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение NooBAsTiK » Пн июл 09, 2018 6:10 pm

tarasfrompir1 писал(а):
Пн июл 09, 2018 4:44 pm
Ну пойми , тут проблем много и на малинке-калинке это будет изврат .
Тут и ПС не всегда хватает....
Т.е. проще взаимодействовать с googlom или yandex?
Аватара пользователя
tarasfrompir
Сообщения: 3216
Зарегистрирован: Ср мар 02, 2016 8:18 pm
Откуда: Украина Пирятин
Благодарил (а): 223 раза
Поблагодарили: 815 раз

Re: Оффлайн распознавание речи. PocketSphinx.

Сообщение tarasfrompir » Пн июл 09, 2018 6:33 pm

Пока что да. и это МОЕ мнение...
Может еще товарищи что скажут?
Спасибо нам ПОМОЖЕТ..!
Ответить