Страница 10 из 11

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Вт окт 24, 2017 12:26 am
coolermister
на arm железяках наверное лучше использовать ptm модели, тк они намного легче. К тому же уважаемый Nickolay V. Shmyrev уже давно грозился их допилить) Интересно что ptm модели для русского языка почему то выпилили с официального сайта. Если хотите их попробовать, пишите, пришлю ссылку

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Вт окт 24, 2017 7:45 am
directman66
2coolermister Конечно есть желание попробовать.

upd: ребята, хотел попробовать монстра сфинкс также под виндой, ссылки на выложенные ранее сборки не активны. Вообще под виндой это все работает? Вроде попытался по инсрукции установить питон и сфинкс, вроде установился, но ниче не работает и я не понимаю как питоном пользоваться в виндах. Если есть готовые варианты, просьба поделиться.

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Вс мар 25, 2018 5:20 pm
AndrewS
Подниму немного тему распознавания
1. Беда всех электретных микрофонов в том, что они неправильно эксплуатируются. Посмотрите на эту статью - http://cxo.lv/index.php/solder/micamp/111-micamp01. Сейчас провожу эксперименты на телефоне Самсунг с андроид 4.4.2 API 19 и PocketSphinx. Качество распознавания выше удовлетворительного, предполагаю, что можно добиться и лучшего. Но меня и так устраивает, распознает даже при включенном ютубе на компьютере и музыке в соседней комнате. Правда приходится говорить чуть громче ютуба.
Вообще в говорящих колонках гугл хоме и хоме под по 6 микрофонов,
2. Мое мнение нужно собирать под старенькие телефоны, с андроидом 4.2 и выше. Во первых они доступны, наверняка у каждого завалялся такой, во вторых это будет универсальное решение, т.к. одно приложение будет выполнять нужные функции. Данные отправлять на сервер по вай фай, блютуз или через иннет на свой аккаунт Connect.
3. Вообще, можно легко менять ключевые слова, если забивать их заранее при сборке приложения, а в приложении просто сравнивать с тем, что пожелал пользователь в настройках. Я не думаю, что их там будет тысяча, может сотня другая, а это не проблема для распознавания. Если слов в приложении нет, можно добавить их при следующей сборке. Или если пользователь сам может собрать в андроид студио, то пусть собирает с Github-a.
4. Вообще напрашивается системная архитектура голосовых сообщений для умного дома. Это должен быть отдельный сервер, допустим коннект, по аналогии с яндекс сервером содержать шаблоны сообщений, на которые у пользователя не заведены шаблоны поведения. Т.е. у пользователя свои оффлайн шаблоны, но если он хочет расширить, то может синхронизировать с онлайн сервером незаведенные шаблоны.

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Чт мар 29, 2018 11:45 pm
Alekss II
Модуль на микросхеме MAX9812 очень хорош (перепробовал много разных микрофонов) , есть еще на MAX9814 c АРУ (но мне больше нравится 9812 по звуку), но эксперименты продолжаются.

Изображение
Изображение

при питании от 2 батареек АА звук немного чище

цена модуля - ниже нет, отдельно микросхема max9812 стоит дороже ))

Пытаюсь строить на нем систему подключаю к Nano PI Neo , процессор Allwinner H3 512 мб, Armbian, DietPi (их несколько в домашной сети)
Питания через тороидальный трансформатор (2 раздельные вторичные обмотки), 1 - стабилизатор LM1085 (3А) плата, 2 - 7805 для управление реле и другой силовой частью
http://www.friendlyarm.com/image/catalo ... _en_01.jpg
Изображение

Использовать для сфинкса только с радиатором.

Насчет нехватки памяти для pocketsphinx, то например в DietPi http://dietpi.com (очень облегченный Linux на Debian) включен swap file (хорошо ли это для Sd карты ))- но он помогает)
Также чтоб уменьшить проблемы с памятью надо в русской языковой модели файл ru.lm перегнать в формат lm.bin
sphinx_lm_convert -i ru.lm -o ru.lm.bin
Во первых размер - .lm версия весит 529 мб , а перегнанная в формат lm.bin весит 109 мб - как говорится почувствуйте разницу ))
В итоге загружается быстрее, занимает места меньше..

Вообщем слушает pocketsphinx
Отвечает RHVoice

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Пн июл 09, 2018 4:30 pm
NooBAsTiK
У кого то получилось реализовать? Правильно я понимаю если делить микрофоны на помещения то лучше ставить на каждое из них что то типа мини пк с звуковой картой? И дальше уже отправлять результат распознования по сети?

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Пн июл 09, 2018 4:44 pm
tarasfrompir
Ну пойми , тут проблем много и на малинке-калинке это будет изврат .
Тут и ПС не всегда хватает....
Во вторых покетсфинкс тяжеловат будет...
в третьих - все эти обучения-мучения... ну капец просто...
в четвертых - точность распознавания - пока что не очень, НО при правильных настройках - терпимо. (При чем это не со всем зоопарком микрофонов и устройств разных)...

Хотя на нейронных сетях я так думаю в перспективе должно быть получше, но тут же опять мощностя еще больше надо...
Вобщем пока как по мне никак...

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Пн июл 09, 2018 5:38 pm
zoldaten
NooBAsTiK писал(а):
Пн июл 09, 2018 4:30 pm
У кого то получилось реализовать? Правильно я понимаю если делить микрофоны на помещения то лучше ставить на каждое из них что то типа мини пк с звуковой картой? И дальше уже отправлять результат распознования по сети?
кто как решает задачу - кто-то активные микрофоны тянет из одной точки. поищите по форуму - голосовое управление.
если будете искать микрофон, лучше сразу отказаться от тех перделок, которыми забит aliexpress,maxы и т.п.

самая простая схема реализации (мой рабочий вариант), которую можно использовать - respeaker шапка на raspberry или схожий форм-фактор,
chromegatemjd - "родное приложение" mjd. расстояние до микрофона - до 5 м, распознает правда только английский, но для
вкл/выкл подойдет.

ps. обучать там ничего не надо - сразу добавил сценарий -слово light - включил свет. dark - выключил

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Пн июл 09, 2018 6:08 pm
NooBAsTiK
А кто то пользовался вот такой штукой?
https://www.youtube.com/watch?v=A0pdT1TE7uQ

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Пн июл 09, 2018 6:10 pm
NooBAsTiK
tarasfrompir1 писал(а):
Пн июл 09, 2018 4:44 pm
Ну пойми , тут проблем много и на малинке-калинке это будет изврат .
Тут и ПС не всегда хватает....
Т.е. проще взаимодействовать с googlom или yandex?

Re: Оффлайн распознавание речи. PocketSphinx.

Добавлено: Пн июл 09, 2018 6:33 pm
tarasfrompir
Пока что да. и это МОЕ мнение...
Может еще товарищи что скажут?