Часть функционала Алисы в "облаке"
Модератор: immortal
- sergejey
- Site Admin
- Сообщения: 4284
- Зарегистрирован: Пн сен 05, 2011 6:48 pm
- Откуда: Минск, Беларусь
- Благодарил (а): 75 раз
- Поблагодарили: 1559 раз
- Контактная информация:
Re: Часть функционала Алисы в "облаке"
Да пока как-то не очень успехи. Т.е. просто нет времени в этом направлении двигаться... Как-то пытался прикрутить "расскажи про фильм ...", но наткнулся на сильную защиту КиноПоиска от роботов, не поборол и забросил пока. Насчёт википедии хорошая идея, я как-то тоже смотрел, но не всегда в первом абзаце краткое объяснение -- временами достаточно пары предложений. В общем, если кто-то займётся исследованием из каких источников можно брать относительно краткую информацию по запросам, то будем развивать быстрее. Ну и я постараюсь возобновить по этому направлению работы.
Сергей Джейгало, разработчик MajorDoMo
Идеи, ошибки -- за предложениями по исправлению и развитию слежу только здесь!
Профиль Connect -- информация, сотрудничество, услуги
-
- Сообщения: 295
- Зарегистрирован: Вт апр 23, 2013 5:16 pm
- Откуда: Брянск
- Благодарил (а): 18 раз
- Поблагодарили: 94 раза
Re: Часть функционала Алисы в "облаке"
В Plex есть плагин, который берет информацию о фильме в кинопоиске. Как я понимаю работает он так: Сначала в гугле ищет ссылку на страницу с фильмом, с помощью примерно такого запроса:
А потом берет первую ссылку и парсит полученную страницу. Народ пишет, чтобы избежать бана достаточно авторизоваться на кинопоиске. Код парсера можно подсмотреть например тут: http://wolf-et.ru/php/kinopoisk-ru-parser/
Не очень силен в программировании, но могу посодействовать сем смогу.
Код: Выделить всё
человек паук 2014 site:kinopoisk.ru
Не очень силен в программировании, но могу посодействовать сем смогу.
Debian GNU/Linux 7.9 (wheezy), версия 0.9.0b, Connect
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Часть функционала Алисы в "облаке"
Я как то наткнулся на видео обзор. Подопытным был Кубик. Квадратная коробка. Распознавание и синтез речи. Впрочем, лучше один раз увидеть, вот:
http://www.youtube.com/watch?v=twGfhrxl3AQ
http://www.youtube.com/watch?v=q1X6hYYqAUk
Вопрос "Что такое ..." как раз после этого меня и заинтересовал. Пару месяцев назад, на сайте МДМ я мог увидеть только погоду. Сейчас под управлением полно всякого железа. Конечно очень бы хотелось добавить хотя бы небольшой элемент общения в виде вопросов. Очень хочется помочь. Но знаний пока еще мало.
Действительно довольно трудно определить источники и размер информации, которую надо взять. Тут не обойтись без большого теста, в котором могут принять участие все желающие.
План такой:
1. Определяем вопрос и сайт, от куда можно стянуть ответ.
2. Вначале просто делаем несколько, а точнее даже очень много попыток получить информацию в браузере.
3. Когда уже есть определенные результаты, пишем тут предложение.
Если предложение будет принято, Сергей добавит этот вопрос в облако. Дальше самое интересное. Нужно любыми путями использовать рабочую силу участников форума. Например так:
1. Вопрос добавляется в режиме тестирования.
2. Вопрос и ответ будут сохранены.
3. В конце Алиса должна спросить в виде простых вопросов Да/Нет на сколько точный и полный был ответ.
Все эти результаты должны сливаться в условно открытый ресурс, где заинтересованные участники могут просматривать вопросы с отрицательными результатами, и принимать решения для исправления парсера.
Очень не многие могут писать и править код. Но желание помочь есть у всех. Надо по возможности забрать на себя обсуждение и поиск новых решений, и все работы по анализу полученных данных.
http://www.youtube.com/watch?v=twGfhrxl3AQ
http://www.youtube.com/watch?v=q1X6hYYqAUk
Вопрос "Что такое ..." как раз после этого меня и заинтересовал. Пару месяцев назад, на сайте МДМ я мог увидеть только погоду. Сейчас под управлением полно всякого железа. Конечно очень бы хотелось добавить хотя бы небольшой элемент общения в виде вопросов. Очень хочется помочь. Но знаний пока еще мало.
Действительно довольно трудно определить источники и размер информации, которую надо взять. Тут не обойтись без большого теста, в котором могут принять участие все желающие.
План такой:
1. Определяем вопрос и сайт, от куда можно стянуть ответ.
2. Вначале просто делаем несколько, а точнее даже очень много попыток получить информацию в браузере.
3. Когда уже есть определенные результаты, пишем тут предложение.
Если предложение будет принято, Сергей добавит этот вопрос в облако. Дальше самое интересное. Нужно любыми путями использовать рабочую силу участников форума. Например так:
1. Вопрос добавляется в режиме тестирования.
2. Вопрос и ответ будут сохранены.
3. В конце Алиса должна спросить в виде простых вопросов Да/Нет на сколько точный и полный был ответ.
Все эти результаты должны сливаться в условно открытый ресурс, где заинтересованные участники могут просматривать вопросы с отрицательными результатами, и принимать решения для исправления парсера.
Очень не многие могут писать и править код. Но желание помочь есть у всех. Надо по возможности забрать на себя обсуждение и поиск новых решений, и все работы по анализу полученных данных.
- Рейтинг: 2.33%
- sergejey
- Site Admin
- Сообщения: 4284
- Зарегистрирован: Пн сен 05, 2011 6:48 pm
- Откуда: Минск, Беларусь
- Благодарил (а): 75 раз
- Поблагодарили: 1559 раз
- Контактная информация:
Re: Часть функционала Алисы в "облаке"
Я попробовал добавить ответ на вопрос "что такое ...".
В общем, если у вас подключен connect, то можно попробовать у Алисы поспрашивать различные термины.
В общем, если у вас подключен connect, то можно попробовать у Алисы поспрашивать различные термины.
- Рейтинг: 1.16%
Сергей Джейгало, разработчик MajorDoMo
Идеи, ошибки -- за предложениями по исправлению и развитию слежу только здесь!
Профиль Connect -- информация, сотрудничество, услуги
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Часть функционала Алисы в "облаке"
Работает! Только похоже зацепляет лишние пустые строки. Сейчас толком разберусь в чем дело
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Часть функционала Алисы в "облаке"
Возможно я сейчас спешу с выводами, но по моему в ответ пролетают символы переноса строки. Не уверен, что они там нужны. Да и при использовании другого внешнего плеера для чтения текста через командную строку их так не передать.
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Часть функционала Алисы в "облаке"
Вот что уходит на чтение:
Еще проскакивают паразитные пробелы слева и справа.
Наверное стоит у каждого сообщения, оправляемого в синтез, вначале заменить все переносы строк и символы неразрывного пробела ( ) на простые пробелы, а затем обрезать все пробелы слева и справа.
- 16:03:16 DEBUG [root]: Executing (exclusive): d:\server\apps\tell\tell.exe
Стул — мебельное изделие для сидения одного человека, с твёрдой спинкой и твёрдым сиденьем, с высотой сиденья, функционально удобной при соотношении его с высотой стола[1] (at D:\Server\www\majordomo\lib\general.class.php:390)
16:03:16 DEBUG [root]: Executing (exclusive): d:\server\apps\tell\tell.exe Основные части стула — сиденье и спинка, в типичном стуле сиденье опирается на четыре ножки, иногда в конструкцию стула входят подлокотники (at D:\Server\www\majordomo\lib\general.class.php:390)
Еще проскакивают паразитные пробелы слева и справа.
Наверное стоит у каждого сообщения, оправляемого в синтез, вначале заменить все переносы строк и символы неразрывного пробела ( ) на простые пробелы, а затем обрезать все пробелы слева и справа.
- sergejey
- Site Admin
- Сообщения: 4284
- Зарегистрирован: Пн сен 05, 2011 6:48 pm
- Откуда: Минск, Беларусь
- Благодарил (а): 75 раз
- Поблагодарили: 1559 раз
- Контактная информация:
Re: Часть функционала Алисы в "облаке"
Ага, учёл.
- Рейтинг: 1.16%
Сергей Джейгало, разработчик MajorDoMo
Идеи, ошибки -- за предложениями по исправлению и развитию слежу только здесь!
Профиль Connect -- информация, сотрудничество, услуги
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Часть функционала Алисы в "облаке"
Волшебно !!!
Теперь все нормально.
Продолжаем тестировать!
Теперь все нормально.
Логи:Показать
16:42:04 DEBUG [root]: Executing (exclusive): d:\server\apps\tell\tell.exe Стол — мебельное изделие, представляющее собой приподнятую над уровнем пола поверхность, предназначенную для расположения на ней различных предметов и для выполнения на ней различных работ, принятия пищи и др (at D:\Server\www\majordomo\lib\general.class.php:390)
16:42:04 DEBUG [root]: Executing (exclusive): d:\server\apps\tell\tell.exe В роли стола может выступать и не приподнятая над полом поверхность, что дополнительно усложняет задачу нахождения исчерпывающего определения стола (at D:\Server\www\majordomo\lib\general.class.php:390)
16:42:04 DEBUG [root]: Executing (exclusive): d:\server\apps\tell\tell.exe В роли стола может выступать и не приподнятая над полом поверхность, что дополнительно усложняет задачу нахождения исчерпывающего определения стола (at D:\Server\www\majordomo\lib\general.class.php:390)
- Bagir
- Сообщения: 1613
- Зарегистрирован: Вт сен 17, 2013 6:46 pm
- Откуда: Ярославская область город Углич
- Благодарил (а): 212 раз
- Поблагодарили: 375 раз
Re: Часть функционала Алисы в "облаке"
Возможно стоит игнорировать знак ? в конце (и точку тоже)
Например:
Что такое стол
и
Что такое стол?
второе не ищет.
Например:
Что такое стол
и
Что такое стол?
второе не ищет.