SlideShare uma empresa Scribd logo
1 de 23
Baixar para ler offline
Чатбот для подсказки ответов на вопросы —
новейшие алгоритмы, нейронные сети,
промышленная Java и большие нагрузки
Александр Сербул
руководитель направления
Карл…
Карл, я пишу
хороший код и
люблю свою
работу….
Это очень круто,
пап!
Карл… Карл, я специалист по
BigData….
Это очень круто,
пап!
Но я давно забыл тервер
и диффиренциальное
исчисление и НЕ МОГУ
ИХ ВСПОМНИТЬ, даже за
отпуск!
«Открытые линии»
• У вас есть какой-нибудь интернет-
магазин
• Нужно скоммуницировать экспертов
интернет-магазина с покупателями
из разных каналов…
• Люди начинают задавать вопросы…
• Ваши сотрудники начинают им
отвечать…
«Открытые линии»
«Открытые линии»
«Открытые линии»
«Открытые линии»
Призовем Ктулху?
• Клиент состыкован с менеджером
• Но клиенты задают часто похожие
вопросы
• И получают похожие ответы
• База знаний, ЧАВО…
•А вдруХ AI поможет?
Все готовы к отжигу в
печи?
• Начнет болеть голова
• Из носа потечет кровь
• Пропадет слух
• Возможны судорги и
левитация…
Здравствуй, NLP
• Регулярки? Да! 
• Куча экспертов и …
регулярки?
• Предикативная логика и
базка?
• Семантические графы и ЛСД
(C20H25N3O)
Национальный корпус русского
языка и … «тайные знания»
• ruscorpora.ru
• Томита-парсер (Яндекс)
• Морфологический словарь
• Словарь синонимов
• Тезаурус/семантическая сеть
• «Тайные знания» Яндекс,
ABBYY…
Карл…
Карл, я подписан на
новости научной
библиотеки….
Это очень круто,
пап!
Карл… Карл, я специалист по
BigData….
Это очень круто,
пап!
Только на их данных у
них ВСЕ РАБОТАЕТ… а у
на моих – нет  Пойду и
напьюсь!
«Из грязи» … в князи!
• Зачем изучать линейную
алгебру?
• Зачем понимать
логистическую регрессию?
• Зачем знать модели Макарова
Маркова?
• Айда сразу в … Deep Learning!
Нам поможет «черная магия»
нейронок
• DSSM (Microsoft) и другие…
• Яндекс «Палех», Google
SmartReply
• Word2Vec, GloVe
Суть архитектуры на пальцах…
• 3 (N)-граммы, tfidf
• Сжатие размерности
(нелинейное)
• Метрика похожести какая
«НИТЬ», например скалярное
произведение векторов:
arxiv (1508.01585v2)
Метрики похожести, страшные и
ужасные…
• Многое зависит от ваших
данных
• Их объема, структуры
• Фазы Луны
• Года по китайскому календарю
• Дня и месяца рождения
руководителя проекта!
На чем «кодить», production
• Тензоры… numpy, nd4j
• Python: Theano, Keras,
TensorFlow
• Lua: Torch7
• Java/Scala: Deeplearning4j
• Production…
«Нейробот» 
Embedding+encoding -
каскад сжатия вопроса/контекста
(RNN/FF/CNN, softsign, adam)
Слой векторного умножения
(dot product) либо другой kernel
Корректирующий слой
(feed forward + softmax)
Ответ сети: похожесть
вопроса и ответа (0-1)
TF-IDF/Ngram – токенизация
TF-IDF/Ngram - токенизация
Embedding+encoding -
каскад сжатия ответа
(RNN/FF/CNN, softsign, adam)
"Вопрос"
"Ответ"
Кластер веб-серверов,
Кэширование, REST-API
GPUs (TitanX)
Возможные ответы
на контекст
Глубокая нейронная сеть
с двумя входами и одним выходом
с адаптивной архитектурой.
Внутри сети происходит совмещение
семантических пространств вопросов
и ответов.
TuringТюнинг…
• Если мало данных… нейронка «бредит»
• Метрики качества: recall@N, уровень «бреда» и т.п.
• Обратный индекс
• Кластеризация похожих ответов
• Многопоточность
• Онлайн-дообучение
• Экстремальный highload
• «Экспериментируем» с мэрией Москвы
Бот-платформа Битрикс24
• https://dev.1c-bitrix.ru/learning/course/?COURSE_ID=93
• Приглашаем дата-сатанистов сайнтистов к
сотрудничеству
• Пишите NLP + Deep + Convolution+ Adversarial +
Autoencoder + Neural Turing Machine + … чат-боты
• Всем отличного настроения и качественных
моделей! 
Спасибо за
внимание!
Вопросы?
Александр Сербул
@AlexSerbul
Alexandr Serbul
serbul@1c-bitrix.ru

Mais conteúdo relacionado

Destaque

Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...Dev_Party
 
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...Dev_Party
 
Игорь Иванов, Playrix — Статистические предсказания игровой активности
Игорь Иванов, Playrix — Статистические предсказания игровой активностиИгорь Иванов, Playrix — Статистические предсказания игровой активности
Игорь Иванов, Playrix — Статистические предсказания игровой активностиDev_Party
 
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...Dev_Party
 
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...Dev_Party
 
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?Dev_Party
 
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФСРоман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФСDev_Party
 

Destaque (7)

Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
 
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
 
Игорь Иванов, Playrix — Статистические предсказания игровой активности
Игорь Иванов, Playrix — Статистические предсказания игровой активностиИгорь Иванов, Playrix — Статистические предсказания игровой активности
Игорь Иванов, Playrix — Статистические предсказания игровой активности
 
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
 
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
 
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
 
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФСРоман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
 

Александр Сербул, 1С-Битрикс — Чатбот для подсказки ответов на вопросы — новейшие алгоритмы, нейронные сети, промышленная Java и большие нагрузки

  • 1. Чатбот для подсказки ответов на вопросы — новейшие алгоритмы, нейронные сети, промышленная Java и большие нагрузки Александр Сербул руководитель направления
  • 2. Карл… Карл, я пишу хороший код и люблю свою работу…. Это очень круто, пап!
  • 3. Карл… Карл, я специалист по BigData…. Это очень круто, пап! Но я давно забыл тервер и диффиренциальное исчисление и НЕ МОГУ ИХ ВСПОМНИТЬ, даже за отпуск!
  • 4. «Открытые линии» • У вас есть какой-нибудь интернет- магазин • Нужно скоммуницировать экспертов интернет-магазина с покупателями из разных каналов… • Люди начинают задавать вопросы… • Ваши сотрудники начинают им отвечать…
  • 9. Призовем Ктулху? • Клиент состыкован с менеджером • Но клиенты задают часто похожие вопросы • И получают похожие ответы • База знаний, ЧАВО… •А вдруХ AI поможет?
  • 10. Все готовы к отжигу в печи? • Начнет болеть голова • Из носа потечет кровь • Пропадет слух • Возможны судорги и левитация…
  • 11. Здравствуй, NLP • Регулярки? Да!  • Куча экспертов и … регулярки? • Предикативная логика и базка? • Семантические графы и ЛСД (C20H25N3O)
  • 12. Национальный корпус русского языка и … «тайные знания» • ruscorpora.ru • Томита-парсер (Яндекс) • Морфологический словарь • Словарь синонимов • Тезаурус/семантическая сеть • «Тайные знания» Яндекс, ABBYY…
  • 13. Карл… Карл, я подписан на новости научной библиотеки…. Это очень круто, пап!
  • 14. Карл… Карл, я специалист по BigData…. Это очень круто, пап! Только на их данных у них ВСЕ РАБОТАЕТ… а у на моих – нет  Пойду и напьюсь!
  • 15. «Из грязи» … в князи! • Зачем изучать линейную алгебру? • Зачем понимать логистическую регрессию? • Зачем знать модели Макарова Маркова? • Айда сразу в … Deep Learning!
  • 16. Нам поможет «черная магия» нейронок • DSSM (Microsoft) и другие… • Яндекс «Палех», Google SmartReply • Word2Vec, GloVe
  • 17. Суть архитектуры на пальцах… • 3 (N)-граммы, tfidf • Сжатие размерности (нелинейное) • Метрика похожести какая «НИТЬ», например скалярное произведение векторов: arxiv (1508.01585v2)
  • 18. Метрики похожести, страшные и ужасные… • Многое зависит от ваших данных • Их объема, структуры • Фазы Луны • Года по китайскому календарю • Дня и месяца рождения руководителя проекта!
  • 19. На чем «кодить», production • Тензоры… numpy, nd4j • Python: Theano, Keras, TensorFlow • Lua: Torch7 • Java/Scala: Deeplearning4j • Production…
  • 20. «Нейробот»  Embedding+encoding - каскад сжатия вопроса/контекста (RNN/FF/CNN, softsign, adam) Слой векторного умножения (dot product) либо другой kernel Корректирующий слой (feed forward + softmax) Ответ сети: похожесть вопроса и ответа (0-1) TF-IDF/Ngram – токенизация TF-IDF/Ngram - токенизация Embedding+encoding - каскад сжатия ответа (RNN/FF/CNN, softsign, adam) "Вопрос" "Ответ" Кластер веб-серверов, Кэширование, REST-API GPUs (TitanX) Возможные ответы на контекст Глубокая нейронная сеть с двумя входами и одним выходом с адаптивной архитектурой. Внутри сети происходит совмещение семантических пространств вопросов и ответов.
  • 21. TuringТюнинг… • Если мало данных… нейронка «бредит» • Метрики качества: recall@N, уровень «бреда» и т.п. • Обратный индекс • Кластеризация похожих ответов • Многопоточность • Онлайн-дообучение • Экстремальный highload • «Экспериментируем» с мэрией Москвы
  • 22. Бот-платформа Битрикс24 • https://dev.1c-bitrix.ru/learning/course/?COURSE_ID=93 • Приглашаем дата-сатанистов сайнтистов к сотрудничеству • Пишите NLP + Deep + Convolution+ Adversarial + Autoencoder + Neural Turing Machine + … чат-боты • Всем отличного настроения и качественных моделей! 