SlideShare uma empresa Scribd logo
1 de 7
Baixar para ler offline
Технологии обработки текста на 
естественном языке4 
http://opiner.ru
Технологии 
Технологическая 
платформа Opiner 
4 
➢ Собирает данные 
➢ Определяет объекты и 
категории 
➢ Определяет тональность 
текстов 
➢ Извлекает ключевые 
атрибуты и их тональность 
➢ Удаляет дубликаты и 
кластеризует тексты 
Данные клиента: 
Тексты 
Поисковые запросы 
URL страницы 
Получение 
результатов 
обработки по API
Сбор данных 
Социальные сети 
Блоги и форумы 
Новости и 
веб страницы 
Обработка и индексирование 
под высокими нагрузками 
(200 документов в секунду)
Определение объектов 
Тематическая классификация 
Мультиязычная конфигурация 
1. Извлечение всех кандидатов в объекты 
2. Определение значений всех 
неоднозначных терминов (F-мера 77%) 
3. Поиск всех тематических категорий у объектов 
4. Агрегация и определение основных тематик текста
Определение тональности 
1. Поиск всех ключевых объектов и 
атрибутов для определения тональности 
2. Определение ключевых оценочных 
слов и выражений 
3. Применение правил комбинирования и 
отрицания 
4. Определение тональности с помощью машинного 
обучения (F-мера на уровне 80%)
Удаление дубликатов 
и кластеризация 
1. Удаление дубликатов при высоких 
нагрузках ~ 200 документов в секунду 
2. Кластеризация документов по смыслу 
или тематике (F-мера 90%)
Контакты 
Илья Четверкин 
Генеральный директор 
+7 926 449-67-30 
ilia.chetviorkin@opiner.ru

Mais conteúdo relacionado

Destaque

Tourism swia consultations ppt final (myanmar version) for upload
Tourism swia consultations ppt final (myanmar version) for uploadTourism swia consultations ppt final (myanmar version) for upload
Tourism swia consultations ppt final (myanmar version) for upload
Ethical Sector
 
Mytonomy Assembled Ed Presentation
Mytonomy Assembled Ed PresentationMytonomy Assembled Ed Presentation
Mytonomy Assembled Ed Presentation
GeneralAssembly_DC
 
[경험디자인] 영화예매 경험개선을 위한 시네마할인가이드
[경험디자인] 영화예매 경험개선을 위한 시네마할인가이드[경험디자인] 영화예매 경험개선을 위한 시네마할인가이드
[경험디자인] 영화예매 경험개선을 위한 시네마할인가이드
iamnanda301
 

Destaque (10)

Game-based IT solutions for active & healthy aging
Game-based IT solutions for active & healthy agingGame-based IT solutions for active & healthy aging
Game-based IT solutions for active & healthy aging
 
Tourism swia consultations ppt final (myanmar version) for upload
Tourism swia consultations ppt final (myanmar version) for uploadTourism swia consultations ppt final (myanmar version) for upload
Tourism swia consultations ppt final (myanmar version) for upload
 
Exposicion informatica
Exposicion informaticaExposicion informatica
Exposicion informatica
 
Making Sense of Syria
Making Sense of Syria Making Sense of Syria
Making Sense of Syria
 
Access to Remedy – International Frameworks & Options
Access to Remedy – International Frameworks & OptionsAccess to Remedy – International Frameworks & Options
Access to Remedy – International Frameworks & Options
 
Mytonomy Assembled Ed Presentation
Mytonomy Assembled Ed PresentationMytonomy Assembled Ed Presentation
Mytonomy Assembled Ed Presentation
 
Okino.ua 2016
Okino.ua 2016Okino.ua 2016
Okino.ua 2016
 
Skaters kk
Skaters kkSkaters kk
Skaters kk
 
Good Governance and Mining in Myanmar: Emerging Findings from MCRB's Sector-W...
Good Governance and Mining in Myanmar: Emerging Findings from MCRB's Sector-W...Good Governance and Mining in Myanmar: Emerging Findings from MCRB's Sector-W...
Good Governance and Mining in Myanmar: Emerging Findings from MCRB's Sector-W...
 
[경험디자인] 영화예매 경험개선을 위한 시네마할인가이드
[경험디자인] 영화예매 경험개선을 위한 시네마할인가이드[경험디자인] 영화예매 경험개선을 위한 시네마할인가이드
[경험디자인] 영화예매 경험개선을 위한 시네마할인가이드
 

Opiner_Technologies

  • 1. Технологии обработки текста на естественном языке4 http://opiner.ru
  • 2. Технологии Технологическая платформа Opiner 4 ➢ Собирает данные ➢ Определяет объекты и категории ➢ Определяет тональность текстов ➢ Извлекает ключевые атрибуты и их тональность ➢ Удаляет дубликаты и кластеризует тексты Данные клиента: Тексты Поисковые запросы URL страницы Получение результатов обработки по API
  • 3. Сбор данных Социальные сети Блоги и форумы Новости и веб страницы Обработка и индексирование под высокими нагрузками (200 документов в секунду)
  • 4. Определение объектов Тематическая классификация Мультиязычная конфигурация 1. Извлечение всех кандидатов в объекты 2. Определение значений всех неоднозначных терминов (F-мера 77%) 3. Поиск всех тематических категорий у объектов 4. Агрегация и определение основных тематик текста
  • 5. Определение тональности 1. Поиск всех ключевых объектов и атрибутов для определения тональности 2. Определение ключевых оценочных слов и выражений 3. Применение правил комбинирования и отрицания 4. Определение тональности с помощью машинного обучения (F-мера на уровне 80%)
  • 6. Удаление дубликатов и кластеризация 1. Удаление дубликатов при высоких нагрузках ~ 200 документов в секунду 2. Кластеризация документов по смыслу или тематике (F-мера 90%)
  • 7. Контакты Илья Четверкин Генеральный директор +7 926 449-67-30 ilia.chetviorkin@opiner.ru