SlideShare a Scribd company logo
1 of 44
Проблемы построения
корпуса коротких текстов
для задачи классификации
отзывов на три класса
Юлия Рубцова

Институт систем информатики
им. А.П. Ершова СО РАН
Содержание
 Обзор предметной области
 Сбор корпуса
 Фильтрация
 Морфологический анализ

 Результаты и закономерности
 Выводы
 Применение
Обзор предметной
области
UGC – user generated content
Задачи извлечения и обработки
информации из текстов
Прикладные задачи, которые
решает автоматическое
определение тональности
 исследования отношения потребителей к ее

продукции для коммерческой организации;
Прикладные задачи, которые
решает автоматическое
определение тональности
 исследования отношения потребителей к ее

продукции для коммерческой организации;
 разработка рекомендательной системы для

покупателей определенных групп товаров
или услуг;
Прикладные задачи, которые
решает автоматическое
определение тональности
 исследования отношения потребителей к ее

продукции для коммерческой организации;

 разработка рекомендательной системы для

покупателей определенных групп товаров
или услуг;

 введение в человеко-машинный интерфейс

компьютерной системы, отвечающей за
адаптацию поведения системы к текущему
эмоциональному состоянию человека
человеко-машинный интерфейс,
отвечающей за адаптацию поведения
системы к текущему эмоциональному
состоянию человека
 психологическое и медицинское

диагностирование;
 обеспечение безопасности за счет анализа

поведения массовых скоплений людей;
 помощь в проведении оперативно-

розыскных мероприятий
Тональность текстов
 Два класса
 Три класса

 5 классов
 10 классов
 N-классов
Существующие
корпусы текстов
 Корпуса отзывов, содержащие оценки

пользователей
 Узкотематические корпуса отзывов

(фильмы, книги, техника)
 Корпуса общезначимых новостей (тексты

состоящие из нескольких абзацев)
Отличие микроблога от
сервиса отзывов
•
•
•
•
•

•
•
•
•
•

Обдуманный, структурированный
Конструктивная критика или похвала
Не ограничен по длине
Относится к одной предметной области
Может одновременно выражать и
негатиное отношение и позитивное

Спонтанны
Эмоциональны
Ограничение по длине в 140 символов
Общетематический ресурс
Один текст – одна эмоция
Сбор корпуса
Корпус
С высокой точностью можно определить
передаваемую эмоцию, если автор указал символ
обозначения эмоции на письме (смайлик).
[Метод J.Read 2005]

:)

:(

:-/

8-)

=(

0_о

:-D

;-)

:-)

(((

:’(
Подготовка
1. Составлены словари символов, обозначающие на
письме:
 отрицательные эмоции,

 Положительные эмоции.
Подготовка
1. Составлены словари символов, обозначающие на
письме:
 отрицательные эмоции,

 Положительные эмоции.

2. Сделано допущение, что выражение эмоции
относится ко всему сообщению, а не к отдельной его
части. (Длина твита 140 символов).
Подготовка корпуса
1. Составлены словари символов, обозначающие на
письме:
 отрицательные эмоции,
 Положительные эмоции.

2. Сделано допущение, что выражение эмоции
относится ко всему сообщению, а не к отдельной его
части. (Длина твита 140 символов).
3. Созданы фильтры для устранения дубликатов и
неопределенностей.
Фильтрация
 Положительные и отрицательные эмоции в

одном твите
 Retweet

 Копии твитов
 Малоинформативные твиты (<40 символов)
 Реплаи
Сложности
API twitter отдает только 1000 постов на
каждый поисковый запрос с географической
привязкой
Атрибуты корпуса
 Класс, к которому принадлежит твит

(положительный/отрицательный)
 Дата публикации
 Имя автора
 Текст твита
 Количество реплаев
 Количество ретвитов
Тренировочный корпус
 34235 положительных текстов
 34225 отрицательных текстов
 32065 нейтральных текстов

Total: 100 525
Морфологический
анализ
Задача
1. Выявить закономерности распределения

частей речи между коллекциями заведомо
состоящих или не состоящих из
эмоционально окрашенных
высказываний.
2. Выявить закономерности распределения

частей речи между «положительной» и
«отрицательной» коллекциями
Инструмент
Tree tagger для русского языка (Shmid 1994), Шаров.
Результаты
Эмоции vs нейтральность
Авторы, выражающие эмоции, склонны использовать
 Наречия
 Частицы
 Существительные и.п. М и Ж рода
Эмоции vs нейтральность
Примеры используемых наречий:
 Прекрасно
 Беспощадно
 Стыдно
 Интересно
 Дико
Эмоции vs нейтральность
Позитивные VS неативные
• Глагол в активном залоге настоящего
времени, 1 и 3 лицо, ед. число.
• Глагол в активном залоге, прошедшее
время, 1 и 3 лицо, ед. число.
• Притяжательные местоимения м и ж
рода, ед. числе, родительном падеже.

• глаголы настоящего времени, обозначающие
продолжительность действия в третьем лице
единственного числа несовершенного вида
• сравнительно чаще используются имена
собственные в единственном числе в
винительном падеже
Позитивные VS неативные
Извлечение оценочных слов
из тренировочного корпуса
Словарь стоп-слов
 Фамилии (Навальный)
 Названия продуктов (ФК «Зенит»)
 Яркие мировые события
 Предлоги
 Союзы
Положительные оценочные слова
Вес слова (отношение
Слово
частоты встречаемости слова
в положительных твитах к
частоте встречаемости в
отрицательных)

Частота встречаемости
слова в коллекции
положительных твитов

4.097362044 клип

60

2.230786002 сериал

56

2.22893319 бл*

401

2.192768754 х**

2211

1.657155316 приятный
1.6101914 рад

52
64

1.434076715 зато

60

1.414158983 крутой

71

1.354405787 смеяться

51
Отрицательные оценочные слова
Вес слова (отношение
Слово
частоты встречаемости слова
в отрицательных твитах к
частоте встречаемости в
положительных)
13.01650495 продажа
10.22725389 утро
6.5610792 встать

Частота
встречаемости слова
в коллекции
отрицательных
твитах
56
484
69

6.136352334 проснуться

88

5.835406825 вставать

53

4.881189357 вчера
4.685941782 погибнуть
4.623486813 школа
4.532532974 рано

119
56
305
52
Выводы
 построен корпус текстов, автоматически

размеченный на три класса.
 В корпусе около 100 000 постов
 Каждый текст в корпусе содержит

атрибуты, которые помогут сделать
выводы об актуальности высказывания и
силе его воздействия, важности.
 Корпус морфологически размечен.
 Извлечены оценочных терминов, не

относящихся к одной заранее
определенной предметной области.
Дальнейшая работа
Тоновый классификатор
Весами для тонового классификатора, на
основании которых будет определена
вероятность принадлежности высказывания
к тому или иному классу являются:
 Актуальность высказывания, сила его

воздействия
 Морфология предложений
 Оценочные слова
Разрабатывается программный
комплекс для построения корпусов
отзывов из разных источников.

Корпуса могут быть использованы для
тренировки других классификаторов.
Применение
Тоновый классификатор будет
использован для автоматический
оценки отзывов на интернет-ресурсы,
найденные в качестве кандидатов на
включение в интеллектуальные
научные интернет-ресурсы (ИНИР)
Спасибо
Вопросы?

Юлия Рубцова

More Related Content

Viewers also liked

G 20 e o mundo multipolar
G 20 e o mundo multipolarG 20 e o mundo multipolar
G 20 e o mundo multipolar
Oberlania Alves
 
2.2.4 regionalizacao-mundial-e-o-conflito-norte-sul
2.2.4 regionalizacao-mundial-e-o-conflito-norte-sul2.2.4 regionalizacao-mundial-e-o-conflito-norte-sul
2.2.4 regionalizacao-mundial-e-o-conflito-norte-sul
Alexandre Quadrado
 
Divisão em norte e sul
Divisão em norte e sulDivisão em norte e sul
Divisão em norte e sul
TI Medianeira
 
Desigualdade Social
Desigualdade SocialDesigualdade Social
Desigualdade Social
andreatlc
 
Populacao Brasileira
Populacao BrasileiraPopulacao Brasileira
Populacao Brasileira
martallbo
 
A divisão norte sul
A divisão norte sulA divisão norte sul
A divisão norte sul
Professor
 

Viewers also liked (20)

NOVA ORDEM AMBIENTAL
NOVA ORDEM AMBIENTALNOVA ORDEM AMBIENTAL
NOVA ORDEM AMBIENTAL
 
Desigualdades Sociais
Desigualdades SociaisDesigualdades Sociais
Desigualdades Sociais
 
Subdesenvolvimento
SubdesenvolvimentoSubdesenvolvimento
Subdesenvolvimento
 
Subdesenvolvimento.
Subdesenvolvimento.Subdesenvolvimento.
Subdesenvolvimento.
 
G 20 e o mundo multipolar
G 20 e o mundo multipolarG 20 e o mundo multipolar
G 20 e o mundo multipolar
 
2.2.4 regionalizacao-mundial-e-o-conflito-norte-sul
2.2.4 regionalizacao-mundial-e-o-conflito-norte-sul2.2.4 regionalizacao-mundial-e-o-conflito-norte-sul
2.2.4 regionalizacao-mundial-e-o-conflito-norte-sul
 
Norte e Sul
Norte e SulNorte e Sul
Norte e Sul
 
A nova ordem mundial ou mulitpolaridade
A nova ordem mundial ou mulitpolaridadeA nova ordem mundial ou mulitpolaridade
A nova ordem mundial ou mulitpolaridade
 
Divisão em norte e sul
Divisão em norte e sulDivisão em norte e sul
Divisão em norte e sul
 
Desigualdades Sociais
Desigualdades SociaisDesigualdades Sociais
Desigualdades Sociais
 
Slides da aula de Sociologia (Luciano) sobre Desigualdade Social
Slides da aula de Sociologia (Luciano) sobre Desigualdade SocialSlides da aula de Sociologia (Luciano) sobre Desigualdade Social
Slides da aula de Sociologia (Luciano) sobre Desigualdade Social
 
Desigualdade Social
Desigualdade SocialDesigualdade Social
Desigualdade Social
 
Populacao Brasileira
Populacao BrasileiraPopulacao Brasileira
Populacao Brasileira
 
Sociologia Desigualdade Social
Sociologia Desigualdade SocialSociologia Desigualdade Social
Sociologia Desigualdade Social
 
Desigualdades sociais
Desigualdades sociaisDesigualdades sociais
Desigualdades sociais
 
Países desenvolvidos e subdesenvolvidos
Países desenvolvidos e subdesenvolvidos Países desenvolvidos e subdesenvolvidos
Países desenvolvidos e subdesenvolvidos
 
Geo o crescimento da população mundial
Geo o crescimento da população mundialGeo o crescimento da população mundial
Geo o crescimento da população mundial
 
DESIGUALDADE SOCIAL NO BRASIL
DESIGUALDADE SOCIAL NO BRASIL DESIGUALDADE SOCIAL NO BRASIL
DESIGUALDADE SOCIAL NO BRASIL
 
A divisão norte sul
A divisão norte sulA divisão norte sul
A divisão norte sul
 
Geografia brasil população
Geografia   brasil populaçãoGeografia   brasil população
Geografia brasil população
 

Similar to Метод построения корпуса коротких текстов

Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text Alalize
Ochirov Tsyren
 
извлечение объектов и фактов из текстов
извлечение объектов и фактов из текстовизвлечение объектов и фактов из текстов
извлечение объектов и фактов из текстов
Yandex
 
расчетная работа мапо Михалюк В.А. пос-10б
расчетная работа мапо Михалюк В.А. пос-10брасчетная работа мапо Михалюк В.А. пос-10б
расчетная работа мапо Михалюк В.А. пос-10б
Верочка Михалюк
 
Как точно определить задачи и выбрать метод: канва для исследователя
Как точно определить задачи и выбрать метод: канва для исследователяКак точно определить задачи и выбрать метод: канва для исследователя
Как точно определить задачи и выбрать метод: канва для исследователя
ПрофсоUX
 

Similar to Метод построения корпуса коротких текстов (19)

Дифференциальное измерение эмоциональности c помощью алгоритма PMI-IR
Дифференциальное измерение эмоциональности c помощью алгоритма PMI-IRДифференциальное измерение эмоциональности c помощью алгоритма PMI-IR
Дифференциальное измерение эмоциональности c помощью алгоритма PMI-IR
 
P06 vaal kav
P06 vaal kavP06 vaal kav
P06 vaal kav
 
SentiScan: система автоматической разметки тональности в social media
SentiScan: система автоматической разметки тональности в social mediaSentiScan: система автоматической разметки тональности в social media
SentiScan: система автоматической разметки тональности в social media
 
Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text Alalize
 
lexicon
lexiconlexicon
lexicon
 
Автоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекцииАвтоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекции
 
Механизмы обеспечения связности в системах динамической генерации текстов
Механизмы обеспечения связности в системах динамической генерации текстовМеханизмы обеспечения связности в системах динамической генерации текстов
Механизмы обеспечения связности в системах динамической генерации текстов
 
Банк тестов
Банк тестовБанк тестов
Банк тестов
 
06 автоматические ответы на вопросы
06 автоматические ответы на вопросы06 автоматические ответы на вопросы
06 автоматические ответы на вопросы
 
Рубен Гиридов
Рубен ГиридовРубен Гиридов
Рубен Гиридов
 
презентация краткое иложение гиа
презентация  краткое иложение гиапрезентация  краткое иложение гиа
презентация краткое иложение гиа
 
Максим Литвинов
Максим ЛитвиновМаксим Литвинов
Максим Литвинов
 
извлечение объектов и фактов из текстов
извлечение объектов и фактов из текстовизвлечение объектов и фактов из текстов
извлечение объектов и фактов из текстов
 
Диаграмма вариантов использования
Диаграмма вариантов использованияДиаграмма вариантов использования
Диаграмма вариантов использования
 
расчетная работа мапо Михалюк В.А. пос-10б
расчетная работа мапо Михалюк В.А. пос-10брасчетная работа мапо Михалюк В.А. пос-10б
расчетная работа мапо Михалюк В.А. пос-10б
 
зачет 10 класс 2 полугодие
зачет 10 класс 2 полугодиезачет 10 класс 2 полугодие
зачет 10 класс 2 полугодие
 
Управление Эмоциями.2
Управление Эмоциями.2Управление Эмоциями.2
Управление Эмоциями.2
 
Автоматическое формирование базы знаний для задачи анализа мнений
Автоматическое формирование базы знаний для задачи анализа мненийАвтоматическое формирование базы знаний для задачи анализа мнений
Автоматическое формирование базы знаний для задачи анализа мнений
 
Как точно определить задачи и выбрать метод: канва для исследователя
Как точно определить задачи и выбрать метод: канва для исследователяКак точно определить задачи и выбрать метод: канва для исследователя
Как точно определить задачи и выбрать метод: канва для исследователя
 

More from Yuliya Rubtsova

Web analytics в картинках и денежных знаках
Web analytics в картинках и денежных знакахWeb analytics в картинках и денежных знаках
Web analytics в картинках и денежных знаках
Yuliya Rubtsova
 
Продвижение мобильных приложений в AppStore и Google Play
Продвижение мобильных приложений в AppStore и Google PlayПродвижение мобильных приложений в AppStore и Google Play
Продвижение мобильных приложений в AppStore и Google Play
Yuliya Rubtsova
 

More from Yuliya Rubtsova (17)

Как продать самолет с помощью соц.сетей или социальные сети для бизнеса
Как продать самолет с помощью соц.сетей или социальные сети для бизнесаКак продать самолет с помощью соц.сетей или социальные сети для бизнеса
Как продать самолет с помощью соц.сетей или социальные сети для бизнеса
 
Entity-oriented sentiment analysis of tweets: results and problems
Entity-oriented sentiment analysis of tweets: results and problemsEntity-oriented sentiment analysis of tweets: results and problems
Entity-oriented sentiment analysis of tweets: results and problems
 
Aspect extraction using conditional random fields [SentiRuEval]
Aspect extraction using conditional random fields [SentiRuEval]Aspect extraction using conditional random fields [SentiRuEval]
Aspect extraction using conditional random fields [SentiRuEval]
 
Automatic term extraction of dynamically updated text collections for sentime...
Automatic term extraction of dynamically updated text collections for sentime...Automatic term extraction of dynamically updated text collections for sentime...
Automatic term extraction of dynamically updated text collections for sentime...
 
Измеряй и властвуй или практическая web-аналитика
Измеряй и властвуй или практическая web-аналитика Измеряй и властвуй или практическая web-аналитика
Измеряй и властвуй или практическая web-аналитика
 
Веб аналитика на практике
Веб аналитика на практикеВеб аналитика на практике
Веб аналитика на практике
 
Mad analyst
Mad analyst   Mad analyst
Mad analyst
 
Курс леций по основам интернет маркетинга и поисковой оптимизации
Курс леций по основам интернет маркетинга и поисковой оптимизацииКурс леций по основам интернет маркетинга и поисковой оптимизации
Курс леций по основам интернет маркетинга и поисковой оптимизации
 
Web analytics в картинках и денежных знаках
Web analytics в картинках и денежных знакахWeb analytics в картинках и денежных знаках
Web analytics в картинках и денежных знаках
 
Продвижение мобильных приложений в AppStore и Google Play
Продвижение мобильных приложений в AppStore и Google PlayПродвижение мобильных приложений в AppStore и Google Play
Продвижение мобильных приложений в AppStore и Google Play
 
Увеличение конверсии сайта
Увеличение конверсии сайтаУвеличение конверсии сайта
Увеличение конверсии сайта
 
Как из посетителя сделать покупателя
Как из посетителя сделать покупателяКак из посетителя сделать покупателя
Как из посетителя сделать покупателя
 
Mobile applications market
Mobile applications marketMobile applications market
Mobile applications market
 
Intranet
IntranetIntranet
Intranet
 
Networking
NetworkingNetworking
Networking
 
Usability testing
Usability testingUsability testing
Usability testing
 
Twitter marketing communications
Twitter marketing communicationsTwitter marketing communications
Twitter marketing communications
 

Метод построения корпуса коротких текстов

  • 1. Проблемы построения корпуса коротких текстов для задачи классификации отзывов на три класса Юлия Рубцова Институт систем информатики им. А.П. Ершова СО РАН
  • 2. Содержание  Обзор предметной области  Сбор корпуса  Фильтрация  Морфологический анализ  Результаты и закономерности  Выводы  Применение
  • 4. UGC – user generated content
  • 5. Задачи извлечения и обработки информации из текстов
  • 6. Прикладные задачи, которые решает автоматическое определение тональности  исследования отношения потребителей к ее продукции для коммерческой организации;
  • 7.
  • 8. Прикладные задачи, которые решает автоматическое определение тональности  исследования отношения потребителей к ее продукции для коммерческой организации;  разработка рекомендательной системы для покупателей определенных групп товаров или услуг;
  • 9.
  • 10. Прикладные задачи, которые решает автоматическое определение тональности  исследования отношения потребителей к ее продукции для коммерческой организации;  разработка рекомендательной системы для покупателей определенных групп товаров или услуг;  введение в человеко-машинный интерфейс компьютерной системы, отвечающей за адаптацию поведения системы к текущему эмоциональному состоянию человека
  • 11. человеко-машинный интерфейс, отвечающей за адаптацию поведения системы к текущему эмоциональному состоянию человека  психологическое и медицинское диагностирование;  обеспечение безопасности за счет анализа поведения массовых скоплений людей;  помощь в проведении оперативно- розыскных мероприятий
  • 12. Тональность текстов  Два класса  Три класса  5 классов  10 классов  N-классов
  • 13. Существующие корпусы текстов  Корпуса отзывов, содержащие оценки пользователей  Узкотематические корпуса отзывов (фильмы, книги, техника)  Корпуса общезначимых новостей (тексты состоящие из нескольких абзацев)
  • 14. Отличие микроблога от сервиса отзывов • • • • • • • • • • Обдуманный, структурированный Конструктивная критика или похвала Не ограничен по длине Относится к одной предметной области Может одновременно выражать и негатиное отношение и позитивное Спонтанны Эмоциональны Ограничение по длине в 140 символов Общетематический ресурс Один текст – одна эмоция
  • 16. Корпус С высокой точностью можно определить передаваемую эмоцию, если автор указал символ обозначения эмоции на письме (смайлик). [Метод J.Read 2005] :) :( :-/ 8-) =( 0_о :-D ;-) :-) ((( :’(
  • 17. Подготовка 1. Составлены словари символов, обозначающие на письме:  отрицательные эмоции,  Положительные эмоции.
  • 18. Подготовка 1. Составлены словари символов, обозначающие на письме:  отрицательные эмоции,  Положительные эмоции. 2. Сделано допущение, что выражение эмоции относится ко всему сообщению, а не к отдельной его части. (Длина твита 140 символов).
  • 19. Подготовка корпуса 1. Составлены словари символов, обозначающие на письме:  отрицательные эмоции,  Положительные эмоции. 2. Сделано допущение, что выражение эмоции относится ко всему сообщению, а не к отдельной его части. (Длина твита 140 символов). 3. Созданы фильтры для устранения дубликатов и неопределенностей.
  • 20. Фильтрация  Положительные и отрицательные эмоции в одном твите  Retweet  Копии твитов  Малоинформативные твиты (<40 символов)  Реплаи
  • 21. Сложности API twitter отдает только 1000 постов на каждый поисковый запрос с географической привязкой
  • 22. Атрибуты корпуса  Класс, к которому принадлежит твит (положительный/отрицательный)  Дата публикации  Имя автора  Текст твита  Количество реплаев  Количество ретвитов
  • 23. Тренировочный корпус  34235 положительных текстов  34225 отрицательных текстов  32065 нейтральных текстов Total: 100 525
  • 25. Задача 1. Выявить закономерности распределения частей речи между коллекциями заведомо состоящих или не состоящих из эмоционально окрашенных высказываний. 2. Выявить закономерности распределения частей речи между «положительной» и «отрицательной» коллекциями
  • 26. Инструмент Tree tagger для русского языка (Shmid 1994), Шаров.
  • 28. Эмоции vs нейтральность Авторы, выражающие эмоции, склонны использовать  Наречия  Частицы  Существительные и.п. М и Ж рода
  • 29. Эмоции vs нейтральность Примеры используемых наречий:  Прекрасно  Беспощадно  Стыдно  Интересно  Дико
  • 31. Позитивные VS неативные • Глагол в активном залоге настоящего времени, 1 и 3 лицо, ед. число. • Глагол в активном залоге, прошедшее время, 1 и 3 лицо, ед. число. • Притяжательные местоимения м и ж рода, ед. числе, родительном падеже. • глаголы настоящего времени, обозначающие продолжительность действия в третьем лице единственного числа несовершенного вида • сравнительно чаще используются имена собственные в единственном числе в винительном падеже
  • 33. Извлечение оценочных слов из тренировочного корпуса
  • 34. Словарь стоп-слов  Фамилии (Навальный)  Названия продуктов (ФК «Зенит»)  Яркие мировые события  Предлоги  Союзы
  • 35. Положительные оценочные слова Вес слова (отношение Слово частоты встречаемости слова в положительных твитах к частоте встречаемости в отрицательных) Частота встречаемости слова в коллекции положительных твитов 4.097362044 клип 60 2.230786002 сериал 56 2.22893319 бл* 401 2.192768754 х** 2211 1.657155316 приятный 1.6101914 рад 52 64 1.434076715 зато 60 1.414158983 крутой 71 1.354405787 смеяться 51
  • 36. Отрицательные оценочные слова Вес слова (отношение Слово частоты встречаемости слова в отрицательных твитах к частоте встречаемости в положительных) 13.01650495 продажа 10.22725389 утро 6.5610792 встать Частота встречаемости слова в коллекции отрицательных твитах 56 484 69 6.136352334 проснуться 88 5.835406825 вставать 53 4.881189357 вчера 4.685941782 погибнуть 4.623486813 школа 4.532532974 рано 119 56 305 52
  • 38.  построен корпус текстов, автоматически размеченный на три класса.  В корпусе около 100 000 постов  Каждый текст в корпусе содержит атрибуты, которые помогут сделать выводы об актуальности высказывания и силе его воздействия, важности.  Корпус морфологически размечен.  Извлечены оценочных терминов, не относящихся к одной заранее определенной предметной области.
  • 40. Тоновый классификатор Весами для тонового классификатора, на основании которых будет определена вероятность принадлежности высказывания к тому или иному классу являются:  Актуальность высказывания, сила его воздействия  Морфология предложений  Оценочные слова
  • 41. Разрабатывается программный комплекс для построения корпусов отзывов из разных источников. Корпуса могут быть использованы для тренировки других классификаторов.
  • 43. Тоновый классификатор будет использован для автоматический оценки отзывов на интернет-ресурсы, найденные в качестве кандидатов на включение в интеллектуальные научные интернет-ресурсы (ИНИР)