SlideShare uma empresa Scribd logo
1 de 71
Извлечение информации Лидия Михайловна Пивоварова Системы понимания текста
Введение ,[object Object],Information Retrieval Text Understanding Information Extraction
Мотивация ,[object Object],[object Object],[object Object]
Содержание ,[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],MUC  ( Message Understanding Conference),  1987-1997 крушения самолетов, запуски ракет новости 1997 MUC-7 смена лидеров на рынке новости 1995 MUC-6 совместные предприятия, производство  новости 1993 MUC-5 Террористическая активность новости 1992 MUC-4 Террористическая активность новости 1991 MUC-3 военно-морские операции военные сводки 1989 MUC-2 военно-морские операции военные сводки 1987 MUC-1 Предметная область Источники Год
[object Object],[object Object],[object Object],[object Object],[object Object],Дорожки  MUC
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Блестящая Красная Ракета 0267 Светоотражательные свойства Цвет Объект Ключ
[object Object],[object Object],[object Object],Блестящая Светоотражательные свойства 7824 Изобретен Красная Ракета 0267 Цвет Объект Ключ 2345 Работает 452 Должность Доктор Биг Хед 7824 Степень ФИО Ключ Вторник Дата 0267 Запуск 18 Объект Тип события Ключ
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Оценка
Дальнейшее развитие ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Содержание ,[object Object],[object Object],[object Object],[object Object],[object Object]
Основные подходы ,[object Object],[object Object],[object Object],[object Object],[object Object]
Образцы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Машинное обучение ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Правила ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Содержание ,[object Object],[object Object],[object Object],[object Object],[object Object]
Извлечение именованных сущностей ,[object Object],[object Object],[object Object],[object Object],[object Object]
Основные подходы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Содержание ,[object Object],[object Object],[object Object],[object Object],[object Object]
Извлечение отношений между понятиями ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Анафора и кореференция ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Содержание ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Система фактографического поиска в газетных текстах ,[object Object],[object Object]
Система  Factors ,[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],ТЕКСТЫ FACTORS Значение Фактор
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Содержание ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],Система автоматического пополнения онтологии на основе
Пополнение онтологий ,[object Object],[object Object]
Источник ,[object Object],[object Object],[object Object]
Гипотеза ,[object Object],[object Object]
Примеры ,[object Object],[object Object]
Общий алгоритм анализа
[object Object],[object Object],[object Object],Лексикографическая обработка
[object Object],[object Object],АКСЕЛЕРАЦИЯ -  (В   антропологии)  ускорение роста и полового созревания детей и подростков АКСЕЛЕРАЦИЯ - ускорение роста и полового созревания детей и подростков Лексикографическая обработка
[object Object],[object Object],[object Object],Синтаксический анализ
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Упрощенные правила
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Синтаксический анализ: снятие неоднозначности До   После Лемм / слово 1,27 1,06 Морфологических вариантов / слово 2,26 1,64
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Неоднозначность: пример
[object Object],[object Object],[object Object],Отношение между термином и определением
Типы выделяемых отношений Тождество Same Обобщение (значение по умолчанию) Gen Частный случай (обратное к GEN) Spec Часть Part Целое Whole Назначение Func другое Other
Правила ,[object Object],[object Object],[object Object]
Примеры правил: тождество ,[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],Примеры правил: тождество
[object Object],[object Object],[object Object],[object Object],Зачем нужен первый пункт
[object Object],[object Object],[object Object],Общий вид правил
[object Object],[object Object],[object Object],[object Object],Примеры правил: обобщение
[object Object],[object Object],[object Object],Примеры правил: обобщение
[object Object],[object Object],[object Object],Примеры правил: часть
[object Object],[object Object],[object Object],[object Object],[object Object],Примеры правил: часть
[object Object],[object Object],[object Object],Примеры правил: целое
[object Object],[object Object],[object Object],[object Object],[object Object],Примеры правил: целое
[object Object],[object Object],[object Object],[object Object],Примеры правил: инструмент/назначение
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Примеры правил: инструмент/назначение
[object Object],[object Object],[object Object],[object Object],[object Object],«Сложные» правила
[object Object],[object Object],[object Object],Другие типы отношений
Другие типы отношений характеристика распространение признак переход свойство извлечение число превращение показатель введение степень выделение количество возникновение характер нарушение масса прерывание состояние развитие способность образование место увеличение источник уменьшение
[object Object],[object Object],[object Object],[object Object],[object Object],Правила: резюме
[object Object],[object Object],[object Object],[object Object],[object Object],Оценка
[object Object],[object Object],[object Object]
[object Object],Пополнение онтологии единица    измерения ПИДЖИН язык GEN Текст определения ЗАИЛЕНИЕ мелиорация  FUNC Текст определения ФЕН аппарат GEN Текст определения ФЕН  сушка  FUNC Текст определения ПАРСЕК единица GEN Текст определения
[object Object],[object Object],[object Object],[object Object],Процедура пополнения
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Пополнение онтологии: пример
Источники ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Mais conteúdo relacionado

Mais procurados

Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическая
AINL Conferences
 
Information Extraction Overview
Information Extraction OverviewInformation Extraction Overview
Information Extraction Overview
NLPseminar
 
Проектирование программных систем. Занятие 8
Проектирование программных систем. Занятие 8Проектирование программных систем. Занятие 8
Проектирование программных систем. Занятие 8
Dima Dzuba
 
Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"
Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"
Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"
Rostislav Shorgin
 
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
AIST
 
07 автоматическое реферирование
07 автоматическое реферирование07 автоматическое реферирование
07 автоматическое реферирование
Lidia Pivovarova
 
Системы аннотирования и реферирования
Системы аннотирования и реферированияСистемы аннотирования и реферирования
Системы аннотирования и реферирования
Artem Lukanin
 

Mais procurados (20)

Tomita
TomitaTomita
Tomita
 
Комбинирование факторов для разрешения референции местоимений
Комбинирование факторов для разрешения референции местоименийКомбинирование факторов для разрешения референции местоимений
Комбинирование факторов для разрешения референции местоимений
 
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
 
Максим Литвинов
Максим ЛитвиновМаксим Литвинов
Максим Литвинов
 
Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическая
 
Information Extraction Overview
Information Extraction OverviewInformation Extraction Overview
Information Extraction Overview
 
Котиков Простые методы выделения ключевых слов и построения рефератов
Котиков Простые методы выделения ключевых слов и построения рефератовКотиков Простые методы выделения ключевых слов и построения рефератов
Котиков Простые методы выделения ключевых слов и построения рефератов
 
Проектирование программных систем. Занятие 8
Проектирование программных систем. Занятие 8Проектирование программных систем. Занятие 8
Проектирование программных систем. Занятие 8
 
Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"
Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"
Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"
 
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
 
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
 
07 автоматическое реферирование
07 автоматическое реферирование07 автоматическое реферирование
07 автоматическое реферирование
 
Системы автоматического составления обзорных рефератов
Системы автоматического составления обзорных рефератовСистемы автоматического составления обзорных рефератов
Системы автоматического составления обзорных рефератов
 
Системы аннотирования и реферирования
Системы аннотирования и реферированияСистемы аннотирования и реферирования
Системы аннотирования и реферирования
 
Авиком
АвикомАвиком
Авиком
 
Основы проектно-исследовательской деятельности. Ч.1
Основы проектно-исследовательской деятельности. Ч.1Основы проектно-исследовательской деятельности. Ч.1
Основы проектно-исследовательской деятельности. Ч.1
 
Data Science Weekend 2017. Segmento, На пути к идеальной диалоговой системе
Data Science Weekend 2017.  Segmento, На пути к идеальной диалоговой системеData Science Weekend 2017.  Segmento, На пути к идеальной диалоговой системе
Data Science Weekend 2017. Segmento, На пути к идеальной диалоговой системе
 
Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.
 
Сбор, анализ, обработка текстовой информации
Сбор, анализ, обработка текстовой информацииСбор, анализ, обработка текстовой информации
Сбор, анализ, обработка текстовой информации
 
Иванов. Автоматизация построения предметных указателей
Иванов. Автоматизация построения предметных указателейИванов. Автоматизация построения предметных указателей
Иванов. Автоматизация построения предметных указателей
 

Destaque

Time Management Movie Ppt Version Sample
Time Management Movie Ppt Version SampleTime Management Movie Ppt Version Sample
Time Management Movie Ppt Version Sample
Andrew Schwartz
 
2009年的祝福
2009年的祝福2009年的祝福
2009年的祝福
nonnon
 
Constr spb2015
Constr spb2015Constr spb2015
Constr spb2015
Lidia Pivovarova
 
Telemarketing Movie Ppt Version Sample
Telemarketing Movie Ppt Version SampleTelemarketing Movie Ppt Version Sample
Telemarketing Movie Ppt Version Sample
Andrew Schwartz
 
Challenging employeesmodernsamplefinal
Challenging employeesmodernsamplefinalChallenging employeesmodernsamplefinal
Challenging employeesmodernsamplefinal
Andrew Schwartz
 
美丽的新疆
美丽的新疆美丽的新疆
美丽的新疆
Dong Wang
 

Destaque (13)

Startende ondernemer
Startende ondernemerStartende ondernemer
Startende ondernemer
 
Italy Powepoint Country
Italy Powepoint CountryItaly Powepoint Country
Italy Powepoint Country
 
Time Management Movie Ppt Version Sample
Time Management Movie Ppt Version SampleTime Management Movie Ppt Version Sample
Time Management Movie Ppt Version Sample
 
2009年的祝福
2009年的祝福2009年的祝福
2009年的祝福
 
Constr spb2015
Constr spb2015Constr spb2015
Constr spb2015
 
Telemarketing Movie Ppt Version Sample
Telemarketing Movie Ppt Version SampleTelemarketing Movie Ppt Version Sample
Telemarketing Movie Ppt Version Sample
 
MNR & Anti MNR In Conductivity Of Highly Crystallized Undoped Microcrystallin...
MNR & Anti MNR In Conductivity Of Highly Crystallized Undoped Microcrystallin...MNR & Anti MNR In Conductivity Of Highly Crystallized Undoped Microcrystallin...
MNR & Anti MNR In Conductivity Of Highly Crystallized Undoped Microcrystallin...
 
O2 sms asistent pro veřejnou správu
O2 sms asistent pro veřejnou správuO2 sms asistent pro veřejnou správu
O2 sms asistent pro veřejnou správu
 
Challenging employeesmodernsamplefinal
Challenging employeesmodernsamplefinalChallenging employeesmodernsamplefinal
Challenging employeesmodernsamplefinal
 
Netpluswork
NetplusworkNetpluswork
Netpluswork
 
Insurance
InsuranceInsurance
Insurance
 
Chapter1
Chapter1Chapter1
Chapter1
 
美丽的新疆
美丽的新疆美丽的新疆
美丽的新疆
 

Semelhante a 04 извлечение информации

Задачи системного аналитика (конспект лекций Школы системного анализа)
Задачи системного аналитика (конспект лекций Школы системного анализа)Задачи системного аналитика (конспект лекций Школы системного анализа)
Задачи системного аналитика (конспект лекций Школы системного анализа)
Anton Konstantinov
 
Контент инижиниринг - Лекция 1
Контент инижиниринг - Лекция 1Контент инижиниринг - Лекция 1
Контент инижиниринг - Лекция 1
Elena Tikhomirova
 
Ai lab
Ai labAi lab
Ai lab
aaa
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 final
yaevents
 
Algorithms overview for content discovery and distribution (on russian)
Algorithms overview for content discovery and distribution (on russian) Algorithms overview for content discovery and distribution (on russian)
Algorithms overview for content discovery and distribution (on russian)
Alexander Petrov
 
Презентация пособия "Технология разработки дистанционного курса. Кухаренко В....
Презентация пособия "Технология разработки дистанционного курса. Кухаренко В....Презентация пособия "Технология разработки дистанционного курса. Кухаренко В....
Презентация пособия "Технология разработки дистанционного курса. Кухаренко В....
Сообщество eLearning PRO
 
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллектаОсипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Grigory Pomadchin
 
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
Yandex
 
информационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетинформационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернет
Inno4ka2323
 

Semelhante a 04 извлечение информации (20)

Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текста
 
01 информационный поиск
01 информационный поиск01 информационный поиск
01 информационный поиск
 
06 автоматические ответы на вопросы
06 автоматические ответы на вопросы06 автоматические ответы на вопросы
06 автоматические ответы на вопросы
 
Задачи системного аналитика (конспект лекций Школы системного анализа)
Задачи системного аналитика (конспект лекций Школы системного анализа)Задачи системного аналитика (конспект лекций Школы системного анализа)
Задачи системного аналитика (конспект лекций Школы системного анализа)
 
Контент инижиниринг - Лекция 1
Контент инижиниринг - Лекция 1Контент инижиниринг - Лекция 1
Контент инижиниринг - Лекция 1
 
RuSSIR 2008. Как это было...
RuSSIR 2008. Как это было...RuSSIR 2008. Как это было...
RuSSIR 2008. Как это было...
 
Ai lab
Ai labAi lab
Ai lab
 
Информационный поиск. Методы оценки качества поиска. Эволюция результатов
Информационный поиск. Методы оценки качества поиска. Эволюция результатовИнформационный поиск. Методы оценки качества поиска. Эволюция результатов
Информационный поиск. Методы оценки качества поиска. Эволюция результатов
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 final
 
Algorithms overview for content discovery and distribution (on russian)
Algorithms overview for content discovery and distribution (on russian) Algorithms overview for content discovery and distribution (on russian)
Algorithms overview for content discovery and distribution (on russian)
 
Informacia v-baze-dannyh-docazatelnoi-mediciny
Informacia v-baze-dannyh-docazatelnoi-medicinyInformacia v-baze-dannyh-docazatelnoi-mediciny
Informacia v-baze-dannyh-docazatelnoi-mediciny
 
Принципы работы поисковой системы
Принципы работы поисковой системыПринципы работы поисковой системы
Принципы работы поисковой системы
 
Принципы работы поисковой системы
Принципы работы поисковой системыПринципы работы поисковой системы
Принципы работы поисковой системы
 
Презентация пособия "Технология разработки дистанционного курса. Кухаренко В....
Презентация пособия "Технология разработки дистанционного курса. Кухаренко В....Презентация пособия "Технология разработки дистанционного курса. Кухаренко В....
Презентация пособия "Технология разработки дистанционного курса. Кухаренко В....
 
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллектаОсипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
Осипов Г.С. Конспект лекций по дисциплине «системы искусственного интеллекта
 
IEforQD
IEforQDIEforQD
IEforQD
 
НИР "Анализ информационной деятельности территориальных органов МЧС России"
НИР "Анализ информационной деятельности территориальных органов МЧС России"НИР "Анализ информационной деятельности территориальных органов МЧС России"
НИР "Анализ информационной деятельности территориальных органов МЧС России"
 
Онтологии и информационная архитектура: соотношение терминов и потенциал совм...
Онтологии и информационная архитектура: соотношение терминов и потенциал совм...Онтологии и информационная архитектура: соотношение терминов и потенциал совм...
Онтологии и информационная архитектура: соотношение терминов и потенциал совм...
 
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
 
информационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетинформационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернет
 

Mais de Lidia Pivovarova

Mais de Lidia Pivovarova (20)

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classification
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entities
 
AINL 2016: Yagunova
AINL 2016: YagunovaAINL 2016: Yagunova
AINL 2016: Yagunova
 
AINL 2016: Kuznetsova
AINL 2016: KuznetsovaAINL 2016: Kuznetsova
AINL 2016: Kuznetsova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, Maksimov
 
AINL 2016: Boldyreva
AINL 2016: BoldyrevaAINL 2016: Boldyreva
AINL 2016: Boldyreva
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
 
AINL 2016: Kozerenko
AINL 2016: Kozerenko AINL 2016: Kozerenko
AINL 2016: Kozerenko
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, Selegey
 
AINL 2016: Khudobakhshov
AINL 2016: KhudobakhshovAINL 2016: Khudobakhshov
AINL 2016: Khudobakhshov
 
AINL 2016: Proncheva
AINL 2016: PronchevaAINL 2016: Proncheva
AINL 2016: Proncheva
 
AINL 2016:
AINL 2016: AINL 2016:
AINL 2016:
 
AINL 2016: Bugaychenko
AINL 2016: BugaychenkoAINL 2016: Bugaychenko
AINL 2016: Bugaychenko
 
AINL 2016: Grigorieva
AINL 2016: GrigorievaAINL 2016: Grigorieva
AINL 2016: Grigorieva
 
AINL 2016: Muravyov
AINL 2016: MuravyovAINL 2016: Muravyov
AINL 2016: Muravyov
 
AINL 2016: Just AI
AINL 2016: Just AIAINL 2016: Just AI
AINL 2016: Just AI
 
AINL 2016: Moskvichev
AINL 2016: MoskvichevAINL 2016: Moskvichev
AINL 2016: Moskvichev
 
AINL 2016: Goncharov
AINL 2016: GoncharovAINL 2016: Goncharov
AINL 2016: Goncharov
 
AINL 2016: Malykh
AINL 2016: MalykhAINL 2016: Malykh
AINL 2016: Malykh
 

04 извлечение информации

  • 1. Извлечение информации Лидия Михайловна Пивоварова Системы понимания текста
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45. Синтаксический анализ: снятие неоднозначности До После Лемм / слово 1,27 1,06 Морфологических вариантов / слово 2,26 1,64
  • 46.
  • 47.
  • 48. Типы выделяемых отношений Тождество Same Обобщение (значение по умолчанию) Gen Частный случай (обратное к GEN) Spec Часть Part Целое Whole Назначение Func другое Other
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
  • 57.
  • 58.
  • 59.
  • 60.
  • 61.
  • 62.
  • 63.
  • 64. Другие типы отношений характеристика распространение признак переход свойство извлечение число превращение показатель введение степень выделение количество возникновение характер нарушение масса прерывание состояние развитие способность образование место увеличение источник уменьшение
  • 65.
  • 66.
  • 67.
  • 68.
  • 69.
  • 70.
  • 71.

Notas do Editor

  1. Цель – оставить только текст. Ещё упрощаются ФИО (И.О.Фамилия - > Фамилия). Разворачивание сокращений делается не очень интеллектуально, т.к. по честному это можно сделать только внутри синтаксиса (сокращённому слову или группе с скоращённым словом нужно приписывать граммемы, причём, не те, что мы приписываем просто полному слову).
  2. Компоненты АОТ – это морфология + синтаксис. (Скрытый слайд – что именно сделано с синтаксисом). Группы с вершиной – существительным. (Примеры правил и текста). Про то, что АОТ, вообще-то, делает дерево составляющих, а не зависимостей – ждём вопроса.