SlideShare uma empresa Scribd logo
1 de 31
Baixar para ler offline
Парсер
Пётр Громов
gromopetr@gmail.com
План
1. Архитектура
2. Интересные конструкции
3. Применение
1. Архитектура
Текст
Семантика
Синтаксис
Перевод
Анализ
Синтез
Синтаксис
Мы поблагодарили кассиршу и с радостью выбежали из магазина .
Синтаксис: “дом”
Argument Nom
AdjHead MascSg Nom
Argument Acc
AdjHead MascSg Acc
xor
GenHead Owner
+
роль + роль = конструкция
Argument Nom NomHead
семантика
Семантика
Фреймы ИИ
V1.type=NAMED
V1.name=Masha
V2.type=LOVE
V2.time=PRESENT
V2.arg1=V1
V2cp.content=V2
V2cp.type=situation
V2.arg2=V3
V3.type=NAMED
V3.name=Vasya
V2cp.dot=true
type NAMED
name Masha
type NAMED
name Vasya
type LOVE
time PRESENT
type situation
dot true
content
arg1
arg2
makeSense "Маша любит Васю."
V1 V3
V2
V2cp
Маша любит Васю .
V1.type=NAMED
V1.name=Masha
V2.type=LOVE
V2.time=PRESENT
V2cp.content=V2
V2cp.type=situation
V3.type=NAMED
V3.name=Vasya
V2.arg2=V3
V2.arg1=V1
V2cp.dot=true
Снизу вверх (bottom-up)
Инкрементальный
Параллельный
Анализ
V1 V2
V2.arg1=V1; V2.arg2=V3
V2.arg2=V1; V2.arg1=V3
xor
Arg Nom/Acc NomHead
ArgHead Acc
> translate "Мать любит дочь"
"The mother loves the daughter"
V3
Arg Nom/Acc
Выбор лучшего варианта
1. Размер
2. Синтаксические проблемы
3. Семантические проблемы
> translate "Он увидел их семью своими глазами"
"He saw their family with his own eyes"
Синтез
2. Интересные
конструкции
возвратные местоимения,
гибридное сочинение,
эллипсис
Возвратные местоимения
Ребенок сломал себе палец
Argument Dat
Reflexive V3
ArgHead Dat Receiver
NomHead V1
V2.receiver=V3
V3.target=V1
V3.type=SELFV2.type=BREAK
сломать
ребенок ссылка
палецarg1
arg2
receiver
target
> translate "Ребенок сломал себе палец"
arg1
> translate "Кассирша сломала себе 8 пальцев"
"The cashier broke 8 of her fingers"
"The child broke his finger"
Гибридное сочинение
> translate " Маша и Вася пошли гулять."
"Masha and Vasya went for a walk."
> translate "Кто, кому и что дал?"
"Who gave what, and to whom?"
Argument Nom Argument Nom
Argument Nom
> translate "Все и всё знают"
"Everybody knows everything"
По мотивам Chaves, Rui P., & Paperno, Denis. (2007). On The Russian Hybrid Coordination Construction.
Arg Nom V1 Arg Acc V3
Seq Hybrid
SeqLeft
SeqRight
Arg Nom V1
Arg Acc V3
NomHead
ArgHead Acc Arg2
V4.arg1=V1
V4.arg2=V3
По мотивам Chaves, Rui P., & Paperno, Denis. (2007). On The Russian Hybrid Coordination Construction.
знать
все всё
arg1
arg2
и (hybrid)
member1
member2
> translate "Все и всё знают"
"Everybody knows everything"
Эллипсис
https://funwithsintext.wordpress.com/category/ellipsis/
... подлежащего
> translate "Вчера Василий был кассир, сегодня он уж
продавец, а завтра будет бригадир. Такой вот он у нас
хитрец!"
"Yesterday Vassily was a cashier, today he's already a
salesman, and tomorrow he'll be a brigadier. What a
cunning person we have here!"
> translate "1, 2 и 3 помнит, а дальше забыла"
"She remembers 1, 2 and 3, but forgot what comes next"
... сказуемого
> translate "По-моему, раньше идет 7. По мнению
кассирши - 8."
"In my opinion, a 7 comes first. In opinion of the
cashier an 8 does."
> translate "Глупый кассир идет на работу, а умные -
гулять"
"The stupid cashier goes to the work, but the smart
ones - for a walk"
> translate "Из окна вывалилась старуха. Потом другая."
"The old lady fell out of the window. Then another one
did."
3. Применение
Как устроен синтаксис языка?
1. Проанализировать маленькие тексты
2. ???
3. Обобщить на весь язык
Программе нужен не только синтаксис
Словарь
Семантический вывод
Генератор английского
Можно приблизить светлое будущее
https://github.com/donnerpeter/Constructor
● Морфология
● Онтология
● Генератор английского
● Больше тестов
● Haskell code style
● Поговорить об этом

Mais conteúdo relacionado

Mais de Natalia Ostapuk

Mais de Natalia Ostapuk (20)

Aist academic writing
Aist academic writingAist academic writing
Aist academic writing
 
Aist academic writing
Aist academic writingAist academic writing
Aist academic writing
 
Ponomareva
PonomarevaPonomareva
Ponomareva
 
Nlp seminar.kolomiyets.dec.2013
Nlp seminar.kolomiyets.dec.2013Nlp seminar.kolomiyets.dec.2013
Nlp seminar.kolomiyets.dec.2013
 
Tomita одесса
Tomita одессаTomita одесса
Tomita одесса
 
Mt engine on nlp semniar
Mt engine on nlp semniarMt engine on nlp semniar
Mt engine on nlp semniar
 
Tomita 4марта
Tomita 4мартаTomita 4марта
Tomita 4марта
 
Konyushkova
KonyushkovaKonyushkova
Konyushkova
 
Braslavsky 13.12.12
Braslavsky 13.12.12Braslavsky 13.12.12
Braslavsky 13.12.12
 
Клышинский 8.12
Клышинский 8.12Клышинский 8.12
Клышинский 8.12
 
Zizka synasc 2012
Zizka synasc 2012Zizka synasc 2012
Zizka synasc 2012
 
Zizka immm 2012
Zizka immm 2012Zizka immm 2012
Zizka immm 2012
 
Zizka aimsa 2012
Zizka aimsa 2012Zizka aimsa 2012
Zizka aimsa 2012
 
Analysis by-variants
Analysis by-variantsAnalysis by-variants
Analysis by-variants
 
место онтологий в современной инженерии на примере Iso 15926 v1
место онтологий в современной инженерии на примере Iso 15926 v1место онтологий в современной инженерии на примере Iso 15926 v1
место онтологий в современной инженерии на примере Iso 15926 v1
 
Text mining
Text miningText mining
Text mining
 
Additional2
Additional2Additional2
Additional2
 
Additional1
Additional1Additional1
Additional1
 
Seminar1
Seminar1Seminar1
Seminar1
 
2011 04 troussov_graph_basedmethods-weakknowledge
2011 04 troussov_graph_basedmethods-weakknowledge2011 04 troussov_graph_basedmethods-weakknowledge
2011 04 troussov_graph_basedmethods-weakknowledge
 

Gromov