SlideShare uma empresa Scribd logo
1 de 12
*

    Татьяна Елипашева
    12МАГКЛ
*
Numbers Tagger   Поиск чисел в        gate.creole.numbe
                 документах           rs.NumbersTagger
                 (цифровая и
                 словесная
                 формулировки) и их
                 аннотация в виде
                 числовых значений
Roman Numerals Поиск и аннотация      gate.creole.numbe
Tagger         римских чисел          rs.RomanNumeralsT
                                      agger
*
*Содержит ресурсы, разработанные для аннотирования
 чисел, появляющихся в документах.
*Определяет точное числовое значение
*Добавляет значение к аннотации
*Позволяет строить более сложные аннотации на базе
 тех, что были обработаны данным плагином (денежные
 единицы, измерения)
*Конфигурация описывается в XML файле
*Готовая конфигурация для аннотирования для
 английского, французского, немецкого и испанского
 языков
*
* Все ресурсы в данном плагине производят так
 называемые Number annotations (числовые аннотации) в
 следующем виде:
* Type(тип): описывается типы токенов, которые могут
 образовывать число
* Value(значение): обозначает собой реальное значение
 числа , которое было аннотировано
*
String                              Value
3^2                                 9
101                                 101
3,000                               3000
3.3e3                               3300
1/4                                 0.25
9^1/2                               3
4x10^3                              4000
5.5*4^5                             5632
thirty one                          31
three hundred                       300
four thousand one hundred and two   4102
3 million                           3000000
fünfundzwanzig                      25
4 score                             80
*
* configURL- путь к конфигурационному файлу.
 Значение по умолчанию: resources/languages/all.xml
 Конфигурационный файл для английского языка:
 resources/languages/english.xml
* Encoding – кодировка. По умолчанию UTF-8
* postProcessURL – путь для JAPE грамматики
*
*
* <config>
   <description>Basic Example</description>
   <imports>
     <url encoding="UTF-8">symbols.xml</url>
   </imports>
   <words>
     <word value="0">zero</word>
     <word value="1">one</word>
     ...
      <word value="10">ten</word>
    </words>
    <multipliers>
       <word value="2">hundred</word>
       <word value="2">hundreds</word>
       <word value="3">thousand</word>
       <word value="3">thousands</word>
       <word value
   </multipliers>
   <conjunctions>
      <word whole="true">and</word>
   </conjunctions>
   <decimalSymbol>.</decimalSymbol>
   <digitGroupingSymbol>,</digitGroupingSymbol>
</config>
*

* e: обозначает экспоненциальное основание 10
<word value="2">hundred</word>
3 hundred => 3 × 102 или 300
* /: позволяет определять доли или дроби
three halves => 1.5
* ^: возведение в степень числа
three squared => 9
*
…
<conjunctions>
   <word whole="true">and</word>
</conjunctions>
<decimalSymbol>.</decimalSymbol>
<digitGroupingSymbol>,</digitGroupingSymbol>
*
*allowWithinWords
*annotationSetName
*failOnMissingInputAnnotations
*useHintsFromOriginalMarkups
*
*allowLowerCase – позволяет выполнять
 аннотацию для римских цифр нижнего
 регистра
*maxTailLength – ограничение количества
 символов
*outputASName – имя для множества аннотаций

Mais conteúdo relacionado

Mais procurados (8)

выпуклость вогнутость и точки перегиба
выпуклость вогнутость и точки перегибавыпуклость вогнутость и точки перегиба
выпуклость вогнутость и точки перегиба
 
Step cpp0201
Step cpp0201Step cpp0201
Step cpp0201
 
лабораторная работа №9
лабораторная работа №9лабораторная работа №9
лабораторная работа №9
 
использование формул. ссылки
использование формул. ссылкииспользование формул. ссылки
использование формул. ссылки
 
Step cpp022
Step cpp022Step cpp022
Step cpp022
 
15 - Базы данных. Создание и сопровождение таблиц
15 - Базы данных. Создание и сопровождение таблиц15 - Базы данных. Создание и сопровождение таблиц
15 - Базы данных. Создание и сопровождение таблиц
 
Дополнительные возможности Javascript
Дополнительные возможности JavascriptДополнительные возможности Javascript
Дополнительные возможности Javascript
 
Python i18n
Python i18nPython i18n
Python i18n
 

Destaque

Chien luoc marketing_truong_hoc_giai_doan_hien_nay
Chien luoc marketing_truong_hoc_giai_doan_hien_nayChien luoc marketing_truong_hoc_giai_doan_hien_nay
Chien luoc marketing_truong_hoc_giai_doan_hien_nay
bagianoen
 
Html5 awesomeness
Html5 awesomenessHtml5 awesomeness
Html5 awesomeness
senthil_hi
 
Tim hieu he_thong_ten_mien_dns
Tim hieu he_thong_ten_mien_dnsTim hieu he_thong_ten_mien_dns
Tim hieu he_thong_ten_mien_dns
toilahk
 
.Net 2012 13 Project Titles
.Net 2012 13 Project Titles.Net 2012 13 Project Titles
.Net 2012 13 Project Titles
Pan_Dotnet
 
DUI Lawyers & Cases
DUI Lawyers & CasesDUI Lawyers & Cases
DUI Lawyers & Cases
John Musca
 
Xamarin Mobile March 2014
Xamarin Mobile March 2014Xamarin Mobile March 2014
Xamarin Mobile March 2014
Joe Koletar
 

Destaque (14)

SPOF Attack
SPOF AttackSPOF Attack
SPOF Attack
 
DPS Data Link
DPS Data LinkDPS Data Link
DPS Data Link
 
Tcdnug xamarin
Tcdnug xamarinTcdnug xamarin
Tcdnug xamarin
 
Chien luoc marketing_truong_hoc_giai_doan_hien_nay
Chien luoc marketing_truong_hoc_giai_doan_hien_nayChien luoc marketing_truong_hoc_giai_doan_hien_nay
Chien luoc marketing_truong_hoc_giai_doan_hien_nay
 
Performance testing
Performance testingPerformance testing
Performance testing
 
Html5 awesomeness
Html5 awesomenessHtml5 awesomeness
Html5 awesomeness
 
Tim hieu he_thong_ten_mien_dns
Tim hieu he_thong_ten_mien_dnsTim hieu he_thong_ten_mien_dns
Tim hieu he_thong_ten_mien_dns
 
Creating an Intuitive Multi-screen Experience
Creating an Intuitive Multi-screen ExperienceCreating an Intuitive Multi-screen Experience
Creating an Intuitive Multi-screen Experience
 
.Net 2012 13 Project Titles
.Net 2012 13 Project Titles.Net 2012 13 Project Titles
.Net 2012 13 Project Titles
 
วิชาคณิตศาสตร์เพิ่มเติม
วิชาคณิตศาสตร์เพิ่มเติมวิชาคณิตศาสตร์เพิ่มเติม
วิชาคณิตศาสตร์เพิ่มเติม
 
DUI Lawyers & Cases
DUI Lawyers & CasesDUI Lawyers & Cases
DUI Lawyers & Cases
 
Xamarin Mobile March 2014
Xamarin Mobile March 2014Xamarin Mobile March 2014
Xamarin Mobile March 2014
 
Cross Platform Mobile Development with Xamarin
Cross Platform Mobile Development with XamarinCross Platform Mobile Development with Xamarin
Cross Platform Mobile Development with Xamarin
 
App cache vs localStorage
App cache vs localStorageApp cache vs localStorage
App cache vs localStorage
 

Semelhante a Tagger numbers

лекции спрг 6_семестр (1)
лекции спрг 6_семестр (1)лекции спрг 6_семестр (1)
лекции спрг 6_семестр (1)
djbelyakk
 
презентация лекции №8
презентация лекции №8презентация лекции №8
презентация лекции №8
student_kai
 
Вторая лекция по основам ruby для студентов itc73.ru
Вторая лекция по основам ruby для студентов itc73.ruВторая лекция по основам ruby для студентов itc73.ru
Вторая лекция по основам ruby для студентов itc73.ru
Alexander Shcherbinin
 
лабораторная работа №4
лабораторная работа №4лабораторная работа №4
лабораторная работа №4
Zhanna Kazakova
 
C++ осень 2012 лекция 9
C++ осень 2012 лекция 9C++ осень 2012 лекция 9
C++ осень 2012 лекция 9
Technopark
 
PG Day'14 Russia, PostgreSQL как платформа для разработки приложений, часть 2...
PG Day'14 Russia, PostgreSQL как платформа для разработки приложений, часть 2...PG Day'14 Russia, PostgreSQL как платформа для разработки приложений, часть 2...
PG Day'14 Russia, PostgreSQL как платформа для разработки приложений, часть 2...
pgdayrussia
 
Презентация. Основы Pascal
Презентация. Основы PascalПрезентация. Основы Pascal
Презентация. Основы Pascal
Evgen67
 

Semelhante a Tagger numbers (20)

Лекция #5. Введение в язык программирования Python 3
Лекция #5. Введение в язык программирования Python 3Лекция #5. Введение в язык программирования Python 3
Лекция #5. Введение в язык программирования Python 3
 
Rgsu04
Rgsu04Rgsu04
Rgsu04
 
Rgsu04
Rgsu04Rgsu04
Rgsu04
 
лекции спрг 6_семестр (1)
лекции спрг 6_семестр (1)лекции спрг 6_семестр (1)
лекции спрг 6_семестр (1)
 
презентация лекции №8
презентация лекции №8презентация лекции №8
презентация лекции №8
 
Вторая лекция по основам ruby для студентов itc73.ru
Вторая лекция по основам ruby для студентов itc73.ruВторая лекция по основам ruby для студентов itc73.ru
Вторая лекция по основам ruby для студентов itc73.ru
 
лабораторная работа №4
лабораторная работа №4лабораторная работа №4
лабораторная работа №4
 
основы програмирования Pascal
основы програмирования Pascalосновы програмирования Pascal
основы програмирования Pascal
 
Андрей Субботин "Локализация приложений для iOS: как не прострелить себе ногу"
Андрей Субботин "Локализация приложений для iOS: как не прострелить себе ногу"Андрей Субботин "Локализация приложений для iOS: как не прострелить себе ногу"
Андрей Субботин "Локализация приложений для iOS: как не прострелить себе ногу"
 
язык програмирования
язык програмированияязык програмирования
язык програмирования
 
!Predictive analytics part_3
!Predictive analytics part_3!Predictive analytics part_3
!Predictive analytics part_3
 
C language. Introduction
C language. IntroductionC language. Introduction
C language. Introduction
 
C++ осень 2012 лекция 9
C++ осень 2012 лекция 9C++ осень 2012 лекция 9
C++ осень 2012 лекция 9
 
Formal verification of operating system kernels
Formal verification of operating system kernelsFormal verification of operating system kernels
Formal verification of operating system kernels
 
Объектно-ориентированное программирование. Лекции 9 и 10
Объектно-ориентированное программирование. Лекции 9 и 10Объектно-ориентированное программирование. Лекции 9 и 10
Объектно-ориентированное программирование. Лекции 9 и 10
 
Внешние языки DSL на funcparserlib
Внешние языки DSL на funcparserlibВнешние языки DSL на funcparserlib
Внешние языки DSL на funcparserlib
 
лр3
лр3лр3
лр3
 
PG Day'14 Russia, PostgreSQL как платформа для разработки приложений, часть 2...
PG Day'14 Russia, PostgreSQL как платформа для разработки приложений, часть 2...PG Day'14 Russia, PostgreSQL как платформа для разработки приложений, часть 2...
PG Day'14 Russia, PostgreSQL как платформа для разработки приложений, часть 2...
 
Теория языков программирования некоторые слайды к лекциям
Теория языков программирования некоторые слайды к лекциямТеория языков программирования некоторые слайды к лекциям
Теория языков программирования некоторые слайды к лекциям
 
Презентация. Основы Pascal
Презентация. Основы PascalПрезентация. Основы Pascal
Презентация. Основы Pascal
 

Mais de Nikolay Karpov

Principal characteristics of speech
Principal characteristics of speechPrincipal characteristics of speech
Principal characteristics of speech
Nikolay Karpov
 
Идентификация уровня сложности текста и его адаптация
Идентификация уровня сложности текста и его адаптацияИдентификация уровня сложности текста и его адаптация
Идентификация уровня сложности текста и его адаптация
Nikolay Karpov
 
Идентификация уровня ложности текста и его адаптация
Идентификация уровня ложности текста и его адаптацияИдентификация уровня ложности текста и его адаптация
Идентификация уровня ложности текста и его адаптация
Nikolay Karpov
 
Теория и практика обработки естественного языка
Теория и практика обработки естественного языкаТеория и практика обработки естественного языка
Теория и практика обработки естественного языка
Nikolay Karpov
 
Speech waves in tube and filters
Speech waves in tube and filtersSpeech waves in tube and filters
Speech waves in tube and filters
Nikolay Karpov
 
Speech signal time frequency representation
Speech signal time frequency representationSpeech signal time frequency representation
Speech signal time frequency representation
Nikolay Karpov
 
Principal characteristics of speech
Principal characteristics of speechPrincipal characteristics of speech
Principal characteristics of speech
Nikolay Karpov
 

Mais de Nikolay Karpov (9)

Principal characteristics of speech
Principal characteristics of speechPrincipal characteristics of speech
Principal characteristics of speech
 
Идентификация уровня сложности текста и его адаптация
Идентификация уровня сложности текста и его адаптацияИдентификация уровня сложности текста и его адаптация
Идентификация уровня сложности текста и его адаптация
 
Идентификация уровня ложности текста и его адаптация
Идентификация уровня ложности текста и его адаптацияИдентификация уровня ложности текста и его адаптация
Идентификация уровня ложности текста и его адаптация
 
Cepstral coefficients
Cepstral coefficientsCepstral coefficients
Cepstral coefficients
 
Теория и практика обработки естественного языка
Теория и практика обработки естественного языкаТеория и практика обработки естественного языка
Теория и практика обработки естественного языка
 
Linear prediction
Linear predictionLinear prediction
Linear prediction
 
Speech waves in tube and filters
Speech waves in tube and filtersSpeech waves in tube and filters
Speech waves in tube and filters
 
Speech signal time frequency representation
Speech signal time frequency representationSpeech signal time frequency representation
Speech signal time frequency representation
 
Principal characteristics of speech
Principal characteristics of speechPrincipal characteristics of speech
Principal characteristics of speech
 

Tagger numbers

  • 1. * Татьяна Елипашева 12МАГКЛ
  • 2. * Numbers Tagger Поиск чисел в gate.creole.numbe документах rs.NumbersTagger (цифровая и словесная формулировки) и их аннотация в виде числовых значений Roman Numerals Поиск и аннотация gate.creole.numbe Tagger римских чисел rs.RomanNumeralsT agger
  • 3. * *Содержит ресурсы, разработанные для аннотирования чисел, появляющихся в документах. *Определяет точное числовое значение *Добавляет значение к аннотации *Позволяет строить более сложные аннотации на базе тех, что были обработаны данным плагином (денежные единицы, измерения) *Конфигурация описывается в XML файле *Готовая конфигурация для аннотирования для английского, французского, немецкого и испанского языков
  • 4. * * Все ресурсы в данном плагине производят так называемые Number annotations (числовые аннотации) в следующем виде: * Type(тип): описывается типы токенов, которые могут образовывать число * Value(значение): обозначает собой реальное значение числа , которое было аннотировано
  • 5. * String Value 3^2 9 101 101 3,000 3000 3.3e3 3300 1/4 0.25 9^1/2 3 4x10^3 4000 5.5*4^5 5632 thirty one 31 three hundred 300 four thousand one hundred and two 4102 3 million 3000000 fünfundzwanzig 25 4 score 80
  • 6. * * configURL- путь к конфигурационному файлу. Значение по умолчанию: resources/languages/all.xml Конфигурационный файл для английского языка: resources/languages/english.xml * Encoding – кодировка. По умолчанию UTF-8 * postProcessURL – путь для JAPE грамматики
  • 7. *
  • 8. * * <config> <description>Basic Example</description> <imports> <url encoding="UTF-8">symbols.xml</url> </imports> <words> <word value="0">zero</word> <word value="1">one</word> ... <word value="10">ten</word> </words> <multipliers> <word value="2">hundred</word> <word value="2">hundreds</word> <word value="3">thousand</word> <word value="3">thousands</word> <word value </multipliers> <conjunctions> <word whole="true">and</word> </conjunctions> <decimalSymbol>.</decimalSymbol> <digitGroupingSymbol>,</digitGroupingSymbol> </config>
  • 9. * * e: обозначает экспоненциальное основание 10 <word value="2">hundred</word> 3 hundred => 3 × 102 или 300 * /: позволяет определять доли или дроби three halves => 1.5 * ^: возведение в степень числа three squared => 9
  • 10. * … <conjunctions> <word whole="true">and</word> </conjunctions> <decimalSymbol>.</decimalSymbol> <digitGroupingSymbol>,</digitGroupingSymbol>
  • 12. * *allowLowerCase – позволяет выполнять аннотацию для римских цифр нижнего регистра *maxTailLength – ограничение количества символов *outputASName – имя для множества аннотаций