O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.

Natural Language Processing

579 visualizações

Publicada em

A little presentation on natural language processing in bulgarian...

Publicada em: Tecnologia
  • Entre para ver os comentários

Natural Language Processing

  1. 1. NATURAL LANGUAGE PROCESSING Димитър Вулджев
  2. 2. ЗАЩО? • Големи количества Класифициране на текстове Индексиране на големи текстове информация Автоматичен превод Разпознаване на реч Извличане на информация • Програми за обработка на Автоматично обобщение голямо количество текстове Отговаряне на въпроси Диалози
  3. 3. ТЕКСТ?! • kJfmmfj mmmvvv nnnffn3333 • Uj oifds ellle mesad vensi credur • Baboi oi cestnitze • Cooveoel2& E;/ dasd?? • dasdfsdf asdasdds khjoi
  4. 4. ЛИПСА НА ЗНАНИЯ • Машините виждат “текстовете”, така както вие предишния • Хората нямат проблем с разбирането, защото знаят за неща с близък смисъл, опит и доводи • Машините незнанят нито неща с близък смисъл, нито имат опит, нито пък доводи
  5. 5. НИВО НА АНАЛИЗ • Звукове, букви, произношение • Морфология • Синтаксис • Семантика
  6. 6. СИНТАКСИСЪТ • Идентифициране на частите на речта /95%/ • Идентифициране на collocations
  7. 7. СЕМАНТИКА • Разбиране на езика! Как? • Думи с много значения • Семантиката е важна при машинния превод, извличането на информация
  8. 8. ОЩЕ ЗА СЕМАТИКАТА • Как да разбираме значението на думите? • От речниците? • Той е син на човека. Този вид хартия е син.
  9. 9. ..СЕМАНТИКА • Наличието на 100 изречения, които предварително са тагнати от човек • Обучаване на учещ се алгоритъм • Как да се избере този алгоритъм? • От къде да се намерят тези примери?
  10. 10. УЧЕЩА СЕ СЕМАНТИКА • Голямо количество обработен текст = обучени • Обучаванеот предишен опит/обучение/ за класифициране на нов информация • Дървете на решенията, учене на базата на памет, невронни мрежи
  11. 11. ИЗВЛИЧАНЕ • “Имаше група от около 8-9 човека близо до изхода на София” • Кой? - “8-9 човека” • Къде? - “изхода на София” • Ивличане на информация • Откриване на нови смислови групи
  12. 12. ВРЪЩАНЕ • Главно - голяма база с текстове и заявки • Задача - да се намери документ подобен на даден • Как? Ще се направи индекс както в книга? • Векторни или булеви модели? • Примери: Google, Yahoo
  13. 13. ВРЪЩАНЕ • Връщане на точно определена информация • Отговор на въпрос • “Колко е висок Еверест?” • 8853м
  14. 14. ...ВРЪЩАНЕ • Намиране на информация в различни езици • “Кога започваш училище в Англия?” • Търсене в английската база за “When do you start school?”
  15. 15. МАШИНЕН ПРЕВОД • Дума по дума работи - синтаксис, смисъл • Учене от предишно преведени изречения • Смислени преводи
  16. 16. ОЩЕ МНОГО • Обобщение • Тематика и обобщен анализ • Генериране на текст, диалог • Добиване на опит - близкосмислени изрази • Реч
  17. 17. КРАЙ Малко, но от сърце!

×