clasification

NLPseminar
NLPseminarProject manager in Linguistic group em NLPseminar
Автоматическая классификация текстов с использованием латентно-семантического анализа Соловьев Алексей Auditech Ltd. ;   СПбГУ
Алгоритмы классификации ,[object Object],[object Object]
Критерии оценки алгоритмов  ,[object Object],[object Object],[object Object],[object Object],[object Object]
Постановка задачи  ,[object Object],[object Object],[object Object]
Обзор существующих методов и алгоритмов ,[object Object],[object Object],[object Object],[object Object],[object Object]
Латентно-семантический анализ  ,[object Object],[object Object],[object Object],[object Object]
SVD  разложение матрицы ,[object Object],[object Object],[object Object]
SVD  разложение матрицы Рисунок 1.  SVD  разложение матрицы А размерности ( T X D ) на матрицу термов  U  размерности ( T X k ), матрицу документов  V  размерности ( k X D ) и диагональную матрицу  S  размерности ( k X k ), где  k  – количество сингулярных значении диагональной матрицы  S .
SVD  разложение матрицы ,[object Object],[object Object],[object Object]
Три основных разновидности решения задачи методом ЛСА: ,[object Object],[object Object],[object Object]
Два варианта применения латентно-семантического анализа ,[object Object],[object Object],[object Object],[object Object],[object Object]
Исследование ЛСА на материале базы спонтанной русской речи ,[object Object],[object Object],[object Object],[object Object],[object Object]
Материал для тестирования  ,[object Object],[object Object],[object Object]
Сегментация текста на термы ,[object Object],[object Object],[object Object],[object Object]
Расчет весовых функций ,[object Object],[object Object]
Определение тематик документов ,[object Object]
Сравнительная таблица пересечения основных факторов ,[object Object],100 9 9 30+ 89 8 10 50 78 7 8 30 56 5 6 20 Пересечение с текстом 30+ (%)  Кол-во факторов, совпавших с 30+  Приблизительное кол-во факторов  Кол-во документов
Выбор порога для сингулярных элементов диагональной матрицы при  SVD  анализе ,[object Object]
Выбор порога для сингулярных элементов диагональной матрицы при  SVD  анализе ,[object Object]
Выбор критерия ограничения величины весовых функций при получении ассоциативного словаря ,[object Object]
Результаты тестирования на речевой базе русской речи  ,[object Object],77,6  ½  80,2  ¼  82,2  90,8  88,1  полная база  ½ (%)  ¾ (%)  полная база (%)  Тест обучение
SVD  анализ   ,[object Object],[object Object],[object Object]
Выводы ,[object Object],[object Object],[object Object]
Изменение главных факторов при уменьшении числа сингулярных диагональных элементов матрицы
Изменение главных факторов при уменьшении числа сингулярных диагональных элементов матрицы
Области применения ЛСА ,[object Object],[object Object],[object Object],[object Object],[object Object]
СПАСИБО ЗА ВНИМАНИЕ!
Некоторые Интернет-ресурсы, посвященные ЛСА ,[object Object],[object Object],[object Object],[object Object]
1 de 28

Recomendados

03 кластеризация документов por
03 кластеризация документов03 кластеризация документов
03 кластеризация документовLidia Pivovarova
2.1K visualizações46 slides
Konstantion Vorontsov - Additive regularization of matrix decompositons and p... por
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...AIST
1.7K visualizações51 slides
Мищенко. Методы автоматического определения наиболее частотного значения слова. por
Мищенко. Методы автоматического определения наиболее частотного значения слова.Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ
416 visualizações29 slides

Mais conteúdo relacionado

Mais procurados

Rule b platf por
Rule b platfRule b platf
Rule b platfNatalia Ostapuk
376 visualizações20 slides
Zyabrev - por
Zyabrev - Zyabrev -
Zyabrev - Anna
358 visualizações25 slides
л 2 7 por
л 2 7л 2 7
л 2 7Kirill Bystrov
477 visualizações33 slides
Можарова Тематические модели: учет сходства между униграммами и биграммами. por
Можарова Тематические модели: учет сходства между униграммами и биграммами.Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ
620 visualizações39 slides
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО... por
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...ITMO University
280 visualizações5 slides
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами. por
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ
903 visualizações31 slides

Mais procurados(7)

Rule b platf por Natalia Ostapuk
Rule b platfRule b platf
Rule b platf
Natalia Ostapuk376 visualizações
Zyabrev - por Anna
Zyabrev - Zyabrev -
Zyabrev -
Anna358 visualizações
л 2 7 por Kirill Bystrov
л 2 7л 2 7
л 2 7
Kirill Bystrov477 visualizações
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО... por ITMO University
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...
ITMO University280 visualizações
C++ осень 2012 лекция 4 por Technopark
C++ осень 2012 лекция 4C++ осень 2012 лекция 4
C++ осень 2012 лекция 4
Technopark363 visualizações

Similar a clasification

isp_23_2012_215.pdf por
isp_23_2012_215.pdfisp_23_2012_215.pdf
isp_23_2012_215.pdfGrishan1
1 visão16 slides
!Predictive analytics part_3 por
!Predictive analytics part_3!Predictive analytics part_3
!Predictive analytics part_3Vladimir Krylov
808 visualizações77 slides
Кластеризация русскоязычных текстов на основе латентно-семантического анализа por
Кластеризация русскоязычных текстов на основе латентно-семантического анализаКластеризация русскоязычных текстов на основе латентно-семантического анализа
Кластеризация русскоязычных текстов на основе латентно-семантического анализаСпецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ
2.5K visualizações14 slides
Chernyak_defense por
Chernyak_defenseChernyak_defense
Chernyak_defenseEkaterina Chernyak
324 visualizações40 slides
Автоматическое извлечение синтаксических контекстов из текстовой коллекции por
Автоматическое извлечение синтаксических контекстов из текстовой коллекцииАвтоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекцииСпецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ
606 visualizações40 slides

Similar a clasification(20)

isp_23_2012_215.pdf por Grishan1
isp_23_2012_215.pdfisp_23_2012_215.pdf
isp_23_2012_215.pdf
Grishan11 visão
!Predictive analytics part_3 por Vladimir Krylov
!Predictive analytics part_3!Predictive analytics part_3
!Predictive analytics part_3
Vladimir Krylov808 visualizações
Chernyak_defense por Ekaterina Chernyak
Chernyak_defenseChernyak_defense
Chernyak_defense
Ekaterina Chernyak324 visualizações
Базы данных лекция №5 por Vitaliy Pak
Базы данных лекция №5Базы данных лекция №5
Базы данных лекция №5
Vitaliy Pak435 visualizações
Построение правил для автоматического извлечения словосочетаний из текста por Irene Pochinok
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текста
Irene Pochinok260 visualizações
построение правил для автоматического извлечения словосочетаний из текста por Yury Katkov
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текста
Yury Katkov768 visualizações
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД... por ITMO University
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...
ITMO University261 visualizações
3 бурдаеввп 2014_pax_grid_без_анимации por Vladimir Burdaev
3 бурдаеввп 2014_pax_grid_без_анимации3 бурдаеввп 2014_pax_grid_без_анимации
3 бурдаеввп 2014_pax_grid_без_анимации
Vladimir Burdaev212 visualizações
Data base por sng
Data baseData base
Data base
sng476 visualizações
Авиком por Natalia Ostapuk
АвикомАвиком
Авиком
Natalia Ostapuk467 visualizações
Ontology and Text Alalize por Ochirov Tsyren
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text Alalize
Ochirov Tsyren400 visualizações
008 por JIuc
008008
008
JIuc203 visualizações
базы данных.назаров por Different_56
базы данных.назаровбазы данных.назаров
базы данных.назаров
Different_56526 visualizações

Mais de NLPseminar

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо por
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна ЛандоNLPseminar
750 visualizações57 slides
Events por
EventsEvents
EventsNLPseminar
928 visualizações22 slides
Tomita por
TomitaTomita
TomitaNLPseminar
9.2K visualizações105 slides
бетин por
бетинбетин
бетинNLPseminar
1.8K visualizações16 slides
Andreev por
AndreevAndreev
AndreevNLPseminar
537 visualizações12 slides
клышинский por
клышинскийклышинский
клышинскийNLPseminar
911 visualizações24 slides

Mais de NLPseminar(20)

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо por NLPseminar
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
NLPseminar750 visualizações
Events por NLPseminar
EventsEvents
Events
NLPseminar928 visualizações
Tomita por NLPseminar
TomitaTomita
Tomita
NLPseminar9.2K visualizações
бетин por NLPseminar
бетинбетин
бетин
NLPseminar1.8K visualizações
Andreev por NLPseminar
AndreevAndreev
Andreev
NLPseminar537 visualizações
клышинский por NLPseminar
клышинскийклышинский
клышинский
NLPseminar911 visualizações
конф ии и ея гаврилова por NLPseminar
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гаврилова
NLPseminar1.1K visualizações
кудрявцев V3 por NLPseminar
кудрявцев V3кудрявцев V3
кудрявцев V3
NLPseminar890 visualizações
rubashkin por NLPseminar
rubashkinrubashkin
rubashkin
NLPseminar900 visualizações
Vlasova por NLPseminar
VlasovaVlasova
Vlasova
NLPseminar893 visualizações
Ageev por NLPseminar
AgeevAgeev
Ageev
NLPseminar577 visualizações
Khomitsevich por NLPseminar
Khomitsevich Khomitsevich
Khomitsevich
NLPseminar678 visualizações
акинина осмоловская por NLPseminar
акинина осмоловскаяакинина осмоловская
акинина осмоловская
NLPseminar678 visualizações
Serebryakov por NLPseminar
SerebryakovSerebryakov
Serebryakov
NLPseminar631 visualizações
потапов por NLPseminar
потаповпотапов
потапов
NLPseminar877 visualizações
molchanov(promt) por NLPseminar
molchanov(promt)molchanov(promt)
molchanov(promt)
NLPseminar1.1K visualizações
белканова por NLPseminar
белкановабелканова
белканова
NLPseminar707 visualizações
Skatov por NLPseminar
SkatovSkatov
Skatov
NLPseminar895 visualizações
гвоздикин por NLPseminar
гвоздикингвоздикин
гвоздикин
NLPseminar547 visualizações
веселов por NLPseminar
веселоввеселов
веселов
NLPseminar17.4K visualizações

clasification