SlideShare uma empresa Scribd logo
1 de 14
ConvolutionalNeural
NetworksforSentence
Classification
Yoon Kim
New York University
EMNLP 2014
발표: 곽근봉
Wordvector와CNN을활용한문장분류
Abstract
이미 트레이닝된 word vector를 활용
Word2vec를 활용하여 단어를 vector화 함
Simple한 CNN 구조 사용
3가지 filter를 가진 단순한 Convolutional Layer
높은 정확도
7개의 벤치마크 중 4곳에서 가장 높은 정확도
문장 분류(Sentence Classification)
감정 분류(Sentiment Analysis)
예시)
이번 아이폰의 카메라 성능은 정말 좋은 것 같아 – 긍정
이 레스토랑의 음식은 정말 실망스러웠어 – 부정
주제 분류
예시)
유승민의 자신감, 19대 대선 예비후보 등록 – 정치
손흥민 없는 슈틸리케호, 중국전 공격 조합은? – 스포츠
WordRepresentations(Embedding)
어떻게단어를계산할까?
사전을 만들어서 ID를 부여하자
간단하고 적용하기 쉬움
단어들과의 관계를 나타내지 못함 ( 예, 개=ID143, 고양이=ID537)
모든 단어가 다르기 때문에, 학습시키기 위해서는 굉장히 많은 데이터들이 필요
각 단어마다 Vector 값을 부여하자
단어들의 특징을 표현할 수 있도록 수치로 된 값 부여
(예, 개=[2,6,3,1,4])
Word2Vec
어떻게단어에Vector값을줄까?
문장에서 나오는 단어들의 위치로 학습시키자!
the quick brown fox jumped over the lazy dog
([the, brown], quick), ([quick, fox], brown), ([brown, jumped], fox)
Word2Vec
어떻게단어에Vector값을줄까?
그랬더니 특정 방향들이 의미를 담고 있었어!
https://tensorflowkorea.gitbooks.io/tensorflow-kr/content/g3doc/tutorials/word2vec/
CNN과WordVector를이용한문장분
류
k
n
h
n : 문장에 나오는 단어의 갯수 k : Word Vector의 차원 h : 필터 윈도우 사
이즈
ModelArchitecture
Page2 Figure1 (Yoon Kim, Convolutional Neural Networks for Sentence Classification, EMNLP 2014)
Static,Non-static,Multichannel
k
n
h
Back Propagation
static
non-static multichannel
Staticvs.Non-static
Page5 Table3 (Yoon Kim, Convolutional Neural Networks for Sentence Classification, EMNLP 2014)
Non-static으로 학습시키니 word vector가 의미를 더 잘 이해하게 되었
군!
CNN과WordVector를이용한문장분
류Results
Page4 Table2 (Yoon Kim, Convolutional Neural Networks for Sentence Classification, EMNLP 2014)
한국어문장분류에도
높은성능을보일까?
제28회한글및한국어정보처리학술대회논문집(2016년)
한국어에적합한단어임베딩모델
및파라미터튜닝에관한연구 최상혁, 설진석, 이상구
Word2Vec 를 사용하기 위해 전처리가 필요하다
영어와는 달리 한국어는 조사와 어미가 다양해서 어근을 추출할 필요가 있다
전처리를 위해 오픈 소스인 꼬꼬마 형태소 분석기, 트위터 형태소 분석기를 사용함
나무 위키, 위키피디아 등을 활용하자
기존의 말뭉치보다 크기가 크고 현대적인 단어 용법을 사용한다
최상혁, 설진석, 이상구, 한국어에 적합한 단어 임베딩 모델 및 파라미터 튜닝에 관한 연구, 제28회 한글 및 한국어 정보처리 학술대회 논문집(2016년)
2015년동계학술발표회논문집
컨볼루션신경망기반
대용량텍스트데이터분류기술
CNN은 훌륭한 정확도를 가지나 Word2Vec는 성능 향상에 도움을 주지
못함
조휘열, 김진화, 윤상웅, 김경민, 장병탁
조휘열, 김진화, 윤상웅, 김경민, 장병탁 , 컨볼루션 신경망 기반 대용량 텍스트 데이터 분류 기술, 2015년 동계학술발표회 논문집
Q&A
kkb2849@gmail.com
https://github.com/kkb2849

Mais conteúdo relacionado

Mais procurados

B6 문맥인식기술활용
B6 문맥인식기술활용B6 문맥인식기술활용
B6 문맥인식기술활용
NAVER D2
 
[214]베이지안토픽모형 강병엽
[214]베이지안토픽모형 강병엽[214]베이지안토픽모형 강병엽
[214]베이지안토픽모형 강병엽
NAVER D2
 

Mais procurados (20)

20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
 
Context2Vec 기반 단어 의미 중의성 해소, Word Sense Disambiguation
Context2Vec 기반 단어 의미 중의성 해소, Word Sense DisambiguationContext2Vec 기반 단어 의미 중의성 해소, Word Sense Disambiguation
Context2Vec 기반 단어 의미 중의성 해소, Word Sense Disambiguation
 
LDA : latent Dirichlet Allocation (Fairies NLP Series) - Korean Ver.
LDA : latent Dirichlet Allocation (Fairies NLP Series) - Korean Ver.LDA : latent Dirichlet Allocation (Fairies NLP Series) - Korean Ver.
LDA : latent Dirichlet Allocation (Fairies NLP Series) - Korean Ver.
 
황승원 포항공대 교수
황승원 포항공대 교수황승원 포항공대 교수
황승원 포항공대 교수
 
딥러닝을 이용한 자연어처리의 연구동향
딥러닝을 이용한 자연어처리의 연구동향딥러닝을 이용한 자연어처리의 연구동향
딥러닝을 이용한 자연어처리의 연구동향
 
Lab Seminar - Reading Wikipedia to Answer Open-Domain Questions (DrQA)
Lab Seminar - Reading Wikipedia to Answer Open-Domain Questions (DrQA)Lab Seminar - Reading Wikipedia to Answer Open-Domain Questions (DrQA)
Lab Seminar - Reading Wikipedia to Answer Open-Domain Questions (DrQA)
 
추천 시스템 개요 (1)-draft
추천 시스템 개요 (1)-draft추천 시스템 개요 (1)-draft
추천 시스템 개요 (1)-draft
 
단어 의미 중의성 해소, Word Sense Disambiguation(WSD)
단어 의미 중의성 해소, Word Sense Disambiguation(WSD)단어 의미 중의성 해소, Word Sense Disambiguation(WSD)
단어 의미 중의성 해소, Word Sense Disambiguation(WSD)
 
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
 
Word2Vec 개요 및 활용
Word2Vec 개요 및 활용Word2Vec 개요 및 활용
Word2Vec 개요 및 활용
 
Nlp word2vec
Nlp word2vecNlp word2vec
Nlp word2vec
 
파이썬과 자연어 4 | word/doc2vec
파이썬과 자연어 4 | word/doc2vec파이썬과 자연어 4 | word/doc2vec
파이썬과 자연어 4 | word/doc2vec
 
B6 문맥인식기술활용
B6 문맥인식기술활용B6 문맥인식기술활용
B6 문맥인식기술활용
 
자연어4 | 1차강의
자연어4 | 1차강의자연어4 | 1차강의
자연어4 | 1차강의
 
머신러닝의 자연어 처리기술(I)
머신러닝의 자연어 처리기술(I)머신러닝의 자연어 처리기술(I)
머신러닝의 자연어 처리기술(I)
 
딥러닝 기반의 자연어처리 최근 연구 동향
딥러닝 기반의 자연어처리 최근 연구 동향딥러닝 기반의 자연어처리 최근 연구 동향
딥러닝 기반의 자연어처리 최근 연구 동향
 
[214]베이지안토픽모형 강병엽
[214]베이지안토픽모형 강병엽[214]베이지안토픽모형 강병엽
[214]베이지안토픽모형 강병엽
 
Spam text message filtering by using sen2 vec and feedforward neural network
Spam text message filtering by using sen2 vec and feedforward neural networkSpam text message filtering by using sen2 vec and feedforward neural network
Spam text message filtering by using sen2 vec and feedforward neural network
 
Bi directional attention flow for nlp
Bi directional attention flow for nlpBi directional attention flow for nlp
Bi directional attention flow for nlp
 
Neural Machine Translation 기반의 영어-일본어 자동번역
Neural Machine Translation 기반의 영어-일본어 자동번역Neural Machine Translation 기반의 영어-일본어 자동번역
Neural Machine Translation 기반의 영어-일본어 자동번역
 

Semelhante a Convolutional neural networks for sentence classification

[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우
NAVER D2
 
영어 말하기 자동채점 프로그램의 현재와 미래
영어 말하기 자동채점 프로그램의 현재와 미래	영어 말하기 자동채점 프로그램의 현재와 미래
영어 말하기 자동채점 프로그램의 현재와 미래
engedukamall
 

Semelhante a Convolutional neural networks for sentence classification (11)

[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우
 
(Papers Review)CNN for sentence classification
(Papers Review)CNN for sentence classification(Papers Review)CNN for sentence classification
(Papers Review)CNN for sentence classification
 
Bidirectional attention flow for machine comprehension
Bidirectional attention flow for machine comprehensionBidirectional attention flow for machine comprehension
Bidirectional attention flow for machine comprehension
 
파이썬을 활용한 자연어 분석
파이썬을 활용한 자연어 분석파이썬을 활용한 자연어 분석
파이썬을 활용한 자연어 분석
 
응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈
 
영어 말하기 자동채점 프로그램의 현재와 미래
영어 말하기 자동채점 프로그램의 현재와 미래	영어 말하기 자동채점 프로그램의 현재와 미래
영어 말하기 자동채점 프로그램의 현재와 미래
 
마인즈랩 통합 VOC 관리 솔루션 소개_20151030
마인즈랩 통합 VOC 관리 솔루션 소개_20151030마인즈랩 통합 VOC 관리 솔루션 소개_20151030
마인즈랩 통합 VOC 관리 솔루션 소개_20151030
 
풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)
풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)
풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)
 
의존 구조 분석기, Dependency parser
의존 구조 분석기, Dependency parser의존 구조 분석기, Dependency parser
의존 구조 분석기, Dependency parser
 
Dependency Parser, 의존 구조 분석기
Dependency Parser, 의존 구조 분석기Dependency Parser, 의존 구조 분석기
Dependency Parser, 의존 구조 분석기
 
문자 단위의 Neural Machine Translation
문자 단위의 Neural Machine Translation문자 단위의 Neural Machine Translation
문자 단위의 Neural Machine Translation
 

Mais de keunbong kwak

Mais de keunbong kwak (12)

그로스해킹 기초
그로스해킹 기초그로스해킹 기초
그로스해킹 기초
 
NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료
 
PR-099: MRNet-Product2Vec
PR-099: MRNet-Product2VecPR-099: MRNet-Product2Vec
PR-099: MRNet-Product2Vec
 
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
PR12 논문 리뷰 Distributed Representations of Sentences and DocumentsPR12 논문 리뷰 Distributed Representations of Sentences and Documents
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
 
Wide&Deep Learning for Recommender Systems
Wide&Deep Learning for Recommender SystemsWide&Deep Learning for Recommender Systems
Wide&Deep Learning for Recommender Systems
 
논문리뷰: Deep Neural Networks for YouTube Recommendations
논문리뷰: Deep Neural Networks for YouTube Recommendations논문리뷰: Deep Neural Networks for YouTube Recommendations
논문리뷰: Deep Neural Networks for YouTube Recommendations
 
Ad Tech 개요
Ad Tech 개요Ad Tech 개요
Ad Tech 개요
 
Ask me anything: Dynamic memory networks for natural language processing
Ask me anything: Dynamic memory networks for natural language processingAsk me anything: Dynamic memory networks for natural language processing
Ask me anything: Dynamic memory networks for natural language processing
 
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
 
에디터스랩 발표
에디터스랩 발표에디터스랩 발표
에디터스랩 발표
 
NBT 유클라우드 사례 발표
NBT 유클라우드 사례 발표NBT 유클라우드 사례 발표
NBT 유클라우드 사례 발표
 
Window manager활용하기 곽근봉
Window manager활용하기 곽근봉Window manager활용하기 곽근봉
Window manager활용하기 곽근봉
 

Convolutional neural networks for sentence classification