5. source: Gartner(August 2018)
Peak of Inflated Expectations
5
Early publicity produces a
number of success stories —
often accompanied by scores of
failures. Some companies take
action; many do not. Trough of
Disillusionment: Interest wanes
as experiments and
implementations fail to deliver.
Producers of the technology
shake out or fail.
6. “AI is more important
than fire or electricity”
Sundar Pichai
CEO of Google
14. 14source: ZDNET Korea
삼성전자가 인공지능(AI) 경쟁력을 높이기 위해 관련 기업
인수합병(M&A)에 적극 나서기로 했다. 또 관련 인력도 대
거 확보하기로 했다.
2020년까지 삼성이 만든 모든 IoT 제품에 인공지능을 탑재
하기 위한 전략의 일환이다.
김현석 삼성전자 CE부문장 사장은 17일 기자간담회를 갖고
"국내외의 적합한 AI 업체들을 대상으로 적극 인수합병을
추진할 것"이라며 "관련 인력도 우선 1차로 1천 명 이상의
AI 엔지니어를 확보하는 게 목표"라고 설명했다.
김 사장은 특히 "AI 인력이 국내에서 많이 부족하다"며 "국
내를 포함해서 전세계적으로 인력을 확보하는 게 중요하다
고 본다"고 말했다.
김 사장은 "AI가 굉장히 많은 분야에 활용되고 있고 각기 전
문가가 따로 있기 때문에 삼성전자가 자체적으로 확보할 수
있는 AI 기술도 제한적"이라며 "이를 보완하기 위해 개방형
혁신을 추진, 국내외 적합한 AI 업체들을 대상으로 적극 인
수합병을 추진할 것이며, 구체적으로 어느 곳인지 밝히긴 어
렵지만 많이 검토하고 있다"고 전했다.
15. $100 M Unicorn Startups
15
CA, USA
`14.07. 설립
Automotive Patent 39건 보유
Shenzhen, China
`15.10. 설립
AI Healthcare Patent 25건 보유
자율 주행 헬스케어
20. 20
AI Golbal Patents Trend
<Distribution of AI patents granted from 2000 to 2016>
source: voxeu.org
45% of the AI patents in china
by Chinese Univ.
대학이 AI 연구·특허 경쟁력 보유
인공지능 실험(가설 검증) 용이
글로벌 기업들은
북미 시장에 집중
&
수백 건의
특허 확보 중
21. 21source: www.lexology.com
<AI patent filing trends in China>
several main players
more players &
more patent filing
China have more people,
more data, more businesses
<AI patent: China vs US>
AI Patents Booming in China
23. source: Goldman Sachs Global Investment Research
AI, Deep Learning Timeline
이때부터 특허가
살아있다!!
특허는 20년간 생존
시장보다 앞섬
24. 24
AI Patent War begins
연도 사건번호 원고 피고 특허번호 특허 명칭
2018 6:18-CV-01174
www.trustsci
ence.com Inc.
Bloom
Protocol
9721296
Learning an entity's trust model and ri
sk tolerance to calculate a risk score
2017 3:17-CV-02402
Alps Electric
Co., Ltd
Apple, Inc. 8768865
Learning situations via pattern
matching
2016 1:16-CV-00177
Power
Analytics
Corp
Schneider
Electric
7840395
Systems and methods for predictive
monitoring including real-time
strength and security analysis in an
electrical power distribution system
2015 3:14-CV-04387
WORD TO
INFO
Facebook,
Inc.
8688436
Memory system for storing and
retrieving experience and
knowledge by utilizing natural
language responses
2014 1:14-CV_00880
Siemens
Medical
Solutions
Humedica,
Inc.
7181375
Patient data mining for diagnosis
and projections of patient states
2014 1:14-CV-09558
Network-1
Technologies
Google, Inc. 8904464
Method for tagging an electronic
media work to perform an action
2013 1:12-cv-01579
Dynamic
Advances,
LLC
Apple, Inc. 7177798
Natural language interface using
constrained intermediate dictionary
of results
25. Open Source promote the AI Development
25
많은 기업들이 애용
주인
기술 진입 장벽 ↓
⇒ 응용 아이디어 중심 경쟁
딥러닝 알고리즘,
GPU 환경 제공,
플랫폼 API 등 제공
26. Open Source Legal Risk
Open Source Licenses : Software Copyright Licenses (not Patent Licenses)
with Open Source code & Requirements
May have to grant a Free-Patent Licenses under GPL : not Exclusive rights
Some open source licensed software may infringe on 3rd party Patents
Open Source라도
특허로부터는 자유롭지 못함
26
28. In computer science, Artificial Intelligence (AI), sometimes called machine intelligence, is
intelligence demonstrated by machines. Computer science defines AI research as the
study of "intelligent agents": any device that perceives its environment and takes actions
that maximize its chance of successfully achieving its goals.
Deep learning is any Artificial Neural Network that can learn a long chain of causal links.
Deep learning has transformed many important subfields of artificial intelligence, including
computer vision, speech recognition, natural language processing and others.
Convolutional Neural Networks (CNNs) with 12 convolutional layers were used in
conjunction with reinforcement learning by Deepmind's "AlphaGo Lee", the program that
beat a top Go champion in 2016.
Deep learning was also applied to sequence learning with Recurrent Neural Networks
(RNNs) to process arbitrary sequences of inputs. RNNs can be trained by gradient descent
but suffer from the vanishing gradient problem.
In 2015, Google's speech recognition experienced a dramatic performance jump of 49%
through CTC-trained Long Short-Term Memory (LSTM), which is now available through
Google Voice to billions of smartphone users. LSTM combined with CNNs also improved
automatic image captioning.
source: Wikipedia 28
Definition
29. source: medium.com
AI v. Machine Learning v. Deep Learning
Concept Learning w/o
Programming
Human Brain Emulating
Approach
29
30. 머신러닝 알고리즘의 유형
지도학습 비지도학습
강화학습
source: Artificial intelligence and echocardiography, M Alshaqi et al, Echo Research and Practice
Spam filtering
Price prediction
Customer
Segmentation
Games(AlphaGo)
30
31. 머신러닝 알고리즘의 유형
31
유사도에 따른
그루핑
Un-labelled
변수 간의 관계를
분석(추정)
Continuous Label
기준에 따른
분류
Discrete Label
40. Deep Learning (딥 러닝)
Deep Learning = Deep Neural Network (DNN)
= An Artificial Neural Network with multiple(two or more) Hidden layers
between the input layer and the output layer
= typically Feed-Forward Neural Network in which data flows from the
input layer to the output layer without looping back
source: Wikipedia 40
41. DNN as a Black Box
41
Black Box
As Deeper,
Harder to understand!!
43. Convolutional Neural Network (CNN)
convoluted feature map
pooled feature map
multiple filter
activation function f
decreasing feature
(sub-sampling)
feature extraction
multiple channel(RGB)
convert 3D → 1D
Neural Network
class별 확률 분포 출력
43
44. Convolutional Neural Network (CNN)
weighted summation
local area feature에 집중
Convolution
Pooling
weight
최대값으로 subsampling
평균값으로 subsampling
44
convoluted feature map
pooled feature map
Flattening
49. Long-Short Term Memory (LSTM)
source: Supervised Sequence Labelling with Recurrent Neural Networks, Alex Graves
RNN에서의 Vanishing Gradient Problem
LSTM의 Problem 해결
과거 입력 데이터의 영향력 약화
three-gates의 활용
49
50. Long-Short Term Memory (LSTM)
source: Supervised Sequence Labelling with Recurrent Neural Networks, Alex Graves
self recurrent weight = 1.0
ct-1
ct
ct
ct-1
xt
ht-1
bf
bcht-1
ht-1
ht-1
xt
xt
xt
bi
bo
it = σf(Wxixt + Whiht-1 + Wcict-1 + bi)
ft = σf(Wxfxt + Whfht-1 + Wcfct-1 + bf)
ct = ftct-1 + itσg(Wxcxt + Whcht-1 + bc)
ot = σf(Wxoxt + Whoht-1 + Wcoct + bo)
ht = otσh(ct)
it
ot
ft
ht
output
input
cell state
(memory)
50
51. Long-Short Term Memory (LSTM)
source: Supervised Sequence Labelling with Recurrent Neural Networks, Alex Graves
if it = 0, ft = 1, Ct-1 메모리 no change
ct = ftct-1 + itσg(Wxcxt + Whcht-1 + bc) = ct-1
if ft = 0, Ct-1 메모리 reset
ct = ftct-1 + itσg(Wxcxt + Whcht-1 + bc)
= itσg(Wxcxt + Whcht-1 + bc)
ot = σf(Wxoxt + Whoht-1 + Wcoct + bo)
ht = otσh(ct)
51
55. Chatbot Architecture
source: aspect.com 55
Test to Speech
텍스트를 음성으로 변환·합성
Automatic Speech Recognition
음성 인식·텍스트로 변환
Knowledge Base
Interaction History
Context
58. 58
특허를 받을 수 있는 파트 ??
source data
확보/수집 방식
data 가공 : 사전처리(변환,
표준화, 비식별화, 구조화,
라벨링), 샘플링 방식,
feature 유형 등
학습 모델
fitting/tuning
improving
학습 데이터
셋 구성
응용, 서비스,
BM 구조
data 저장
사후관리
<Machine Learning Process>
59. 구성 H
구성 A
구성 B
구성 C
구성 D
구성 E
구성 G
구성 F
구성 B를 중심으로
특허 출원
59
어느 하나라도 특징적이라면..
60. Type 1: source data 확보/수집
등록특허 명칭 : 깊은 신경망 학습 방법을 이용한 제조품용 영상 검사 장치 및 이를 이용한 제
조품용 영상 검사 방법
출원번호(일자) : 2016-0051808 (2016.04.27) / 출원인 : 디아이티 주식회사
제조 과정에 의해 제조된 제조품으로부터 획득한 영상에 대하여
깊은 신경망을 이용하여 상기 제조품의 자동 결함 분류를 수행
하는 제조품용 영상 검사 장치에 있어서,
상기 제조품에 대한 결함 영상을 획득하여 분산 저장하고, 하기
지능적 데이터 증가부에서 생성된 지능적 결함 영상을 추가 저
장하는 학습 데이터 저장부;
상기 학습 데이터 저장부에 저장된 결함 영상만으로 상기 지능
적 결함 영상을 생성하여 전체 결함 영상의 양을 증가시키는 지
능적 데이터 증가부; 및
상기 학습 데이터 저장부에 저장된 결함 영상을 이용하여 입력
된 제조품의 영상을 분석하고, 상기 제조품의 결함 분류 결과를
출력하는 깊은 신경망인 인공 신경망; 을 포함하되,
상기 지능적 데이터 증가부는,
상기 학습 데이터 저장부에 저장된 결함 영상에 어파인 변환을
포함하는 복수개의 영상 처리 변환 기술을 기 설정된 순서에 따
라 적용하여 변환 영상을 생성하며, 상기 변환 영상에 대하여 오
토 인코더를 포함하는 비 지도 학습 기반 신경망 학습에 적용하
여 영상 생성 과정 및 데이터 분포 방법을 학습하고, 학습된 영
상 생성 과정 및 데이터 분포 방법을 이용하여 새로운 결함 영상
인 상기 지능적 결함 영상을 생성하며, 상기 지능적 결함 영상에
다양한 노이즈를 추가함으로써 상기 지능적 결함 영상을 추가
생성하는 것을 특징으로 하는
제조품용 영상 검사 장치.
인위적인 데이터 증가부를 이용한
source data 확보 방식에 특징 有
60
61. 등록특허 명칭 : Enhancing user experiences using aggregated device usage data
출원번호(일자) : 11/611,730 (2006.12.15) / 출원인 : Microsoft Corporation
Type 1: source data 확보/수집
A server to facilitate enhancement of user experiences for
users of devices in a network, the server comprising:
at least one processor;
a computer-readable storage media having stored thereon a
plurality of instructions that, when executed by one or more
processors, causes the at least one processor to:
receive a privacy level from each user of a plurality of users
of a plurality of devices, each user of the plurality of users
establishing a respective privacy level;
receive device usage data from each user of the plurality of
users of the plurality of devices;
for each user of the plurality of users, remove private
information from the device usage data of the user in
accordance with the privacy level of the user;
aggregate the received device usage data in accordance
with the respective privacy levels of the plurality of users,
wherein the aggregated device usage data is free of private
information; and
provide each device of the plurality of devices with at least a
portion of the aggregated device usage data.
개별 사용자의 프라이버시 레벨에 따라
디바이스 이용 데이터를 수집하는
source data 확보 방식에 특징 有
61
62. 등록특허 명칭 : 데이터 라벨링 작업 검수방법 및 프로그램
출원번호(일자) : 2017-0155423 (2017.11.21) / 출원인 : 주식회사 크라우드웍스
서버가 교차검수 수준을 결정하는 단계;
상기 서버가 상기 결정된 교차검수 수준에 따라 하나의 데이터
를 분배할 작업자들의 수를 결정하는 단계;
상기 서버가 제1 데이터를 상기 결정된 수의 작업자 단말들에게
분배하는 단계;
상기 서버가 상기 작업자 단말들 각각이 제출한 상기 제1 데이
터에 대한 라벨링 정보를 획득하는 단계;
상기 서버가 상기 작업자 단말들 각각으로부터 획득된 상기 제1
데이터에 대한 라벨링 정보를 비교하는 단계; 및
상기 서버가 상기 작업자 단말들 각각으로부터 획득된 상기 제1
데이터에 대한 라벨링 정보가 모두 일치하는 것으로 판단되지
않는 경우, 재작업을 요청하는 단계; 를 포함하며,
상기 제1 데이터는,
특정 객체 또는 텍스트가 포함된 이미지 데이터인 것을 특징으
로 하는, 데이터 라벨링 작업 검수방법.
data 가공 방식(크라우드 워킹에 교차
검수를 적용한 데이터 라벨링)에 특징 有
Type 2: data 가공
62
63. 등록특허 명칭 : 인공 신경망을 이용한 얼굴 인식 방법 및 장치
출원번호(일자) : 2002-0047898 (2001.08.13) / 출원인 : 삼성전자 주식회사
인공 신경망을 이용하여 얼굴을 인식하는 얼굴 인식 장치로서, 얼굴의 특징 패턴을 나타내는 고유 팩셀들을 생성하고,
생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 고유 팩셀 선정부;
입력 영상을 상기 선정된 고유 팩셀들로 각각 필터링하는 고유 필터링부;
상기 선정된 고유 팩셀에 각각 대응되며, 대응되는 고유 팩셀로 필터링된 영상의 신호를 입력받아, 얼굴 인식 결과를
출력하는 소정수의 신경망; 및
상기 각각의 신경망으로부터 인식결과를 입력받아, 상기 입력 영상의 최종 얼굴 인식 결과를 출력하는 판단부를 포함
하는 것을 특징으로 하는 얼굴 인식 장치.
data 가공 방식
(고유 픽셀을 선정하여 필터링하는 방식)에 특징 有
Type 2: data 가공
63
64. 등록특허 명칭 : 기계 학습 데이터셋에 대한 레이블링 방법 및 그 장치
출원번호(일자) : 2017-0159220 (2017.11.27) / 출원인 : 한국인터넷진흥원
컴퓨팅 장치에서 수행되는 기계 학습 데이터셋에 대한 레이블링 방법에 있어서,
클래스 레이블(class label)이 주어지지 않은 제1 데이터셋에 대한 클러스터링(clustering)을 수행하여, 복수의 클러스터를 구축하
는 제1 단계;
클러스터에 속한 데이터 간의 제1 유사도를 기초로 상기 복수의 클러스터 각각에 대한 평가를 수행하는 제2 단계;
상기 평가의 결과에 기초하여, 상기 복수의 클러스터 중에서 레이블링 대상 클러스터를 지정하는 제3 단계; 및
동일한 레이블링 대상 클러스터에 속한 데이터 각각에 대하여 동일한 클래스 레이블을 부여하는 제4 단계를 포함하되,
상기 제3 단계는,
상기 평가의 결과에 기초하여, 상기 복수의 클러스터 중에서 일부 클러스터를 제1 레이블링 대상 클러스터로 지정하는 단계;
상기 제1 레이블링 대상 클러스터로 지정되지 않은 제1 클러스터에 대하여, 상기 제1 클러스터에 속한 데이터 중에서 일부 데이
터를 제외하여 제2 클러스터를 형성하는 단계; 및
상기 제2 클러스터에 속한 데이터 간의 제2 유사도를 산출하고, 상기 제2 유사도가 소정의 임계 수치 이상이라는 판정에 응답하
여, 상기 제2 클러스터를 상기 레이블링 대상 클러스터로 추가 지정하는 단계를 포함하는 것을 특징으로 하는,
기계 학습 데이터셋에 대한 레이블링 방법.
data 가공 방식
(복수의 클러스터를 구축하고
데이터간 유사도에 따라 라벨링 대상
클러스터를 지정하는 방식)에 특징 有
Type 2: data 가공
64
65. 등록특허 명칭 : Removing personal information from text using a neural network
출원번호(일자) : 15/964,629 (2018.04.27) / 출원인 : ASAPP, INC
A computer-implemented method for removing personal information from text using a neural network, the method
comprising:
obtaining the neural network, wherein the neural network is configured to process the text and select a label from a
plurality of possible labels for each word of the text, wherein each label corresponds to a class of words, and wherein at
least one label corresponds to a class of words to be removed from the text;
receiving the text;
obtaining a word embedding for each word of the text, where a word embedding represents a word in a vector space;
computing a context vector for each word of the text by processing the word embeddings with a first layer of the
neural network, where a context vector for a given word includes information about words before or after the given
word;
computing label scores for each word of the text by processing each of the context vectors with a second layer of the
neural network, wherein each label score indicates a match between a word and a class of words;
selecting a label for each word of the text by processing the label scores with a third layer of the neural network; and
generating redacted text by replacing a first word of the text with a first label corresponding to the first word.
data 가공 방식
(신경망을 이용한 개인정보 여부 분석 및 개인정보의 라벨로의 교체)에 특징 有
Type 2: data 가공
65
66. 등록특허 명칭 : Extracting classifying data in music from an audio bitstream
출원번호(일자) : 09/939,954 (2001.08.27) / 출원인 : NEC Laboratories America, Inc
A method of extracting classifying data from an audio signal, the method comprising the steps of:
transforming a perceptual representation of the audio signal into a learning representation of the audio
signal;
transmitting the learning representation to a multi-stage classifier, the multi-stage classifier comprising:
a first stage having a plurality of support vector machine classifiers, each support vector machine classifier trained
to identify one out of a plurality of audio classification categories and generate a metalearner vector value
reflecting how closely the audio signal conforms to the one out of the plurality of audio classification categories,
and a final stage having a metalearner classifier, the metalearner classifier using the generated metalearner vector
to classify the audio signal into one out of the plurality of audio classification categories; and
generating classification category information for the audio signal based on results produced by the metalearner
classifier.
data 가공 방식
(오디오 비트스트림으로부터 음원 분류를 위한 data를 추출하는 방식)에 특징 有
Type 2: data 가공
66
67. 등록특허 명칭 : 심층신경망을 이용한 골 연령 산출방법 및 프로그램
출원번호(일자) : 2016-0025149 (2016.03.02) / 출원인 : 아산사회복지재단, 주식회사 뷰노
하나 이상의 컴퓨터의 통신 모듈이, 골 연령 산출을 수행할 특정한 의료영상인 분석대상영상을 수신하는 단계; 및
상기 하나 이상의 컴퓨터의 프로세서가, 상기 통신 모듈을 통하여 수신된 상기 분석대상영상을 심층신경망을 이용하
여 분석하여 골 연령을 산출하는 단계로서, 상기 분석대상영상은 수골의 전체 영상인 단계;를 포함하되,
상기 심층신경망은, 상기 분석대상영상 내의 특징들에 대한 특징 지도(feature map)를 만들어내는 다수의 콘볼루션 층
(convolution layer); 및 상기 다수의 콘볼루션 층 사이에 서브 샘플링(sub-sampling)이 이루어지는 통합층(pooling
layer)을 포함함으로써, 상기 분석대상영상에 대한 상이한 수준의 특징들이 추출되는 것을 특징으로 하는, 심층신경망
을 이용한 골 연령 산출방법.
학습 데이터(input)와
예측 결과(output)에 특징 有
Type 3: 학습 데이터 셋 구성
일반적인 CNN
67
68. 등록특허 명칭 : 심층 신경망 기반 질병 정보 예측 시스템 및 방법
출원번호(일자) : 2015-0189231 (2015.12.30) / 출원인 : 한국과학기술원
질병 정보 예측 시스템으로서,
유전자별 발현 분포를 기초로 복수의 유전자 데이터세트 각각
에 대한 발현변화 유전자 정보를 생성하는 발현변화 유전자
추출부,
유전자, 세포 기능, 그리고 질병의 연관 관계를 기초로 복수의
유전자 노드를 포함하는 입력층, 복수의 세포 기능 노드를 포
함하는 적어도 하나의 은닉층, 그리고 질병 노드를 포함하는
출력층으로 구성된 초기 심층 신경망을 생성하고, 상기 복수
의 유전자 데이터세트 각각에 대한 발현변화 유전자 정보를
기초로 상기 초기 심층 신경망을 학습시켜 최종 심층 신경망
을 생성하는 학습부, 그리고
상기 최종 심층 신경망을 역전파(backward propagation) 탐색
하여 상기 질병에 관련된 질병 정보를 탐색하는 탐색부
를 포함하는 질병 정보 예측 시스템.
Type 3: 학습 데이터 셋 구성
학습 데이터(input)와
예측 결과(output)에 특징 有
68
69. 등록특허 명칭 : 딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법
출원번호(일자) : 2014-0182745 (2014.12.17) / 출원인 : 서울대학교
음성 인식 방법으로서,
(1) 잡음이 혼합된 학습 데이터를 이용해 딥 뉴럴 네트워크
(Deep Neural Network; DNN)를 학습하는 단계;
(2) 테스트 데이터를 상기 학습된 딥 뉴럴 네트워크에 적용하여
보상된 특징 벡터 또는 스테이트 사후 확률을 도출하는 단계;
및
(3) 상기 단계 (2)에서 도출된 보상된 특징 벡터 또는 스테이트
사후 확률을 이용해, 음성 인식 결과를 도출하는 단계를 포함하
되,
상기 단계 (1)은,
(1-1) 깨끗한 음성에 잡음을 혼합하여 학습 데이터를 생성하는
단계;
(1-2) 상기 학습 데이터로부터 왜곡된 특징 벡터를 추출하고, 상
기 추출된 왜곡된 특징 벡터로부터 환경 파라미터를 추출하는
단계; 및
(1-3) 상기 왜곡된 특징 벡터 및 환경 파라미터를 이용해 딥 뉴
럴 네트워크를 학습하는 단계를 포함하며,
상기 단계 (1-3) 이전에는, 상기 깨끗한 음성으로부터 특징 벡터
를 추출하는 단계를 더 포함하며, 상기 단계 (1-3)에서는, 상기
추출된 특징 벡터를 출력으로 하여 상기 딥 뉴럴 네트워크를 학
습하는 것을 특징으로 하는, 딥 뉴럴 네트워크 기반 특징 보상
기법을 이용한 음성 인식 방법.
Type 3: 학습 데이터 셋 구성
학습 데이터(input)와
예측 결과(output)에 특징 有
69
70. 등록특허 명칭 : 영상 학습 장치, 이를 이용한 촬영영상 분석 시스템 및 방법, 이를 수행하기
위한 기록매체
출원번호(일자) : 2018-0027033 (2018.03.07) / 출원인 : ㈜크레아소프트
학습대상 객체가 포함된 촬영영상을 적어도 하나 수집
하는 단계;
미리 정해진 크기의 윈도우를 상기 촬영영상 내에서
이동시켜 상기 촬영영상으로부터 복수의 패치 영상을
생성하는 단계;
상기 패치 영상을 기초로 상기 촬영영상을 구성하는
픽셀들을 서로 다른 특징값을 갖는 복수의 클래스로
레이블링하는 단계; 및
각각의 클래스가 상기 촬영영상 내에서 차지하는 영역
의 비율을 입력값으로 설정하고, 각각의 클래스를 나
타내는 특징값을 출력값으로 설정하여 인공 신경망을
학습하는 단계를 포함하는,
촬영영상 분석 방법.
Type 3: 학습 데이터 셋 구성
학습 데이터(input)와
예측 결과(output)에 특징 有
70
71. 등록특허 명칭 : 약한 지도 학습 기반의 기계 학습 방법 및 그 장치
출원번호(일자) : 2016-0156041 (2016.11.22) / 출원인 : 주식회사 루닛
기계 학습 장치에 의해 수행되는 약한 지도 학습(weakly supervised learning)
기반의 기계 학습 방법에 있어서,
제1 모델과 제2 모델에 의해 공유되는 컨벌루션 신경망(convolutional neural
networks)을 이용하여, 제1 타입 정보(분류, 위치 등 정답 정보)가 주어지고,
제2 타입 정보는 주어지지 않은 데이터 셋(input)에 대한 특징 맵(feature
map)을 추출하는 단계;
기 추출된 특징 맵을 상기 제1 모델의 입력으로 이용하고, 상기 제1 모델을
통해 상기 제1 타입 정보에 대응되는 태스크를 수행하여 제1 오류 값을 연산
하는 단계;
상기 추출된 특징 맵을 상기 제2 모델의 입력으로 이용하고, 상기 제2 모델을
통해 상기 제1 타입 정보에 대응되는 태스크를 수행하여 제2 오류 값을 연산
하는 단계;
상기 제1 오류 값 및 상기 제2 오류 값 각각에 가중치를 적용하여, 제3 오류
값을 연산하는 단계;
상기 제3 오류 값을 역전파하여, 상기 컨벌루션 신경망을 갱신하는 단계; 및
상기 제2 모델을 이용하여, 상기 제2 타입 정보가 주어지지 않은 데이터에 대
하여 상기 제2 타입 정보(output)를 예측하는 단계를 포함하되,
상기 제1 모델은 상기 제1 타입 정보가 주어지지 않은 데이터에 대하여 상기
제1 타입 정보를 예측하는 모델이고, 상기 제2 모델은 상기 제1 타입 정보에
대응되는 태스크를 수행하는 과정에서 상기 제2 타입 정보가 추출되는 모델
이며, 상기 컨벌루션 신경망에 대한 갱신이 진행됨에 따라 상기 제1 오류 값
에 적용되는 제1 가중치는 더 작은 값으로 조정되고, 상기 제2 오류 값에 적
용되는 제2 가중치는 더 큰 값으로 조정되는 것을 특징으로 하는, 약한 지도
학습 기반의 기계 학습 방법.
Type 4: 학습 모델
학습 모델(역전파를 통한
가중치 조정 방식)에 특징 有
back-propagation
71
72. 등록특허 명칭 : 신호처리 알고리즘이 통합된 심층 신경망 기반의 음성인식 장치 및 이의 학
습방법
출원번호(일자) : 2014-0122803 (2014.09.16) / 출원인 : 한국전자통신연구원
컴퓨터로 구현 가능한 심층 신경망 기반 음성인식 장치에
서 모델 파라미터 학습방법에 있어서,
(a) 시간 도메인의 음성 입력 신호에서 특징 파라미터를 추
출하기 위한 신호처리 알고리즘을 심층 신경망 기반의 신
호처리기(signal processing DNN)로 변환하는 단계;
(b) 상기 심층 신경망 기반의 신호처리기와 심층 신경망
기반의 분류기(classification DNN)을 융합하는 단계; 및
(c) 상기 심층 신경망 기반의 신호처리기 및 상기 심층 신
경망 기반의 분류기가 융합된 심층학습 모델에서 모델 파
라미터를 학습하는 단계를 포함하고,
상기 (b) 단계는,
상기 심층 신경망 기반의 신호처리기에서 출력된 특징 파
라미터를 상기 심층 신경망 기반의 분류기에 입력하는 단
계를 포함하는 것인
심층 신경망 기반 음성인식 장치에서 모델 파라미터 학습
방법.
Type 4: 학습 모델
학습 모델(feature 추출
부분을 DNN 기반으로
변환하여 classifier에
융합하는 것)에 특징 有
72
73. 등록특허 명칭 : 기계 학습 방법 및 장치
출원번호(일자) : 2017-0101084 (2017.08.09) / 출원인 : 펜타시큐리티시스템 주식회사
기계 학습 장치에 의해 수행되는 컨볼루셔널 신경망에 대한 기계 학습 방법에 있어서,
대상 데이터를 입력 받는 단계;
상기 컨볼루셔널 신경망에 대한 상기 대상 데이터의 통계적 특성과, 상기 컨볼루셔널 신경망에 대한 미리 사용된 훈련 데이터
의 통계적 특성 차이에 기초하여, 점진 학습의 개시 여부를 판단하는 단계;
상기 점진 학습을 개시하기로 판단한 경우, 상기 컨볼루셔널 신경망에 포함된 각각의 컨볼루션 레이어에서 상호 유사도가 높은
커널들의 집합을 결정하는 단계; 및
상기 상호 유사도가 높은 커널 집합에 포함된 커널들이 적용되는 노드들 사이의 가중치를 갱신하는 단계를 포함하고,
상기 상호 유사도가 높은 커널들의 집합을 결정하는 단계는,
동일한 노드의 컨볼루션 연산에 이용되는 커널들로부터 커널 연결 행렬(Concatenated kernel matrix)들을 구성하고, 상기 커
널 연결 행렬들 사이의 거리 또는 유사도를 측정함으로써, 상기 상호 유사도가 높은 커널 연결 행렬 쌍을 적어도 하나 이상 결
정하는 단계를 포함하는 기계 학습 방법.
Type 4: 학습 모델
학습 모델(역전파시 커널의 가중치를
갱신하는 방식)에 특징 有
상호 유사도가
높은 커널들의
가중치를 갱신
73
74. 등록특허 명칭 : 멀티 도메인 자연어 처리를 위한 도메인 매칭 장치 및 방법
출원번호(일자) : 2017-0178886 (2017.12.22) / 출원인 : 주식회사 마인드셋
입력 데이터를 일반 문자열 형태로 입력받고, 상기 입력 데이터를 구분하여 단어 또는 단어 조합으로 구성되는 어구 정보를 생성하는 구분
모듈; 및
상기 어구 정보와 질문 데이터 세트를 토대로 특정 도메인에 대한 출력 데이터를 생성하는, 복수개의 도메인에 대한 복수개의 도메인 파이
프라인;
을 포함하는 멀티 도메인의 자연어 처리를 수행하기 위한 자연어 처리 장치의 도메인 매칭을 위한 도메인 매칭 장치에 있어서,
상기 어구 정보를 어떤 도메인 파이프라인에 매칭하는 것이 적합할지에 대한 정보인 도메인 스코어를 계산하는 도메인 스코어 계산 모듈;
타 도메인으로의 전이 확률을 기초로 가중치를 생성하고, 상기 도메인 스코어 계산 모듈의 도메인 스코어 계산에 상기 가중치를 제공하는
가중치 모듈; 및
상기 도메인 스코어가 가장 높은 도메인에 관련된 상기 도메인 파이프라인에 상기 어구 정보를 매칭하는 도메인 매칭 모듈;
을 포함하며,
상기 도메인 스코어의 계산은, 상기 어구 정보와 상기 질문 데이터 세트와의 유사도 및 상기 가중치를 기초로 수행되고,
상기 도메인 스코어 계산 모듈은, 상기 어구 정보를 상태(state), 상기 도메인 매칭 장치를 에이전트(agent), 상기 도메인 파이프라인의 매
칭을 액션(action), 상기 출력 데이터에 따른 새로운 입력 데이터에 대한 정보를 보상(reward)로 하는 강화학습에 의해 업데이트되며,
상기 어구 정보와 매칭된 상기 복수개의 도메인 파이프라인 중 하나의 도메인 파이프라인이 상기 출력 데이터를 생성하도록 구성되는 것
을 특징으로 하는,
멀티 도메인의 자연어 처리를 위한 도메인 매칭 장치.
Type 4: 학습 모델
학습 모델(NLP 도메인 매칭에
강화학습 모델을 적용)에 특징 有
74
75. 등록특허 명칭 : Adaptation of a speech recognition system across multiple remote
sessions with a speaker
출원번호(일자) : 09/309,211 (1999.05.10) / 출원인 : Nuance Communications
Type 5: 응용, 서비스, BM
A method of adapting a speech recognition system, wherein
the method comprises steps of:
a. obtaining an identification of a speaker;
b. obtaining a sample of a speakers speech during a first
remote session;
c. recognizing the speakers speech utilizing the speech
recognition system during the first remote session;
d. modifying the speech recognition system by
incorporating the sample into the speech recognition
system thereby forming a speaker-specific modified speech
recognition system;
e. storing a representation of the speaker-specific modified
speech recognition system in association with the
identification of the speaker; and
f. using the representation of the speaker-specific modified
speech recognition system to recognize speech during a
subsequent remote session with the speaker.
음성 인식 모델의
사용자 개인화를
최초 대화시
수행하는 것에
특징 有
75
76. 등록특허 명칭 : 고객 안면이미지로부터 신경망으로 추출한 특성에 근거한 고객 관리 시스템
및 방법
출원번호(일자) : 2016-0065875 (2016.05.27) / 출원인 : ㈜가비아
Type 5: 응용, 서비스, BM
촬영을 통해 고객의 안면이미지를 획득하는 이미지 획득장치;
상기 고객을 대면하는 직원이 소지한 직원 단말;
통신망을 통해 상기 이미지 획득장치로부터 촬영된 안면이미지를 수
신하고 신경망 엔진을 이용하여 상기 안면이미지로부터 얼굴 특징
(feature)을 추출한 후 추출된 얼굴 특징에 적합한 고객패턴정보를 분
석하며, 분석된 상기 고객패턴정보를 상기 직원 단말에게 전송하여 고
객별 차별화된 서비스를 제공하는 고객 분석 서버를 포함하고,
상기 고객 분석 서버는, 상기 직원 단말로 전송한 상기 고객패턴정보
에 대하여 고객의 반응을 반영한 학습 피드백 정보를 수신하고, 수신
된 학습 피드백 정보를 상기 신경망 엔진에 전달하여 지도 학습
(supervised learning)을 수행하도록 하고,
상기 직원 단말은, 상기 고객 분석 서버로부터 전송받은 고객패턴정보
에 대하여 해당 고객과 맞으면 성공, 맞지 않으면 실패, 보류하려면 보
류 관련 피드백 정보를 선택하고, 상기 고객 분석 서버의 신경망 엔진
은, 상기 얼굴 특징을 미리 학습시켜 놓은 고객의 서비스 내역과 대조
하여 유사한 얼굴 특징을 가진 고객들이 선택하는 서비스나 상품, 할
인제도 중 적어도 하나를 포함하는 고객패턴정보를 추정하며,
상기 직원 단말이 선택한 상기 성공, 실패, 보류 중 적어도 하나의 피
드백 정보를 수신하고 실시간 또는 일괄적으로 지도 학습과정을 수행
하는 것을 특징으로 하는
고객의 안면이미지에 근거한 고객 관리 시스템.
얼굴 특징과 고객 소비 패턴을
각각 신경망으로 구성 및
분석하여 서비스 제공하는 것에
특징 有
76
77. 등록특허 명칭 : 신경망을 이용한 오토포커싱 방법
출원번호(일자) : 2006-0098926 (2006.10.11) / 출원인 : 삼성전기 주식회사
Type 5: 응용, 서비스, BM
기설정된 가중치에 따라 입력 이미지의 포커스 지점을 예측하는 신
경망에 이미지를 입력하여 출력되는 예측 포커스 지점과 상기 이미
지의 포커스 지점을 비교하여 그 오차가 감소되는 방향으로 상기
가중치를 조절하는 신경망 구축단계; 및
상기 카메라 렌즈부터의 이미지를 상기 신경망에 입력시켜 상기 입
력되는 이미지 데이터에 대하여 상기 신경망에서 출력되는 상기 카
메라 렌즈의 포커스 지점을 획득하는 단계
를 포함하는 신경망을 이용한 카메라의 오토포커싱 방법.
신경망을 렌즈
오토포커싱에
활용하는 것에
특징 有
77
78. 등록특허 명칭 : 인스턴트 통신 음성 인식 방법 및 단말기
출원번호(일자) : 2014-7027277 (2013.03.01) / 출원인 : 텐센트 테크놀로지 컴퍼니 리미티드
Type 5: 응용, 서비스, BM
인스턴트 메시징을 위한 음성 인식 방법에 있어서,
사용자에 의해 입력된 음성 정보를 수신하는 단계;
현재의 환경 정보를 획득하고, 상기 음성 정보가 상기 현재의
환경 정보에 따라 재생될 필요가 있는지를 판단하는 단계; 및
상기 음성 정보가 재생될 필요가 없는 것으로 판단될 경우에
는 상기 음성 정보를 텍스트 정보로서 인식하는 단계를 포함
하되,
상기 현재의 환경 정보는 현재의 잡음 정보를 포함하고,
상기 음성 정보가 상기 현재의 환경 정보에 따라 재생될 필요
가 있는지를 판단하는 단계는
상기 현재의 잡음 정보가 미리 설정된 범위 내에 있는 지를 판
단하는 단계;
상기 현재의 잡음 정보가 상기 미리 설정된 범위 내에 있는 경
우에 상기 음성 정보가 재생될 필요가 있는 것으로 판단하는
단계; 및
상기 현재의 잡음 정보가 상기 미리 설정된 범위 내에 있지 않
은 경우에는 상기 음성 정보가 재생될 필요가 없는 것으로 판
단하는 단계를 포함하는 음성 인식 방법.
주변 환경의 잡음에 따라 음성 입력을
텍스트로 인식하여 처리하는 것에 특징 有
78
79. 등록특허 명칭 : 신경망 학습기법을 이용한 위조지문 판별장치 및 그 방법
출원번호(일자) : 2016-0039176 (2016.03.31) / 출원인 : 주식회사 유니온커뮤니티
Type 5: 응용, 서비스, BM
광굴절기를 이용한 광학식으로 지문 이미지를 획득하되, 지문
이미지 획득용 광으로 백색 광을 이용하여 상기 광굴절기의
지문접촉면에 접촉한 지문의 이미지를 획득하는 단계;
상기 획득한 지문 이미지에서 생체지문과 위조지문을 구분하
기 위한 복수 개의 특징값을 추출하는 단계; 및
신경망 학습법에 따라 학습된 생체지문-특징값 범위에 상기
추출된 특징값이 속하는 경우에 상기 지문을 생체지문으로 판
단하는 단계를 포함하며,
상기 생체지문-특징값 범위는, 상기 생체지문-특징값의 기준
이 되는 기준값을 설정하는 단계;
기보유한 생체 지문 이미지에 대하여 상기 복수 개의 특징값
을 각각 추출하여 신경망 학습법에 따라 상기 기준값에 부가
할 오차를 변경하는 단계; 및
상기 오차를 변경하는 단계를 복수 개의 기보유한 생체 지문
이미지에 대하여 반복 수행하여 획득한 오차들을 상기 기준값
에 적용하여 상기 생체지문-특징값 범위를 확정하는 단계를
통해 설정한 것임을 특징으로 하는
위조지문 판별방법.
신경망 학습을 위조지문의 판별에
활용한 것에 특징 有
79
80. 등록특허 명칭 : 머신러닝을 이용한 음악 콘텐츠의 메타데이터 자동 태깅 방법
출원번호(일자) : 2017-0146540 (2017.11.06) / 출원인 : 주식회사 아티스츠카드
Type 6: data 저장, 사후관리
머신러닝을 이용하여 메타데이터 자동 태깅 모델을 생성하는 단계;
소정의 음악 콘텐츠의 하나 이상의 오디오 분석 결과 값을 획득하는 단
계; 및
상기 메타데이터 자동 태깅 모델을 이용하여, 상기 소정의 음악 콘텐츠
의 하나 이상의 오디오 분석 결과 값에 기초하여 상기 소정의 음악 콘텐
츠에 메타데이터를 자동 태깅하는 단계를 포함하고,
상기 머신러닝을 위한 학습 데이터는,
하나 이상의 학습용 음악 콘텐츠의 하나 이상의 오디오 분석 결과 값, 및
상기 하나 이상의 학습용 음악 콘텐츠에 태깅된 메타데이터를 포함하고,
상기 메타데이터는,
정보 데이터, 감성 데이터, 및 사용자 경험 데이터를 포함하고,
상기 소정의 음악 콘텐츠에 메타 데이터를 자동 태깅하는 단계는,
상기 소정의 음악 콘텐츠의 하나 이상의 오디오 분석 결과 값 중 하나
이상의 제1 오디오 분석 결과 값을 기초로 상기 소정의 음악 콘텐츠에
상기 정보 데이터를 태깅하는 단계와,
상기 소정의 음악 콘텐츠의 하나 이상의 오디오 분석 결과 값 중 하나
이상의 제2 오디오 분석 결과 값을 기초로 상기 소정의 음악 콘텐츠에
상기 감성 데이터를 태깅하는 단계와,
상기 소정의 음악 콘텐츠의 하나 이상의 오디오 분석 결과 값 중 하나
이상의 제3 오디오 분석 결과 값을 기초로 상기 소정의 음악 콘텐츠에
상기 사용자 경험 데이터를 태깅하는 단계를 포함하는,
머신러닝을 이용한 음악 콘텐츠의 메타데이터 자동 태깅 방법.
머신러닝을 이용한 메타데이터
자동 태깅 모델이 음악 콘텐츠를
자동 분류, 저장 및 관리하는 것에
특징 有
80
81. 등록특허 명칭 : 기계 학습을 위한 데이터관리장치 및 그 동작 방법
출원번호(일자) : 2017-0166774 (2017.12.06) / 출원인 : 한국과학기술정보연구원
Type 6: data 저장, 사후관리
적어도 하나의 서버에 학습 대상에 해당하는 데이터가 분배되도록 제어하는 분배제어부; 및
상기 분배된 데이터에 대한 단위학습이 해당 서버에서 수행되도록 하되, 상기 단위학습이 완료된 특정단위데이터는
다른 서버로 전송되도록 제어하며, 금번 단위학습이 해당 서버에서 수행되는 동안, 직전 단위학습에 사용되어 학습
이 완료된 상기 특정단위데이터가 학습중인 다른 서버로 전송되도록 하는 이동제어부를 포함하며,
상기 이동제어부는,
상기 금번 단위학습의 시작신호가 제1 서버로부터 수신되면, 상기 제1 서버로부터 상기 특정단위데이터를 가져올
것을 명령하는 이동명령신호를 상기 제1 서버와는 다른 제2 서버로 전송하며,
상기 제1 서버로부터 상기 금번 단위학습의 종료신호가 수신되면, 상기 제1 서버로부터 상기 특정단위데이터를 가
져오는 것을 중단할 것을 명령하는 중단명령신호를 상기 제2 서버로 전송하는 것을 특징으로 하는
데이터관리장치.
기계학습이 완료된 단위 데이터를
다른 서버로 전송 이동시켜
관리하는 것에 특징 有
81
82. 인공지능 & 딥러닝 특허, 정리하면..
1. source data 확보/수집 방식: data 확보 방식이나
data 수집 기준이 특별하다면…
2. data 가공과 관계된 기술적 특징: 사전처리 방식, 구
조화 방식, 샘플링 방식, feature 유형 등에 고유함
(uniqueness)이 있다면…
3. 학습 데이터 셋 구성: 그 input을 통해 그 output을 얻
고자 하는 것이 새로운 시도라면…
4. 학습 모델과 관계된 기술적 특징: (대부분 공개된 모델
을 사용하므로) fitting/tuning의 정도가 크다면…
5. 응용, 서비스 BM 구조: 해당 domain에서 AI를 응용한
사례가 없었거나, 개인화·개별화를 위한 것이라면…
6. data 저장, 사후관리: data의 재-처리/활용 등을 위한
저장 및 관리 방식에 특별함이 있다면…
82
83. Google, IBM, Amazon 등과 경쟁하지 말자
83
<model of quantum neural networks (QNNs)>
핵심기술 연구 중심
84. 특허는 아이디어를 선점하는 것
다수의 응용 특허로 비즈니스 길목을 차단
경쟁사는 시간과 비용 소진 길목 특허로 차단
핵심기술
84
85. 넓은 권리범위를 갖는 특허 (X)
시장/제품을 정확하게 타겟하는 특허 (O)
강한 특허란?
85
91. Business sector to Technology Mapping
Portfolio A
Portfolio B
Portfolio C
.
.
.
Designing patent portfolio
Business sector
(customer value)
Segmenting
Technology
Segmenting
91
92. source: Patent value assessment and commercialization strategy, Chih-Hung Hsieh
Long-term strategic mapping
92