1. 재미있는 생성 인공지능 현황
창원대학교 정보통신공학과
박동규
Image from Midjourney
2. 소개
• 소속 : 창원대학교 정보통신공학과 교수
• 부캐 : 작가겸 유튜브
• 관심 분야 : 모바일 헬스케어, 머신러닝, 딥러닝, 인공지능, 모바일 서
비스
• 교육 분야 : 데이터 분석, 머신러닝, 딥러닝, 컴퓨터 프로그래밍, 자료
구조, 모바일 앱 개발, C/C++, 자바, 파이썬, Swift 등
11. 생성 인공지능이란
• 주어진 데이터나 지식을 활용하여 새로운 내용을 생성하는 인공지능 기
술
• 범주
• 자연어 생성(대화형 인공지능) : ChatGPT, Google Bard
• 이미지 생성 : Dall.E, Stable Di
ff
usion, DeepDream Generator
• 음원 생성 : AIVA, Soundraw, etc
• 로고 생성, 영상 생성, …
13. 생성 모델
훈련 데이터 생성된 샘플
학습 샘플링
관찰 데이터(샘플)
분포 학습
생성 모델의 절차
생성 모델은 주어진 데이
터를 학습하여 원래 데이
터의 분포를 따르는 유사
한 데이터를 생성하는 방
법입니다.
유사한 데이터
랜덤한 잡음
이미지 생성 기술
14. 생성 모델
RGB 값을 가진
이미지 데이터
유사한 데이터
랜덤한 노이즈
생성 모델링은 픽셀 데이
터를 이용하여 유사한 픽
셀 이미지 데이터를 만드
는 작업으로 매우 어려운
작업입니다.
생성 모델
원본 이미지 노이즈를 가진 이미지
15. 판별 모델
훈련 데이터 예측값 0.78
학습 예측
진짜
판별 모델링의 절차
가짜
진위 판별
새로운 이미지
판별 모델은 주어진 진짜
/가짜 데이터를 학습하
여 이를 판별하는 훈련
을 합니다. 이것을 바탕
으로 새로운 이미지가 들
어올 때 진위 여부를 판
별합니다.
생성 모델의 비약적인 발전을 가져
온 판별 모델
16. 위조 지폐범 위조 지폐
랜덤 입력
진짜 지폐
경찰
진짜
가짜
생성 모델 판별 모델
적대적 학습 생성 모델과 판별 모델
이 서로 경쟁을 통해 적
대적으로 학습하며, 학
습 성능을 개선해 간다면
결국 둘 다 똑똑한 모델
이 될 것입니다.
적대적 생성 모델
Generative Adversarial Network : GAN
17. vs
생성 인공지능 판별 인공지능
경쟁하며 발전하는 GAN 인공지능
경쟁하며 진화하는 생물
vs
치타 가젤
적대적 생성 모델
Generative Adversarial Network : GAN
29. Deep Dream Generator
• 구글 계정으로 이용가능
• 사용자의 이미지를 다양한 스타일로 그려주는 기능
• 텍스트 프롬프트를 이용한 생성 기능이 추가됨
• Midjourney, Dall.E, Stable Di
ff
usion 모델에 비하여 품질이
떨어짐
• Energy 마일리지 기반의 유료 서비스
32. “walking in a literal sea of stars” 텍스트 결과
미드저니에서 “문자 그대
로 별들의 바다를 걷다” 라
는 텍스트를 입력한 결과
입니다. 이 인공지능 모델
은 텍스트를 학습하여 이
텍스트에 적합한 이미지
를 만들어서 제공합니다.
출처 : e-greennara.com
39. 미드저니 프롬프트 명령
• /imagine 텍스트
• —ar : 가로, 세로 비율
• —chaos : 0에서 100까지 숫자로 처음 이미지와 다른 정도
• —q : 0에서 1사이의 값으로 품질
• —no : 제거하고 싶은 물체나 대상
• … 다양한 종류의 프롬프트를 이용한 제어
41. 미드 저니
• 사용자 층이 넓다. 디스코드 계정이 필요함
• 유료 서비스로 매우 품질 높은 이미지 생성 기능을 제공
• 프롬프트 + 인자를 활용한 이미지 생성이 가능합
• 다른 사용자의 이미지를 보고 수정하는 기능이 있음
• 채널 이용 방법이 초급자에게는 다소 까다롭다.
44. Stable Diffusion
• Stability AI와 Runway사에서 오픈소스 라이선스로 배포한 텍스트-
이미지 생성 인공지능 모델
• Stability AI사는 2022년 자사의 텍스트-이미지 생성 인공지능 모델
을 github에 오픈함
• 소스 코드, 모델을 모두 공개
• 이후 엄청난 fork를 기록함
82. 결론
• text2image 기술의 엄청난 진보가 이루어졌다
• 프롬프트를 잘 활용하는 것이 아주 중요한 포인트
• 음원 생성도 매우 잘 한다
• 비디오 생성 기술은 현재 초급 단계이지만 매우 빠른 기술 진보가 이
루어질 것으로 보인다
• 과거의 업무 방식에 비해 획기적으로 발전된 업무가 가능할 것이다