SlideShare a Scribd company logo
1 of 14
시스템종합설계
최종 발표
GPS 음영지역내에서 드론의 장애물 회피
자율비행 알고리즘 개발
인천대학교 산업경영공학과 문 준 혁
김 희 주
양 승 지
2022.06.09(목)
지도교수 : 인천대학교 산업경영공학과 김재곤 교수님
팀 : R&D(Reinforcement & Drone)
Contents
Ⅰ 서론
Ⅱ 드론 자율비행 서비스 제안
Ⅲ 드론 자율비행 서비스 구현 및 결과
Ⅳ 결론 및 기대효과
1. 서론 | 제안 배경 및 목적
• 최근 대형 건축물 및 교량에 대한 균열 탐지 및 이상 징후 탐지의 중요성 증가
• 주기적 점검을 위한 드론 전문가 고용 및 사전 답사 비용 감소 기대
• 현 AI 드론의 연구는 다양한 센서를 부착하여 중량 증가(체공 시간 감소)를 야기
• 실시간 상황을 반영한 인공지능 기술을 활용하여 드론의 기동 체계 개발을 제안
• 중국 등 주변국에서는 인공지능을 활용한 드론 자율비행에 대한 연구를 활발히 진행 중
프로젝트 제안 배경
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
1
Unity
- 3D 및 2D 비디오 게임의 개발 환경을 제공하는 게임 엔진
- 3D 애니메이션과 건축 시각화, VR, AI 등 인터랙티브 콘텐츠 제작
- 게임 엔진시장의 45% 이상 차지
- 물리법칙 구현, 다양한 3D 모델 및 기능 구매 가능, 비교적
간단하게 환경 제작 가능
2
1. 서론 | 사용 프로그램 소개
Unity ML-agent
- 유니티를 이용한 인공지능 에이전트 학습을 지원하는 도구
- 유니티를 이용하여 환경제작
- 강화학습으로 에이전트가 다양한 경험을 수행하며 학습
- agent와 환경이 action, state, reward 정보를 주고받게 하는 도구
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
이전 연구
센서
 거리, 위치, 이미지 센서를 이용한
t시점의 정보 전달
t시점의 Action에 따른
t+1시점의 State를 환경에 전달
t+1 시점의 센서데이터 수집
t = t + 1
1. 서론 | 드론 자율비행 선행 연구
센서
 위치, 이미지 센서를 이용한
t시점의 정보 전달
t시점의 Action에 따른
t+1시점의 State를 환경에 전달
t+1 시점의 센서데이터 수집
t = t + 1
제안 드론 시스템
거리 센서 제거
(약 800g의 중량 감소)
3
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
1. 서론 | CNN 모델 거리 예측기법
• YOLO 알고리즘의 Loss Function을 LiDAR센서를 통해 수집한 실
제 거리값과 예측 거리값의 차이를 줄이는 방향으로 학습을 진행
• 기존 시스템과 아이디어의 차이점
딥러닝을 활용한 단안 카메라 기반 실시간 물체 검출 및 거리 추정
• 거리 센서의 탈착으로 인한 드론 체공 시간 증가
 강화학습 드론 스스로가 환경 내에서 발생되는 다양한 상황을 미리 학습하여 실
시간으로 의사결정 가능
 거리 측정 센서(LiDAR Sensor)의 탈착으로 인한 중량 감소  체공 시간 증가
 Mission 수행 시간 증가를 야기
 실시간 이미지 처리를 통한 거리 측정 알고리즘 구축
 드론 전문 인력 양성 및 고용비용 등의 절감.
4
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
2. 드론 비행 서비스 제안
이미지 데이터 수집
(카메라)
Scan Object Detection
삼각측량을 통한 실시간
드론의 절대 좌표 측정
Embedded PC Drone
실시간 DATA
Object - Drone 거리 예측
RL Agent
의사결정결과 도출
Sensor Data
드론의 UWB Anchor와
부착된 UWB Tag센서 간
거리
Yolo Model
Environment
실제 환경
5
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
2. 드론 비행 서비스 제안 | 좌표 측정 모델
 UWB 센서 : UWB Anchor센서와 UWB Tag 센서간의 거리를 넘겨주는 센서
 UWB Tag센서의 절대좌표(GPS활용)와 드론에 부착된 4개의 Anchor센서와의 거리를 원의 반지름을 통해 계산
R1
(𝑋𝐴1−𝑋𝑇)2
+ (𝑌𝐴1−𝑌𝑇)2
+ (𝑍𝐴1−𝑍𝑇)2
= (𝑅1)2
(𝑋𝐴2−𝑋𝑇)2 + (𝑌𝐴2−𝑌𝑇)2 + (𝑍𝐴2−𝑍𝑇)2 = (𝑅2)2
(𝑋𝐴3−𝑋𝑇)2
+ (𝑌𝐴3−𝑌𝑇)2
+ (𝑍𝐴3−𝑍𝑇)2
= (𝑅3)2
(𝑋𝐴4−𝑋𝑇)2 + (𝑌𝐴4−𝑌𝑇)2 + (𝑍𝐴4−𝑍𝑇)2 = (𝑅4)2
Distance(𝑋𝐴1, 𝑋𝐴2), Distance(𝑋𝐴1, 𝑋𝐴3)
Distance(𝑋𝐴2, 𝑋𝐴3), Distance(𝑋𝐴3, 𝑋𝐴4)
Distance = 30cm
UWB Tag(GPS 좌표)를 통해
드론의 X, Y, Z 계산
6
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
2. 드론 비행 서비스 제안 | 강화학습 Agent
START
<Camera>
이미지 데이터 수집
객체 Detection
<UWB>
Tag센서와 Anchor 센서
사이 거리 데이터 수집
드론의 절대좌표 측정
벽과의 충돌했는가?
드론의 Action(X, Y, Z, θ)을 취한다.
Reward 계산
If Object와의 거리 < 3m
- Reward
Else 3m < Object와 거리
&& Object와 거리 < 5m
+ Reward
큰 - reward
7
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
 State  Action  Reward
8
3. 드론 비행 서비스 구현| 강화학습 설정
• Drone agent의 거리 벡터
(agent 위치 – goal위치)
• Drone agent의 속도 벡터
• Drone agent의 각속도 벡터
• Drone agent의 각도 벡터
• Drone agent의 X, Y, Z 이동값
• Y축 기준의 rotation(θ) 값
• 이동값 = 연속적인 행동
X,Y,Z값을 -1~1 사이로 정규화
그 값을 드론의 추력값으로 사용
 드론 행동 결정
• 기본 리워드  -0.01
: 행동결정 시간 단축
• 거리값이 멀거나 벽에 부딪힌 경우
: reward = -100f
• reward = 스캔한 영역의 큐브개수
= raycast가 hit한 큐브개수
= 빨간색으로 변한 큐브개수
• SetReward(reward)
 한 스텝의 결과로 도출되는 보상에
입력값을 더함
• 에피소드 시작할 때
Drone, 원기둥, reward 초기화
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
Unity 시뮬레이션 환경 구현
9
3. 드론 비행 서비스 구현| 시뮬레이션 환경
• 원기둥을 스캔하는 강화학습 모델 구상 중(Small Project)
강화학습을 정의하기 위해 원기둥 환경을 큐브 여러 개로 쪼갬
┗ raycast 가 닿는 cube를 빨간색으로 변환
 raycast 범위는 드론의 카메라가 보는 화면만큼
 전면이 빨간 cube로 바뀌도록 학습
state : 드론의 위치 + goal까지의 거리벡터
action : 드론의 움직이는 방향(x,y,z값) + 회전각도(θ)
reward : raycast가 hit한 cube 수(=빨간 cube의 개수)
• raycast
게임오브젝트의 원점에서 설정한 방향으로 Ray를 날려
설정한 거리 이내에 물체가 있는지 없는지 충돌감지
게임오브젝트 위치, 방향, 충돌정보, 거리 필요
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
결과
3. 드론 비행 서비스 구현| 결과
raycast에 닿은 큐브의 색을 빨간색으로 변환
= Drone의 카메라가 스캔하는 영역으로 지정
 빨간색으로 변한 큐브의 수를 reward로 설정
 학습을 빨간색영역을 증가시켜나가는 방향으로 진행
강화학습 알고리즘 : PPO
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
10
4. 결론 및 기대효과
1. Drone agent 강화학습  reward 많이 받는 방향으로 학습  빨간색 큐브가 많아지도록 학습됨을 확인
2. Episode 수 증가에 따른 reward 값 증가
1. 현재 드론을 조종하기 위한 인력 필요 + 사람이 볼 수 있는 시야 내에서 직접 조종으로 인한 비효율성
 강화학습으로 개선가능 및 비용 감소 효과
2. 거리센서 제거  드론 주행시간 증가  작업 효율성 증가
3. 기업 경쟁력 향상 효과 및 실제 환경에 적용 하여 기업의 고정 소모비용 감소 효과
1. 실제 드론에 강화학습으로 학습된 agent를 적용할 수 있는 embedded PC를 부착하여 Lab Test 실행
2. 이후 Yolo Model을 활용하여 실제 환경에서 거리 값을 계산하며, 스캔할 대상인지 판별하는 모델 제작
12
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
감사합니다

More Related Content

Similar to 시스템종합설계_R&D_최종발표자료.pptx

기보작 피피
기보작 피피기보작 피피
기보작 피피yoonyj
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...BOAZ Bigdata
 
스마트폰 기반의 TS 측량 지원시스템 개발
스마트폰 기반의 TS 측량 지원시스템 개발스마트폰 기반의 TS 측량 지원시스템 개발
스마트폰 기반의 TS 측량 지원시스템 개발park jinwoo
 
이병철의 개발자 포트폴리오
이병철의 개발자 포트폴리오이병철의 개발자 포트폴리오
이병철의 개발자 포트폴리오Lee ByeongCheol
 
[pycon korea 2018] 드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
[pycon korea 2018]  드론 및 인공위성 영상을 이용한 태양광발전소 입지분석[pycon korea 2018]  드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
[pycon korea 2018] 드론 및 인공위성 영상을 이용한 태양광발전소 입지분석재현 최
 
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법Joo-Haeng Lee
 
스마트폰기반의 Ts 측량 지원시스템 개발
스마트폰기반의 Ts 측량 지원시스템 개발스마트폰기반의 Ts 측량 지원시스템 개발
스마트폰기반의 Ts 측량 지원시스템 개발진우 박진우
 
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)Joo-Haeng Lee
 
Stabilization Method of Trajectory Data with Planar Characteristic using Plan...
Stabilization Method of Trajectory Data with Planar Characteristic using Plan...Stabilization Method of Trajectory Data with Planar Characteristic using Plan...
Stabilization Method of Trajectory Data with Planar Characteristic using Plan...Stryx
 
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...Gyubin Son
 
지능 Baram 보고서
지능 Baram 보고서지능 Baram 보고서
지능 Baram 보고서NAVER D2
 
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개Byeong-Hyeok Yu
 
입문 Visual SLAM 14강 - 2장 Introduction to slam
입문 Visual SLAM 14강  - 2장 Introduction to slam입문 Visual SLAM 14강  - 2장 Introduction to slam
입문 Visual SLAM 14강 - 2장 Introduction to slamjdo
 
[공간정보시스템 개론] L01 공간정보시스템개요
[공간정보시스템 개론] L01 공간정보시스템개요[공간정보시스템 개론] L01 공간정보시스템개요
[공간정보시스템 개론] L01 공간정보시스템개요Kwang Woo NAM
 
[234] 산업 현장을 위한 증강 현실 기기 daqri helmet 개발기
[234] 산업 현장을 위한 증강 현실 기기 daqri helmet 개발기[234] 산업 현장을 위한 증강 현실 기기 daqri helmet 개발기
[234] 산업 현장을 위한 증강 현실 기기 daqri helmet 개발기NAVER D2
 
서울혁신챌린지 라이브 드론맵 기반 스마트 모니터링 솔루션
서울혁신챌린지 라이브 드론맵 기반 스마트 모니터링 솔루션서울혁신챌린지 라이브 드론맵 기반 스마트 모니터링 솔루션
서울혁신챌린지 라이브 드론맵 기반 스마트 모니터링 솔루션Impyeong Lee
 
증간현실 기반 체험형 학습모델 해외 연구 동향
증간현실 기반 체험형 학습모델 해외 연구 동향증간현실 기반 체험형 학습모델 해외 연구 동향
증간현실 기반 체험형 학습모델 해외 연구 동향메가트렌드랩 megatrendlab
 
Game using position information
Game using position informationGame using position information
Game using position informationSeowoo Han
 

Similar to 시스템종합설계_R&D_최종발표자료.pptx (20)

기보작 피피
기보작 피피기보작 피피
기보작 피피
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
 
스마트폰 기반의 TS 측량 지원시스템 개발
스마트폰 기반의 TS 측량 지원시스템 개발스마트폰 기반의 TS 측량 지원시스템 개발
스마트폰 기반의 TS 측량 지원시스템 개발
 
이병철의 개발자 포트폴리오
이병철의 개발자 포트폴리오이병철의 개발자 포트폴리오
이병철의 개발자 포트폴리오
 
[pycon korea 2018] 드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
[pycon korea 2018]  드론 및 인공위성 영상을 이용한 태양광발전소 입지분석[pycon korea 2018]  드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
[pycon korea 2018] 드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
 
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
 
스마트폰기반의 Ts 측량 지원시스템 개발
스마트폰기반의 Ts 측량 지원시스템 개발스마트폰기반의 Ts 측량 지원시스템 개발
스마트폰기반의 Ts 측량 지원시스템 개발
 
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
 
Stabilization Method of Trajectory Data with Planar Characteristic using Plan...
Stabilization Method of Trajectory Data with Planar Characteristic using Plan...Stabilization Method of Trajectory Data with Planar Characteristic using Plan...
Stabilization Method of Trajectory Data with Planar Characteristic using Plan...
 
Flood
FloodFlood
Flood
 
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
 
지능 Baram 보고서
지능 Baram 보고서지능 Baram 보고서
지능 Baram 보고서
 
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
 
입문 Visual SLAM 14강 - 2장 Introduction to slam
입문 Visual SLAM 14강  - 2장 Introduction to slam입문 Visual SLAM 14강  - 2장 Introduction to slam
입문 Visual SLAM 14강 - 2장 Introduction to slam
 
[공간정보시스템 개론] L01 공간정보시스템개요
[공간정보시스템 개론] L01 공간정보시스템개요[공간정보시스템 개론] L01 공간정보시스템개요
[공간정보시스템 개론] L01 공간정보시스템개요
 
[234] 산업 현장을 위한 증강 현실 기기 daqri helmet 개발기
[234] 산업 현장을 위한 증강 현실 기기 daqri helmet 개발기[234] 산업 현장을 위한 증강 현실 기기 daqri helmet 개발기
[234] 산업 현장을 위한 증강 현실 기기 daqri helmet 개발기
 
서울혁신챌린지 라이브 드론맵 기반 스마트 모니터링 솔루션
서울혁신챌린지 라이브 드론맵 기반 스마트 모니터링 솔루션서울혁신챌린지 라이브 드론맵 기반 스마트 모니터링 솔루션
서울혁신챌린지 라이브 드론맵 기반 스마트 모니터링 솔루션
 
증간현실 기반 체험형 학습모델 해외 연구 동향
증간현실 기반 체험형 학습모델 해외 연구 동향증간현실 기반 체험형 학습모델 해외 연구 동향
증간현실 기반 체험형 학습모델 해외 연구 동향
 
Game using position information
Game using position informationGame using position information
Game using position information
 
Gis개론
Gis개론Gis개론
Gis개론
 

시스템종합설계_R&D_최종발표자료.pptx

  • 1. 시스템종합설계 최종 발표 GPS 음영지역내에서 드론의 장애물 회피 자율비행 알고리즘 개발 인천대학교 산업경영공학과 문 준 혁 김 희 주 양 승 지 2022.06.09(목) 지도교수 : 인천대학교 산업경영공학과 김재곤 교수님 팀 : R&D(Reinforcement & Drone)
  • 2. Contents Ⅰ 서론 Ⅱ 드론 자율비행 서비스 제안 Ⅲ 드론 자율비행 서비스 구현 및 결과 Ⅳ 결론 및 기대효과
  • 3. 1. 서론 | 제안 배경 및 목적 • 최근 대형 건축물 및 교량에 대한 균열 탐지 및 이상 징후 탐지의 중요성 증가 • 주기적 점검을 위한 드론 전문가 고용 및 사전 답사 비용 감소 기대 • 현 AI 드론의 연구는 다양한 센서를 부착하여 중량 증가(체공 시간 감소)를 야기 • 실시간 상황을 반영한 인공지능 기술을 활용하여 드론의 기동 체계 개발을 제안 • 중국 등 주변국에서는 인공지능을 활용한 드론 자율비행에 대한 연구를 활발히 진행 중 프로젝트 제안 배경 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발 1
  • 4. Unity - 3D 및 2D 비디오 게임의 개발 환경을 제공하는 게임 엔진 - 3D 애니메이션과 건축 시각화, VR, AI 등 인터랙티브 콘텐츠 제작 - 게임 엔진시장의 45% 이상 차지 - 물리법칙 구현, 다양한 3D 모델 및 기능 구매 가능, 비교적 간단하게 환경 제작 가능 2 1. 서론 | 사용 프로그램 소개 Unity ML-agent - 유니티를 이용한 인공지능 에이전트 학습을 지원하는 도구 - 유니티를 이용하여 환경제작 - 강화학습으로 에이전트가 다양한 경험을 수행하며 학습 - agent와 환경이 action, state, reward 정보를 주고받게 하는 도구 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 5. 이전 연구 센서  거리, 위치, 이미지 센서를 이용한 t시점의 정보 전달 t시점의 Action에 따른 t+1시점의 State를 환경에 전달 t+1 시점의 센서데이터 수집 t = t + 1 1. 서론 | 드론 자율비행 선행 연구 센서  위치, 이미지 센서를 이용한 t시점의 정보 전달 t시점의 Action에 따른 t+1시점의 State를 환경에 전달 t+1 시점의 센서데이터 수집 t = t + 1 제안 드론 시스템 거리 센서 제거 (약 800g의 중량 감소) 3 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 6. 1. 서론 | CNN 모델 거리 예측기법 • YOLO 알고리즘의 Loss Function을 LiDAR센서를 통해 수집한 실 제 거리값과 예측 거리값의 차이를 줄이는 방향으로 학습을 진행 • 기존 시스템과 아이디어의 차이점 딥러닝을 활용한 단안 카메라 기반 실시간 물체 검출 및 거리 추정 • 거리 센서의 탈착으로 인한 드론 체공 시간 증가  강화학습 드론 스스로가 환경 내에서 발생되는 다양한 상황을 미리 학습하여 실 시간으로 의사결정 가능  거리 측정 센서(LiDAR Sensor)의 탈착으로 인한 중량 감소  체공 시간 증가  Mission 수행 시간 증가를 야기  실시간 이미지 처리를 통한 거리 측정 알고리즘 구축  드론 전문 인력 양성 및 고용비용 등의 절감. 4 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 7. 2. 드론 비행 서비스 제안 이미지 데이터 수집 (카메라) Scan Object Detection 삼각측량을 통한 실시간 드론의 절대 좌표 측정 Embedded PC Drone 실시간 DATA Object - Drone 거리 예측 RL Agent 의사결정결과 도출 Sensor Data 드론의 UWB Anchor와 부착된 UWB Tag센서 간 거리 Yolo Model Environment 실제 환경 5 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 8. 2. 드론 비행 서비스 제안 | 좌표 측정 모델  UWB 센서 : UWB Anchor센서와 UWB Tag 센서간의 거리를 넘겨주는 센서  UWB Tag센서의 절대좌표(GPS활용)와 드론에 부착된 4개의 Anchor센서와의 거리를 원의 반지름을 통해 계산 R1 (𝑋𝐴1−𝑋𝑇)2 + (𝑌𝐴1−𝑌𝑇)2 + (𝑍𝐴1−𝑍𝑇)2 = (𝑅1)2 (𝑋𝐴2−𝑋𝑇)2 + (𝑌𝐴2−𝑌𝑇)2 + (𝑍𝐴2−𝑍𝑇)2 = (𝑅2)2 (𝑋𝐴3−𝑋𝑇)2 + (𝑌𝐴3−𝑌𝑇)2 + (𝑍𝐴3−𝑍𝑇)2 = (𝑅3)2 (𝑋𝐴4−𝑋𝑇)2 + (𝑌𝐴4−𝑌𝑇)2 + (𝑍𝐴4−𝑍𝑇)2 = (𝑅4)2 Distance(𝑋𝐴1, 𝑋𝐴2), Distance(𝑋𝐴1, 𝑋𝐴3) Distance(𝑋𝐴2, 𝑋𝐴3), Distance(𝑋𝐴3, 𝑋𝐴4) Distance = 30cm UWB Tag(GPS 좌표)를 통해 드론의 X, Y, Z 계산 6 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 9. 2. 드론 비행 서비스 제안 | 강화학습 Agent START <Camera> 이미지 데이터 수집 객체 Detection <UWB> Tag센서와 Anchor 센서 사이 거리 데이터 수집 드론의 절대좌표 측정 벽과의 충돌했는가? 드론의 Action(X, Y, Z, θ)을 취한다. Reward 계산 If Object와의 거리 < 3m - Reward Else 3m < Object와 거리 && Object와 거리 < 5m + Reward 큰 - reward 7 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 10.  State  Action  Reward 8 3. 드론 비행 서비스 구현| 강화학습 설정 • Drone agent의 거리 벡터 (agent 위치 – goal위치) • Drone agent의 속도 벡터 • Drone agent의 각속도 벡터 • Drone agent의 각도 벡터 • Drone agent의 X, Y, Z 이동값 • Y축 기준의 rotation(θ) 값 • 이동값 = 연속적인 행동 X,Y,Z값을 -1~1 사이로 정규화 그 값을 드론의 추력값으로 사용  드론 행동 결정 • 기본 리워드  -0.01 : 행동결정 시간 단축 • 거리값이 멀거나 벽에 부딪힌 경우 : reward = -100f • reward = 스캔한 영역의 큐브개수 = raycast가 hit한 큐브개수 = 빨간색으로 변한 큐브개수 • SetReward(reward)  한 스텝의 결과로 도출되는 보상에 입력값을 더함 • 에피소드 시작할 때 Drone, 원기둥, reward 초기화 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 11. Unity 시뮬레이션 환경 구현 9 3. 드론 비행 서비스 구현| 시뮬레이션 환경 • 원기둥을 스캔하는 강화학습 모델 구상 중(Small Project) 강화학습을 정의하기 위해 원기둥 환경을 큐브 여러 개로 쪼갬 ┗ raycast 가 닿는 cube를 빨간색으로 변환  raycast 범위는 드론의 카메라가 보는 화면만큼  전면이 빨간 cube로 바뀌도록 학습 state : 드론의 위치 + goal까지의 거리벡터 action : 드론의 움직이는 방향(x,y,z값) + 회전각도(θ) reward : raycast가 hit한 cube 수(=빨간 cube의 개수) • raycast 게임오브젝트의 원점에서 설정한 방향으로 Ray를 날려 설정한 거리 이내에 물체가 있는지 없는지 충돌감지 게임오브젝트 위치, 방향, 충돌정보, 거리 필요 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 12. 결과 3. 드론 비행 서비스 구현| 결과 raycast에 닿은 큐브의 색을 빨간색으로 변환 = Drone의 카메라가 스캔하는 영역으로 지정  빨간색으로 변한 큐브의 수를 reward로 설정  학습을 빨간색영역을 증가시켜나가는 방향으로 진행 강화학습 알고리즘 : PPO 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발 10
  • 13. 4. 결론 및 기대효과 1. Drone agent 강화학습  reward 많이 받는 방향으로 학습  빨간색 큐브가 많아지도록 학습됨을 확인 2. Episode 수 증가에 따른 reward 값 증가 1. 현재 드론을 조종하기 위한 인력 필요 + 사람이 볼 수 있는 시야 내에서 직접 조종으로 인한 비효율성  강화학습으로 개선가능 및 비용 감소 효과 2. 거리센서 제거  드론 주행시간 증가  작업 효율성 증가 3. 기업 경쟁력 향상 효과 및 실제 환경에 적용 하여 기업의 고정 소모비용 감소 효과 1. 실제 드론에 강화학습으로 학습된 agent를 적용할 수 있는 embedded PC를 부착하여 Lab Test 실행 2. 이후 Yolo Model을 활용하여 실제 환경에서 거리 값을 계산하며, 스캔할 대상인지 판별하는 모델 제작 12 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발

Editor's Notes

  1. https://img0.yna.co.kr/etc/inner/KR/2021/06/04/AKR20210604169300072_01_i_P4.jpg
  2. https://www.koreascience.or.kr/article/JAKO201933751283944.pdf
  3. 앵커 : 기준이 되는 곳에 위치시키는 것 태그 : 앵커와의 거리를 재려고 이동하는 물체에 부착 태그가 전파를 쏘고 앵커가 그 전파를 받을 때 생기는 시간차로 두 지점사이의 거리를 구한다