REAL TIME PROCESS ANOMALY DETECTION
PADA SET DATA FLIGHT RECORDING BERBASIS ADS-B
DENGAN PENDEKATAN KARAKTERISTIK SEGMENTASI
Oleh :
Mohammad Yazdi Pusadan
NRP. 5114301006
Promotor: Prof. Dr. Ir. Joko Lianto Buliali, M.Sc.
Co. Promotor: Dr. Ir. R.V. Hari Ginardi, M.Sc
CAPAIAN PROGRESS
1. Segmentasi yang Dinamis.
2. Melakukan pengamatan terhadap kebiasaan posisi Latitude dan Longitude
pada suatu penerbangan selama 30 hari yang callsign nya sama, sehingga
menemukan data yang dominan
3. Komputasi persamaan antara data yang dominan tersebut dengan data
testing melalui pendekatan Likelihood dan Log Likelihood.
4. Deteksi anomaly berdasarkan Likelihood ratio model (max min Likelihood)
dengan Likelihood data testing, serta menentukan prosentasi anomaly
dihasilkan.
Penentuan Data Training
-7.35699
112867
Latitude Longitude
-7.30232 112.3073
-7.30232 112.3073
-7.35699 112.3867
-7.30232 112.3073
1
2
3
n
Data Training h=1
Latitude Longitude
-7.68852 113.2412
-7.68852 113.2412
-7.68852 113.2412
-7.65701 113.1795
Data Training h=30
1
2
3
n
Setiap record (1 s/d 100) pada data training (1 s/d 30) di Cluster sehingga ditemukan cluster yang
dominan (jumlah anggotanya terbanyak dari cluster lain).
Pada data yang dominan tsb, diambil nilai centroid sehingga dari data training (30 hari) dihasilkan
satu data (100 record) yang mewakili dari setiap data training berdasarkan kemiripan data.
n = 100
Penentuan Data Training
Latitude Longitude
-7.30232 112.3073
-7.33964 112.1334
-7.29622 112.304
-7.68852 113.2412
H=1
2
3
30
Cluster
Latitude Longitude
-7.30232 112.3073
-7.33964 112.1334
-7.29622 112.304
-7.28604 112.2759
Latitude Longitude
-7.32867 112.5838
-7.35278 112.6425
-7.39756 112.5986
-7.27681 112.5059
Latitude Longitude
-7.5888 112.8015
-7.598 112.7992
-7.68852 113.2412
Cluster-3Cluster-2Cluster-1
1
2
3
20
1
2
3
7
1
2
3
Latitude Longitude
-7.62511 112.9473
Latitude Longitude
-7.31399 112.302
Latitude Longitude
-7.34263 112.5439
Centroid Cluster-1 Centroid Cluster-2 Centroid Cluster-3
Proses dilakukan sampai record ke-n, n=100
mis: menetukan data record-1 pada 30 hari penerbangan atau
30 penerbangan dengan callsign yang sama
Data record-1 pada hari
ke-1 s/d hari ke-30
Data Training dihasilkan(100 record) dan Segmentasi
Latitude Longitude
-7.31399 112.302
-7.31374 112.2973
-7.31491 112.3097
-7.36935 112.4407
1
2
3
n=100
Data Training Fix (100 record)
Latitude Longitude
-7.31399 112.302
-7.31374 112.2973
-7.31491 112.3097
-7.36935 112.4407
1
2
3
20
Latitude Longitude
-7.32719 112.3289
-7.32715 112.3293
-7.32812 112.3314
-7.63911 112.9894
1
2
3
20
2
Latitude Longitude
-7.35581 112.4128
-7.36257 112.428
-7.39731 112.6522
-7.36935 112.4407
1
2
3
20
Segmen ke-1 Segmen ke-2 Segmen ke-n
SEGMENTASI, s=5
Pendekatan segmentasi dilakukan secara dinamis dengan tidak menentukan secara absolut
jumlah segmen
Makin banyak jumlah segmen yang digunakan, maka memperkecil jumlah data pada record
sehingga proses komputasi per segmen makin cepat dilakukan
Penentuan Data Testing
Data testing yang diperlukan, yaitu:
Diperoleh dari data training selama 30 hari, kemudian di segmen
sebanyak nSegmen per hari (hari ke-1 s/d hari 30).
Diperoleh dari data yang tidak berasal dari data training yang
sama callsign nya.
Data testing tersebut selanjutnya di komputasi dengan
pendekatan kemiripan/atau kebiasaan parameter latitude dan
longitude dalam suatu callsign.
Data yang menjadi standard/acuan untuk menentukan kebiasaan
dominan adalah data training fix.
Tahapan Pengujian Data dan Penentuan Class
Segmentasi Segmen-1 Segmen-nSegmen-2
dtTraining
Fix
dtTesting-
1
Segmen-1 Segmen-nSegmen-2Segmentasi
dtTesting-
30
Likelihood
Segmen-1
Likelihood
Segmen-2
Likelihood
Segmen-n
Max
Likelihood
Segmen-1
Min
Likelihood
Segmen-1
Klasifikasi Segmen-1
Class-1(Max)
Class-2(Min)
Max
Likelihood
Segmen-2
Min
Likelihood
Segmen-2
Klasifikasi Segmen-2
Class-1(Max)
Class-2(Min)
Max
Likelihood
Segmen-n
Min
Likelihood
Segmen-n
Klasifikasi Segmen-2
Class-1(Max)
Class-2(Min)
Algoritma Likelihood
phi=3.14258;
eps=271828;
dtTrainSeg1 = dtseg1(:,1:2); %data training fix untuk segmen I
dtTest1Seg1 = data1(1:20,3:4); %data test1 untuk segmen I
X = [dtTrainSeg1;dtTest1Seg1];
rata = mean(dtTrainTest1_Seg1);
L1LatSeg1=1; %Likelihood Latitude Segmen 1
L1LongSeg1=1; %Likelihood Longitude Segmen 1
for i=1:length(dtTrainTest1_Seg1)
L1LatSeg1 = L1LatSeg1*(1/sqrt(2*phi))*eps.^(-1/2*(X(i,1)-rata(1,1)).^2);
L1LongSeg1 = L1LongSeg1*(1/sqrt(2*phi))*eps.^(-1/2*(X(i,2)-rata1(1,2)).^2);
End
Algoritma Likelihood, ex: pada Segmen-1
2.94309E-18 8.67637E-20
Finding Anomaly
Lr1
Latitude Longitude
2.94309E-18 8.67637E-20
𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑡𝑒𝑠𝑡
Latitude Longitude
C1 1.074186𝑒 − 16 1.06285𝑒 − 16
C2 4.6389𝑒 − 17 5.3591𝑒 − 20
𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑚𝑜𝑑𝑒𝑙
Penentuan anomaly dilakukan dengan menghitung rasio antara model dengan data test, tahapannya sebagai
berikut:
Menghitung Likelihood ratio, yaitu 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑚𝑜𝑑𝑒𝑙(Likelihood pada C1 dan C2) dengan 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑡𝑒𝑠𝑡
nilai 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 diperoleh dari kesamaan anatar data testing baru dengan data training fix .
𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑅𝑎𝑡𝑖𝑜 𝐿𝑅 = −2𝐿𝑜𝑔
𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑚𝑜𝑑𝑒𝑙
𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑡𝑒𝑠𝑡
Lr2
Lr1 : Likelihood ratio pada 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑚𝑜𝑑𝑒𝑙 C1 dengan 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑡𝑒𝑠𝑡
Lr2 : Likelihood ratio pada 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑚𝑜𝑑𝑒𝑙 C2 dengan 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑡𝑒𝑠𝑡
Type equation here.2.94309E-18 , 8.67637E-20
Finding Anomaly
Membandingkan Lr_C1 dengan Lr_C2, jika:
- Lr1 < Lr2 berada pada class-1 dan non anomaly.
- Lr1>Lr2 berada pada class-2 dan anomaly.
Latitude Longitude
-7.19455 -14.2214
Lr1
Latitude Longitude
-5.51522 0.963596
Lr2
Segmen I Segmen II Segmen III Segmen IV Segmen V
𝑳𝒊𝒌𝒆𝒍𝒊𝒉𝒐𝒐𝒅 𝒓𝒂𝒕𝒊𝒐 𝑳𝒂𝒕𝒊𝒕𝒖𝒅𝒆 -7.19455 -6.68233 -2.89311 -3.43326 -12.09781
𝑳𝒊𝒌𝒆𝒍𝒊𝒉𝒐𝒐𝒅 𝒓𝒂𝒕𝒊𝒐 𝑳𝒐𝒏𝒈𝒊𝒕𝒖𝒅𝒆 -14.2214 -1.40585 -3.09099 -3.69179 -28.51825
Class Class-1 Class-1 Class-1 Class-1 Class-1
Anomaly/Non Anomaly Non Anomaly Non Anomaly Non Anomaly Non Anomaly Non Anomaly
Hasil yang diperoleh pada proses yang berlangsung di segmen I s/d segmen V, sbb:
Type equation here.2.94309E-18 8.67637E-20
Prosentasi Anomaly
Menentukan prosentasi berada pada C1 atau C2
𝒂𝒃𝒔
𝑳𝒓_𝑪𝟏 − 𝑳𝒓_𝑪𝟐
𝑳𝒓_𝑪𝟏
𝐱 𝟏𝟎𝟎
𝒂𝒃𝒔
𝑳𝒓_𝑪𝟐 − 𝑳𝒓_𝑪𝟏
𝑳𝒓_𝑪𝟐
𝐱 𝟏𝟎𝟎
𝑃𝑟𝑜𝑠𝑒𝑛𝑡𝑎𝑠𝑖 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑡𝑒𝑠𝑡 C1 =
𝑃𝑟𝑜𝑠𝑒𝑛𝑡𝑎𝑠𝑖 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑡𝑒𝑠𝑡 C2 =
Type equation here.2.94309E-18 8.67637E-20
Next Progress
Progres riset selanjutnya yang diselesaikan adalah:
Mengatasi class pada klasifikasi Likelihood jika terdapat nilai C1 dan C2
memiliki kedekatan(isoformik) (C1 ≈ C2), mengakibatkan mempengaruh
penentuan anomaly. Sehingga dilakukan komputasi untuk menentukan
range toleransi kedekatan/isoformik.
Mengatasi proses real-time deteksi pada data testing, tanpa harus data
terkumpul secara lengkap dalam satu segmen.