Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor
1. PENJANAAN FITUR TIGAAN BAGI
IMEJ BERSAIZ BESAR DENGAN
MENGGUNAKAN JELMAAN SURIH
DI KOLAM CONDOR
Nurrunnuhaa All Bakry
GP00339
UKM Bangi
2. Sistem berprestasi tinggi
• Digunakan untuk kajian di institusi pengajian tinggi dan
makmal-makmal kajian. Ia juga sering digunakan di dalam
reka bentuk kejuruteraan
• Contoh aplikasi:
o kajian cuaca
o pengecaman pola
o penyelidikan ketenteraan
o penerokaan minyak dan gas
o simulasi mekanikal
o simulasi kewangan
4. Pengenalan - Sistem Teragih
• Pelbagai usaha untuk memperkenalkan sistem teragih telah
dilakukan oleh banyak pihak, termasuklah SETI@Home
• Komputer super mungkin lebih berkuasa tetapi sebarang
ralat atau kerosakan akan menjejaskan proses yang sedang
dilaksanakan di komputer super
• Sebarang kerosakan di satu mesin tidak akan memberikan
impak yang tinggi kepada proses yang sedang berjalan di
sistem teragih
5. Kebaikan Sistem teragih
Faedah:
• Melaksanakan operasi yang memakan masa yang panjang
dalam masa yang singkat
• Melaksanakan operasi di dalam tempoh yang singkat
dengan kadar yang tinggi
Ini kerana, sistem teragih:
• Mendapatkan kuasanya daripada sumber yang tidak
digunakan daripada mesin yang sedang idle
• Mudah untuk diskala
Satu kajian yang dilakukan oleh Bing Yean (2011) telah
menunjukkan peningkatan kelajuan dengan penggunaan
sistem teragih untuk masalah Mandelbrot
6. Contoh Middleware
Condor
• Memaksimakan penggunaan mesin-mesin yang idle ataupun
tidak aktif
• Universiti Wisconsin-Madison
Legion
• Aplikasi-aplikasi selari yang besar dan kompleks
• University of Virginia
BOINC
• Membolehkan kuasa mesin ketika ia tidak aktif
disumbangkan kepada projek sains
• University of California
7. Jelmaan surih
• Satu kaedah di dalam analisis imej untuk pengecaman pola
• Digunakan untuk pengecaman aksara jawi
o kajian oleh Mohammad Faidzul et al. (2008)
• Kaedah analisis imej lain:
o rangkaian Neural Rekuren Bama oleh Mazani (2002)
o pengkelas multiaras oleh Khairuddin (2000)
• Jelmaan surih akan menghasilkan satu fitur tigaan untuk
sesuatu imej yang dikaji
9. Makmal HPC belum dilengkapi Condor
• Makmal HPC dilengkapi beberapa mesin-mesin masih belum
dilengkapi dengan sistem berprestasi tinggi yang
menggunakan Condor
• Penjanaan fitur tigaan dengan menggunakan jelmaan surih
belum pernah dijalankan di makmal tersebut
10. Jelmaan surih untuk pengecaman
aksara jawi
• Kajian Mohammad Faidzul et al. (2008) menggunakan imej
aksara jawi bersaiz 63.6 KB dengan resolusi 255x255 piksel
o Imej yang bersaiz lebih besar?
o Sekumpulan imej bersaiz lebih besar?
• Surihan dilakukan dengan melawat setiap piksel di setiap
baris piksel di dalam imej dan di setiap 1.8125º sudut
putaran
o Kecilkan sudut putaran?
12. Tujuan Kajian
a) mendapatkan nisbah fitur tigaan bagi imej bersaiz lebih
daripada 100 MB dengan menggunakan sudut putaran 1º
b) menganalisa masa yang diambil untuk melaksanakan dua
jelmaan surih bagi mendapatkan nisbah fitur tigaan bagi satu
imej bersaiz besar di satu mesin dan kolam Condor
c) menganalisa masa yang diambil untuk melaksanakan dua
jelmaan surih (untuk setiap imej) bagi mendapatkan nisbah
fitur tigaan (untuk setiap imej) bagi sekumpulan imej bersaiz
besar di satu mesin dan kolam Condor
14. Skop Kajian
• Aplikasi jelmaan surih dan fungsian yang akan digunakan di
dalam kajian ini adalah sama dengan yang digunakan di
dalam kajian Mohammad Faidzul et al. (2008)
• Penjanaan fitur tigaan untuk 40 imej bersaiz besar -> 40
nisbah fitur tigaan
• Tidak meliputi penjanaan fitur tigaan tak-ubah, keputusan
akan dibandingkan tanpa membincangkan ketepatannya
• 19 mesin digunakan di makmal HPC (kolam heterogen)
untuk kolam Condor
• Kajian memberikan perhatian kepada prestasi masa yang
diambil untuk pelaksanaan jelmaan surih di satu mesin dan
di kolam Condor
16. Condor Sebagai Sistem Teragih
Berfungsi dengan mengenalpasti mesin-mesin yang idle dan
memaksimakan sumber yang idle ini dengan menjadualkan
tugasan-tugasan untuk dilaksanakan di mesin tersebut
17. Kolam Condor
• Setiap mesin mempunyai peranan
• Perlu ada 3 peranan di dalam sesuatu kolam:
o Pengurus Pusat
o Penghantar
o Pelaksana
19. Peranan mesin
Interaksi antara mesin di dalam kolam Condor
Mesin boleh mempunyai lebih daripada 1 peranan
20. Alam Semesta Condor
Untuk menakrifkan persekitaran pelaksanaan sesuatu tugasan
Alam semesta yang digunakan oleh Condor:
• Standard
• Vanilla
• Grid
• Java
• Scheduler
• Local
• Parallel
• VM
24. Penjanaan Fitur Tigaan untuk Aksara
Jawi Menggunakan Jelmaan Surih
Kajian Mohammad Faidzul et al (2008) mendapati jelmaan
surih telah memberikan skor pengecaman yang lebih tinggi
berbanding kaedah momen afin tak-ubah.
Kajian jelmaan surih mereka dilakukan ke atas aksara
terpencil dan meliputi transformasi imej putaran, translasi
dan penskalaan sahaja.
26. Jelmaan Surih
Jelmaan surih berasal daripada perbincangan mengenai
pengecaman oleh Kadyrov et al. (2001) yang telah
menunjukkan bahawa jelmaan surih telah mengatasi prestasi
pengecaman fitur momen afin tak-ubah. Jelmaan surih boleh
digambarkan sebagai pengitlakan jelmaan Radon seperti yang
dibincangkan dalam kajian beliau.
Jelmaan Radon hanya mengira kamiran untuk
fungsian. Fungsian yang digunakan dalam jelmaan surih tidak
semestinya menggunakan kamiran.
27. Jelmaan Surih (smbg)
Jelmaan Radon boleh diterangkan sebagai satu jelmaan surih
yang khusus.
Pertimbangkan apabila satu imej f (x, y) disilang-
menyilangkan dengan garis-garis l(r, θ, t) pada semua arah
dengan L(r, θ) ialah set bagi semua garis. Jelmaan surih adalah
satu fungsi g(T, f, r, θ) yang ditakrif pada L(r, θ) dengan
bantuan fungsian surih T. Maka
g (T, f, r, θ) = T [f (r, θ, t)]
28. Jelmaan Surih (smbg)
Definisi parameter pada imej f (x, y) dan garis surih
l(r, θ, t)
29. Fitur Tigaan
Fitur tigaan yang boleh menggambarkan sifat imej f (x, y)
dapat dijanakan dengan bantuan dua fungsian tambahan yang
dipanggil diametrik (diametric) dan putaran (circus), yang
masing-masing ditandai dengan P dan Ф (Kadyrov & Petrou,
2001) .
Fitur tigaan П ditakrifkan sebagai:
П(f) = Φ[P[T[f(r,θ,t)]]]
30. Fungsian untuk Fitur Tigaan
Fitur tigaan yang diekstrak sangat bergantung kepada sifat
fungsian yang telah dipilih, iaitu T (fungsian surih), P
(fungsian diametrik) dan Ф (fungsian putaran).
Kajian Mohammad Faidzul et al. (2008) telah mengemukakan
cadangan fungsian yang telah dipilih untuk menjana fitur
tigaan tak-ubah kepada putaran, translasi, dan penskalaan.
35. Kaedah
Kajian menggunakan aplikasi yang digunakan di dalam kajian
Mohammad Faidzul et al. (2008).
Kajian melihat hasil penjanaan fitur tigaan menggunakan
sudut putaran 1º.
Penjanaan fitur tigaan akan dilakukan ke atas satu mesin dan
juga kolam Condor.
• Satu imej sebagai permulaan
• Bilangan imej ditambah kepada 10, 20, 30 dan 40
36. Aplikasi Penjanaan Fitur Tigaan
Paparan output untuk aplikasi diubahsuai untuk mengandungi
keputusan fitur tigaan
Penggunaan alam semesta Vanilla tidak memberikan
kemudahan Remote System Call (mesin Pelaksana tidak
mempunyai kemudahan untuk membaca dan menulis struktur
direktori sama seperti mesin Penghantar).
37. Senibina Kolam Condor
Terdiri daripada
mesin-mesin di
makmal HPC dan
makmal
pembangunan web
41. Skrip Bash
Ditulis untuk memudahkan penghantaran tugasan ke kolam
Condor.
Skrip Bash (tt-submit-multiple-jobs) akan menulis satu fail
penghantar Condor berdasarkan pilihan set Π dan seterusnya
akan di hantar ke kolam Condor.
42. Fail Penghantar
Fail penghantar bagi set Π = 4 untuk dua imej
43. Pemerhatian Masa Pelaksanaan
Masa direkodkan di:
• satu mesin
• kolam Condor
Masa (purata) diambil daripada ketika arahan dihantar
sehingga dua fitur tigaan diperolehi daripada dua fungsian
yang menghasilkan sesuatu set Π.
46. n = 128 (sudut = 1.8125º) dan n = 360
(sudut = 1º)
Nilai fitur tigaan adalah sama seperti yang diperolehi di
dalam kajian Mohammad Faidzul et al. (2008). Ini
bermaksud kolam Condor boleh digunakan untuk penjanaan
fitur tigaan.
47. n = 360 (sudut = 1º)
Ini bermakna apabila nilai n = 360 digunakan ke atas aksara jawi
Shin, aplikasi mampu mengenalpasti tiga imej tambahan sebagai imej
yang sama.
48. Pemerhatian Masa
Masa yang diambil untuk penjanaan fitur tigaan di kolam
Condor melonjak hampir satu kali ganda berbanding
penjanaaan yang sama di satu mesin.
49. Pemerhatian Masa (smbg)
Ini disebabkan oleh komunikasi di antara mesin-mesin di
dalam rangkaian kolam Condor dan juga proses pemindahan
fail input dan output yang mempengaruhi keseluruhan masa
penjanaan.
Penjanaan fitur tigaan di satu mesin tidak mengambil masa
yang lama. Ini adalah kerana saiz imej yang kecil. Oleh yang
demikian, penjanaan fitur tigaan di kolam Condor untuk imej
yang bersaiz kecil adalah tidak sesuai.
51. n = 360
Fitur tigaan bagi 40 imej bersaiz besar telah di perolehi di
dalam kajian ini.
Hanya set Π2, Π3 dan Π 4 yang mempunyai perbezaan kurang
daripada 10%. Oleh itu, fitur tigaan tak-ubah hanya untuk tiga
set tersebut.
57. Perbandingan Masa
Kolam Condor: Satu mesin:
10 imej - 43 minit 10 imej - 8.7 jam
20 imej - 1 jam 20 imej - 17.2 jam
30 imej - 1 jam 30 imej - 25.9 jam
40 imej - 1.3 jam 40 imej - 34.7 jam
Berbanding dengan keputusan di satu mesin, purata masa
yang diambil kolam Condor masih lebih rendah.
58. Penjimatan Masa
Meningkat daripada 10 imej ke 20 imej. Ia meningkat sedikit
ke 30 imej dan tidak begitu banyak beza daripada 30 ke 40
imej.
59. Kelajuan Kolam Condor (speedup)
Penjimatan masa adalah paling tinggi untuk 40 imej.
Kelajuan yang ideal adalah apabila S38 = 38. Tahap ideal boleh
dicapai dengan menambah bilangan pemproses.
60. Kecekapan Kolam Condor (efficiency)
Sejauh mana pemproses digunakan sepenuhnya untuk
melaksanakan penjanaan dua fitur tigaan bagi setiap
imej. Kecekapan untuk 1 imej adalah yang paling rendah
manakala kecekapan untuk 30 dan 40 imej adalah hampir
sama iaitu kedua-duanya berada di dalam linkungan 60%
hingga 76%.
62. Penemuan & Sumbangan Kajian
Kajian telah menunjukkan nisbah fitur tigaan untuk imej yang
bersaiz lebih daripada 100 MB dengan menggunakan sudut
putaran 1° boleh diperolehi dengan menggunakan kolam
Condor.
Masa yang diambil untuk mendapatkan dua fitur tigaan bagi
sesuatu imej bersaiz besar dengan menggunakan jelmaan
surih di kolam Condor adalah lebih pantas daripada di satu
mesin. Ia menunjukkan penjimatan masa di dalam lingkungan
32.68% sehingga 47.03%.
63. Penemuan & Sumbangan Kajian (smbg)
Untuk sekumpulan imej pula, kajian mendapati peratusan
masa yang dapat dijimatkan adalah lebih tinggi iaitu di dalam
lingkungan 89.35% sehingga 96.52%.
Kelajuan paling tinggi dicapai untuk penjanaan dua fitur
tigaan bagi 40 imej.
64. Penutup
Kajian ini telah mengetengahkan Condor sebagai satu pilihan
yang sesuai untuk sistem teragih. Diharapkan dengan kajian
ini membuka mata dan menggalakkan lagi penggunaan Condor
sama ada di dalam bidang penyelidikan mahupun
implementasi pada masa akan datang.