SlideShare a Scribd company logo
1 of 14
Download to read offline
Didžiųjų	duomenų	tyryba
naudojant	išskirstytus	
skaičiavimus
ALBERTAS	JURGELEVIČIUS,	PROF.	HABIL.	DR.	LEONIDAS	SAKALAUSKAS
ALBERTAS.JURGELEVICIUS@MII.VU.LT
VILNIAUS	UNIVERSITETO	MATEMATIKOS	IR	INFORMATIKOS	INSTITUTAS
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 1
Turinys
◦ Tyrimų	tikslas
◦ Viešieji	paskirstyti	skaičiavimai
◦ Didžiųjų	duomenų	gavyba	naudojant	BOINC
◦ Privalumai	bei	trūkumai
◦ Išvados
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 2
Tyrimų	tikslas
Apžvelgti	viešųjų	išskirstytų	skaičiavimų	galimybes	didžiųjų	duomenų	
tyrybos uždaviniams	spręsti.	
◦ Nustatyti	tokio	uždavinių	sprendimo	būdo	privalumus bei	trūkumus;
◦ Nustatyti	mokslines	problemas.
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 3
Viešieji	išskirstyti	skaičiavimai
Kompiuterinių	išteklių	donorystė	yra	vienas	iš	būdų	prisidėti	prie	
išskirstų	skaičiavimų.	Tokiu	būdu	projekte	dalyvaujantys	savanoriai	gali	
siūlyti	savo	kompiuterinius	išteklius	skaičiavimams	atlikti.	
Pagrindinis	tokio	išskirstytų	skaičiavimų	modelio	tikslas	yra	apjungti	
kompiuterinius	išteklius	į	atvirą	dinaminį	tinklą.
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 4
BOINC
Berkeley	Open	Infrastructure	for	Network	Computing	(BOINC)	– atviro	
kodo	programinė	įranga,	apjungianti	tinkle	esančius		kompiuterių	
išteklius	skaičiavimams	atlikti.
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 5
Problema
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 6
Viešieji	išskirstyti	skaičiavimai	yra	gerai	žinomas	modelis,	suteikiantis	
organizacijoms	prieigą	prie	kompiuterinių	išteklių	už	mažą	kainą.	Tačiau,	
šis	modelis	turi	trūkumų,	dėl	kurių	verslas	šio	modelio	netaiko.
Tyrimai
◦ Atlikta	literatūros	apžvalga;
◦ Atliktas	28	dienas	trukęs	tyrimas	naudojant	du	atsitiktinai	parinktus	
kompiuterius	dviejose	įstaigose	(A	ir	B).	Kompiuteriuose	buvo	įdiegta	BOINC	
programa,	dvi	savaites	vykdanti	SETI@home projekto	užduotis.	Skaičiavimų	
metu	buvo	matuojami	elektros	energijos	vartojimas,	bei	procesoriaus	
užimtumo	laikas	naudojant	“Performance monitor”	(programa	prieinama	
Microsoft	Windows	sistemoje)	bei	elektroninį	elektros	energijos	vartojimo	
matuoklį.	Po	to	procesas	buvo	pakartotas	nevykdant	BOINC	projektų.	Tyrimo	
metu	abu	kompiuteriai	buvo	naudojami	įstaigų	darbuotojų	darbo	reikmėms.
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 7
Tyrimo	rezultatai
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 8
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
SETI@home Idle
Tyrimo	rezultatai
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 9
Organizacija BOINC	projektas Procesoriaus	laikas	nevykdant	skaičiavimų Elektros	energijos suvartojimas
A - 98,77% 16,61	kWh
A SETI@home 65,23% 22,03	kWh
B - 83,49% 1	kWh
B SETI@home 26,86% 2,09	kWh
Privalumai
◦ Nemokami	kompiuteriniai	ištekliai;
◦ Dalinai	sprendžia	konfidencialių	duomenų	apsaugos	problemą.
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 10
Tyrimai	rodo,	jog	BOINC	kompiuterinių	išteklių	pajėgumas	bei	patikimumas	
prilygsta	Amazon EC2.
[McGilvary,	G.,	Barker,	A.,	Atkinson,	M.:	Ad	hoc	Cloud	Computing:	From	Concept	to	Realization.	IEEE	8th	International	
Conference,	CLOUD.	(2015)]
Trūkumai
◦ Konfidencialių	duomenų	apsaugos	trūkumas
◦ Paslaugos	kokybės	neužtikrintumas
◦ Sistemų	saugumas
◦ Skaičiavimų	kainos	vertinimo	neapibrėžtumas
◦ Skaičiavimų	pajėgumo	neapibrėžtumas
◦ Vykdomųjų	programų	pritaikymas	skirtingoms	platformoms
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 11
Didžiųjų	duomenų	tyryba
naudojant	BOINC
◦ BOINC-MR
◦ distributedDataMining.org
◦ V-BOINC
◦ SCADAMAR
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 12
Išvados
Nustatytos	mokslinės	problemos:
◦ viešųjų	paskirstytų	skaičiavimų	platformos	kaštų	bei	efektyvumo	vertinimas	
didelių	duomenų	tyryboje;
◦ duomenų saugumo	bei	konfidencialumo	užtikrinimo	metodai	viešųjų	
paskirstytš skaičiavimų	platformoje.
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 13
Tolimesni	darbai
Stochastinio	modelio	kūrimas	skaičiavimams	reikiamų	viešųjų	
paskirstytų	skaičiavimų	platformoje	kaštų	vertinimui:
XVIII	MOKSLINĖ	KOMPIUTERININKŲ	KONFERENCIJA 14
Duomenų	saugumo	bei	konfidencialumo	užtikrinimo	metodų	viešųjų	
paskirstytų	skaičiavimų	platformoje	pritaikymas.

More Related Content

More from Lietuvos kompiuterininkų sąjunga

V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...Lietuvos kompiuterininkų sąjunga
 
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Lietuvos kompiuterininkų sąjunga
 
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Lietuvos kompiuterininkų sąjunga
 
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Lietuvos kompiuterininkų sąjunga
 
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizėGražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizėLietuvos kompiuterininkų sąjunga
 
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Lietuvos kompiuterininkų sąjunga
 
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeTomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeLietuvos kompiuterininkų sąjunga
 
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjePaulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjeLietuvos kompiuterininkų sąjunga
 
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...Lietuvos kompiuterininkų sąjunga
 
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...Lietuvos kompiuterininkų sąjunga
 
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...Lietuvos kompiuterininkų sąjunga
 
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitisAndrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitisLietuvos kompiuterininkų sąjunga
 
S. Maskeliūnas Mokslo duomenų archyvas Midas: „imkit mane ir skaitykit“
S. Maskeliūnas Mokslo duomenų archyvas Midas: „imkit mane ir skaitykit“ S. Maskeliūnas Mokslo duomenų archyvas Midas: „imkit mane ir skaitykit“
S. Maskeliūnas Mokslo duomenų archyvas Midas: „imkit mane ir skaitykit“ Lietuvos kompiuterininkų sąjunga
 

More from Lietuvos kompiuterininkų sąjunga (20)

V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
 
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
 
Raimundas Matylevičius. Asmens duomenų valdymas
Raimundas Matylevičius. Asmens duomenų valdymasRaimundas Matylevičius. Asmens duomenų valdymas
Raimundas Matylevičius. Asmens duomenų valdymas
 
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
 
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
 
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotisRima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
 
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizėGražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė
 
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
 
Eugenijus Valavičius. Hiperteksto kelias
Eugenijus Valavičius. Hiperteksto keliasEugenijus Valavičius. Hiperteksto kelias
Eugenijus Valavičius. Hiperteksto kelias
 
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeTomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
 
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjePaulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
 
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklaiOlga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
 
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
 
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
Romualdas Krukauskas. Nesistemiško ir decentralizuoto valstybės informacinių ...
 
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
Eimutis Karciauskas. Programavimo pamokų motyvacijos ir efektyvumo gerinimo m...
 
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitisAndrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
Andrius Plečkaitis. IT specialistų deficitas ir Lietuvos ateitis
 
Alina Dėmenienė. Pagrindiniai skirtumai tarp C++ ir Python
Alina Dėmenienė. Pagrindiniai skirtumai tarp C++ ir PythonAlina Dėmenienė. Pagrindiniai skirtumai tarp C++ ir Python
Alina Dėmenienė. Pagrindiniai skirtumai tarp C++ ir Python
 
LIKS ataskaita 2019-2021 m.
LIKS ataskaita 2019-2021 m.LIKS ataskaita 2019-2021 m.
LIKS ataskaita 2019-2021 m.
 
S. Maskeliūnas Mokslo duomenų archyvas Midas: „imkit mane ir skaitykit“
S. Maskeliūnas Mokslo duomenų archyvas Midas: „imkit mane ir skaitykit“ S. Maskeliūnas Mokslo duomenų archyvas Midas: „imkit mane ir skaitykit“
S. Maskeliūnas Mokslo duomenų archyvas Midas: „imkit mane ir skaitykit“
 
Enciklopedija Lietuvai ir pasauliui
Enciklopedija Lietuvai ir pasauliuiEnciklopedija Lietuvai ir pasauliui
Enciklopedija Lietuvai ir pasauliui
 

Didžiųjų duomenų tyryba naudojant išskirstytus skaičiavimus. Albertas JURGELEVIČIUS, Leonidas SAKALAUSKAS