1. ΠΑΝΔΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ
Negative Databases
Τόιεο Γεκήηξηνο
icsdm09012@icsd.aegean.gr
Τκήκα Πιεξνθνξηαθώλ θαη
Δπηθνηλσληαθώλ Σπζηεκάησλ
Department of Information &
1
Communication Systems Engineering
2. Απεηιέο γηα ηηο βάζεηο
δεδνκέλσλ
Department of Information &
2
Communication Systems Engineering
3. Μέζνδνη γηα ηελ πξνζηαζία ηεο
ηδησηηθόηεηαο
o Σηαηηζηηθέο Βάζεηο Γεδνκέλσλ
− Καηαζηξέθεηαη ε αθεξαηόηεηα ησλ δεδνκέλσλ. (Δηζαγσγή ζνξύβνπ)
− Πξόβιεκα ηνπ ζπκπεξαζκνύ.
− Δπάισηεο ζε επηζέζεηο πνπ ρξεζηκνπνηείηαη έλαο ιτνηλάηης (tracker)
[1,2].
o Κξππηνγξάθεζε
− Η δπλαηόηεηα αλαδήηεζεο αξρείσλ δεδνκέλσλ επηβξαδύλεηαη
ζεκαληηθά.
o Πνιπεπίπεδεο βάζεηο δεδνκέλσλ
− Γεκηνπξγείηε ην πξόβιεκα ηεο πνιπζηηγκηνηππίαο.
o Αρνηηικές Βάζεις Γεδομένων (Negative DataBases-NDB).
Department of Information &
3
Communication Systems Engineering
4. Η βαζηθή ηδέα
Αλζξώπηλν αλνζνπνηεηηθό ζύζηεκα:
o Γηαρσξηζκόο ηδίνπ-μέλνπ.
− Τν αλνζνπνηεηηθό ζύζηεκα ηαμηλνκεί κε κηα θαηεγνξία όια ηα θύηηαξα ηνπ
νξγαληζκνύ ηνπ (ίδηα) θαη ζε κηα δεύηεξε θαηεγνξία όια όζα δελ
αλαγλσξίδεη σο δηθά ηνπ (μέλα).
− Τα θύηηαξα πνπ είλαη ππεύζπλα γηα ηνλ εληνπηζκό παζνγόλσλ νξγαληζκώλ
ζπλδένληαη κόλν κε ηα θύηηαξα πνπ είλαη μέλα, oπόηε θαη πηζαλώο
παζνγόλα.
− Η ηερληθή απηή νλνκάδεηαη αρνηηική επιλογή (negative selection).
Department of Information &
4
Communication Systems Engineering
5. Αξλεηηθή επηινγή 1/3
Ίδια περιοχή
Ίδια Περιοχή
Τν πξόβιεκα πνπ πξέπεη λα επηιπζεί: πξνζδηνξηζκόο αλσκαιίαο.
Department of Information &
5
Communication Systems Engineering
6. Αξλεηηθή επηινγή 2/3
Παξάγνληαη ηπραία πνιύ αληρλεπηέο.
Department of Information &
6
Communication Systems Engineering
7. Αξλεηηθή επηινγή 3/3
Ίδια Περιοχή
Οη αληρλεπηέο πνπ επηθαιύπηνπλ ηελ ίδηα πεξηνρή εμαιείθνληαη.
Department of Information &
7
Communication Systems Engineering
8. Αξλεηηθέο Βάζεηο Γεδνκέλσλ
o Δηζάγνληαη γηα πξώηε θνξά ζηελ δηδαθηνξηθή δηαηξηβή ηνπ Fernando
Esponda [3] θαη ζε κηα ζεηξά από αθαδεκατθά άξζξα [4,5,6].
o Βαζίδνληαη ζηελ αξλεηηθή αλαπαξάζηαζε ησλ δεδνκέλσλ.
Αξλεηηθή αλαπαξάζηαζε
o Οξίδεηαη έλα δηάζηεκα πεπεξαζκέλνπ ζπλόινπ U, νπνπ όιεο νη
εγγξαθέο έρνπλ έλα θαζνξηζκέλν κέγεζνο.
o Οη ζπκβνινζεηξέο νξίδνληαη ζην δπαδηθό αιθάβεην.
o Τν δηάζηεκα ησλ πηζαλώλ ζπκβνινζεηξώλ δηαηξείηαη ζε δπν «μέλα»
κεηαμύ ηνπο ζύλνια.
− ην ζύλνιν ΒΓ - Βάζη Γεδομένων (DB - DataΒase).
− Τν Υ-ΒΓ - Υπερζύνολο Βάζης Γεδομένων (U−DB Universe-DataΒase) .
Department of Information &
8
Communication Systems Engineering
9. Αλαπαξάζηαζε ησλ
Γεδνκέλσλ
o Τν DB αντιπροςωπεφει τα θετικά δεδομζνα (δηλαδή τα αρχικά δεδομζνα
τησ βάςησ).
o To U−DB αντιπροςωπεφει το ςφνολο όλων των ςυμβολοςειρών ςτο οποίο
δεν ανήκουν οι εγγραφζσ που περιζχονται ςτο DB.
Παξάδεηγκα:
DB U - DB
001
000 010
111 011
100
101
110
Department of Information &
9
Communication Systems Engineering
10. Τν ζύκβνιν Don’t Care * 1/2
Οξηζκόο πξνβιήκαηνο
o Έζησ νηη:
– U= Όινη νη πηζαλνί ζπλδπαζκνί κήθνπο νθηώ ραξαθηήξσλ κε βάζε ην
ειιεληθό αιθάβεην.
– DB = {Γεκήηξεο, Νεκεξηήο, Νηθνιέηα}
– U-DB ={ηηηηηηηη, κκκκνννν, Βαγγέιεο, Φαξίιανο, Σεβαζηόο.....}
– Υπάξρνπλ 248-3= 110.075.314.173 εγγξαθέο ζην U-DB.
o Ο αξηζκόο όισλ ησλ πηζαλώλ ζπλδπαζκώλ ζην U-DB είλαη πνιύ
κεγάινο θαη θαζηζηά ηελ βάζε πξνβιεκαηηθή ζηελ δηαρείξηζε ηεο.
Department of Information &
10
Communication Systems Engineering
11. Τν ζύκβνιν Don’t Care * 2/2
Λύζε
o Δηζάγεηαη έλα πξόζζεην ζύκβνιν ζην δπαδηθό αιθάβεην, γλσζηό σο don’t
care θαη γξάθεηαη σο *.
o Τν ζύκβνιν * κπνξεί λα πάξεη ηελ ζέζε είηε ηνπ 0 είηε ηνπ 1 ζηελ ζέζε
ησλ δσαδικών μονάδων (bits) πνπ εκθαλίδεηαη.
o Με απηό ηνλ ηξόπν δεκηνπξγείηαη κηα λέα βάζε δεδνκέλσλ πνπ ζηελ νπζία
είλαη ε ζπκπηεζκέλε κνξθή ηεο U-DB θαη νλνκάδεηε Αξλεηηθή Βάζε
Γεδνκέλσλ (NDB).
o Οη θαηαρσξήζεηο ζηελ NDB ζα είλαη ζπκβνινζεηξέο l-κήθνπο κε βάζε ην
αιθάβεην {0, 1, *}.
Department of Information &
Communication Systems Engineering 11
12. Απνηέιεζκα
o Έρνπλ πινπνηεζεί αιγόξηζκνη (Prefix algorithm, Randomized algorithm)
[4,5] νη νπνίνη δεκηνπξγνύλ κηα NBD κε κέγεζνο πνιπσλπκηθό ζηελ DB.
o Τα δεδνκέλα ζπκπηέδνληαη ρξεζηκνπνηώληαο ην ζύκβνιν don’t care θαη ν
πίλαθαο πνπ πξνθύπηεη εηλαη:
DB U-DB NDB
000 001 01*
101 010 0*1
111 011 1*0
100
110
o Η NDB είλαη έλα NP-hard πξόβιεκα λα αλαζηξαθεί ώζηε λα αλαθηεζνύλ
ηα δεδνκέλα ηεο ζεηηθήο βάζεο.
Department of Information &
12
Communication Systems Engineering
13. Απόδεημε όηη είλαη NP-hard
πξόβιεκα ε αλαζηξνθή ηεο NDB
o Oη αιγόξηζκνη πνπ παξάγνπλ κηα NDB, εθκεηαιιεύνληαη ηε ζρέζε πνπ ππάξρεη
κεηαμύ ηεο ηθαλνπνηεζηκόηεηαο ινγηθώλ πξνηάζεσλ (boolean formula) θαη ηεο
παξαρζείζαο NDB.
o Τν πξόβιεκα εύξεζεο εγγξαθώλ πνπ δελ απεηθνλίδνληαη ζηελ NDB είλαη
ηζνδύλακν κε ηελ εύξεζε ηθαλνπνηήζηκεο πξόηαζεο ζηελ αληίζηνηρε Boolean
θόξκνπια θαη ην νπνίν είλαη έλα γλσζηό NP-hard πξόβιεκα.
Παξάδεηγκα
Boolean Formula NDB
(x2 ή x5 ) και *0**1
(x2 ή x3 ) και *10**
(x2 ή x 4 ή x5 ) και *0*11
(x1 ή x3 ή χ4) και 0*10*
x1 ή χ2 ή x 4 ή χ5 10*10
Department of Information &
13
Communication Systems Engineering
14. Δθαξκνγέο ησλ αξλεηηθώλ
βάζεσλ δεδνκέλσλ
o Δίλαη έλα αλνηρηό αθόκα ζέκα αθνύ ε δηεξεύλεζε ησλ NDB θαη ησλ
ηδηνηήησλ ηνπο είλαη αθόκα ππό εξεπλεηηθή κειέηε.
o Οξηζκέλνη ηνκείο πνπ έρνπλ πξνηαζεί είλαη:
– Αρνηηικές δημοζκοπήζεις (Negative Surveys). [7]
– Σε πεξηπηώζεηο νπνπ δπν ή θαη πεξηζζόηεξεο νληόηεηεο ζέινπλ λα
πξνζδηνξίζνπλ έλα θνηλό ζύλνιν π.ρ ζπλαιιαγέο, ρσξίο όκσο λα
απνθαιπθηεί νιόθιεξν ην πεξηερόκελν ηεο βάζεο ηνπο.
Department of Information &
14
Communication Systems Engineering
15. Πιενλεθηήκαηα
o Η απνθάιπςε κηαο εγγξαθήο από ηελ ζεηηθή βάζε δεδνκέλσλ κπνξεη λα
ζεζεη ζε θίλδπλν νιόθιεξε ηελ βάζε. Αληηζέησο, ε απνθάιπςε κηαο
αξλεηηθήο εγγξαθήο πεξηέρεη ειάρηζηεο πιεξνθνξίεο γηα ηελ βάζε.
o Δληζρύνπλ ηελ ηδησηηθόηεηα επαίζζεηεο πιεξνθνξίαο ρσξίο λα
ρξεζηκνπνηνύλ θξππηνγξάθεζε.
o Οη θάηνρνη δεδνκέλσλ κπνξνύλ λα κνηξαζηνύλ πιεξνθνξίεο ρσξίο ηνλ
θόβν νηη ν παξαιήπηεο ζα κπνξέζεη λα αλαζύξεη ην πιήξεο πεξηερόκελν
ηεο βάζεο.
o Πξνζηαηεύνπλ ηα δεδνκέλα από εζσηεξηθέο επηζέζεηο (insider's attack).
Department of Information &
15
Communication Systems Engineering
16. Αλαθνξέο
[1] Denning, D.E., Denning, P.J., Schwartz, M.D.: The tracker: a threat to
statistical database security. ACM Trans. Database Syst. 4(1), 76–96
(1979)
[2] Denning, D.E., Schlorer, J.: A fast procedure for finding a tracker in a
statistical database. ACM Trans. Database Syst. 5(1), 88–102 (1980)
[3] Esponda, F.: Negative representations of information. Ph.D. thesis,
University of New Mexico (2005)
[4] F. Esponda, S. Forrest, and P. Helman. Enhancing privacy through negative
representations of data. Technical report, University of New Mexico, 2004.
Department of Information &
16
Communication Systems Engineering
17. Αλαθνξέο
[5] Fernando Esponda, Elena S. Ackley, Stephanie Forrest, and Paul Helman.
Online negative databases. In Giuseppe Nicosia, Vincenzo Cutello, Peter J.
Bentley, and Jon Timmis, editors, ICARIS, volume 3239 of Lecture Notes
in Computer Science, pages 175–188. Springer, 2004.
[6] Fernando Esponda, Elena S. Ackley, Paul Helman, Haixia Jia, and
Stephanie Forrest. Protecting data privacy through hard-to-reverse negative
databases. In Sokratis K. Katsikas, Javier Lopez, Michael Backes, Stefanos
Gritzalis, and Bart Preneel, editors, ISC, volume 4176 of Lecture Notes in
Computer Science, pages 72–84. Springer, 2006.
[7] F. Esponda. Negative surveys. ArXiv Mathematics e-prints, Aug 2006.
Department of Information &
17
Communication Systems Engineering