● Повеќето луѓе не управуваат со податоци за забава. Тие имаат
приказна што сакаат да ја раскажат или проблем што сакаат
да го решат.
● Прашањето може да биде од каков било тип, почнувајќи од:
„Колку денови во годината се сончеви во мојот град?“, па
сè до прашања како „Како мојата Влада ги троши парите? И
од каде доаѓаат тие пари?“ и „Како здравствените трошоци
влијаат на животниот век?“
Што може да кажеме за нив?
● Топчиња за голф (се користат за
играње голф - класификација)
● Бела боја
● Искористени се
● Сите тие имаат иста, одредена
големина
● Има одреден број топчиња Имаат
одредена парична вредност...
Видови податоци
● Квалитативни податоци се оние што се
однесуваат на квалитетот на нешто: опис по боја,
текстура, опис на искуства и податоци од интервју
– сите претставуваат квалитативни податоци.
● Квантитативни податоци се оние кои се
изразуваат со број. На пример, бројот на голф-
топчиња, нивната големина, цена итн.
Видови податоци
● Одделни податоци: нумерички податоци кои имаат
празнини во нив. На пример, бројот на топчиња.
Може да има само цел број топчиња (не може да
име 0,3 топчиња). Други примери би биле резултати
на испит или број на чевли.
● Континуирани податоци: нумерички податоци со
контиуниран опсег. Може да бидат избројани,
подредени и измерени. Пример: висина, тежина,
температура, количество на шеќер во портокал...
● Категорички податоци: објектот што го
објаснуваме го ставаат под одредена категорија: во
нашиот пример податокот „искористени“ е
категоричен податок (каде категориите би биле:
нови, искористени, скршени итн.)
● Редни податоци: податоци што може да бидат
рангирани (подредени) или бидат изразени преку
скала. Може да бидат избројани и подредени, но не
може да бидат измерени. Пример: скала од 1 до 5
Видови податоци
Категорија Спорт – Голф Категоричен податок
Боја Бела Квалитативен податок
Состојба Користени Категоричен податок
Дијаметар 43 mm Континуиран податок
Цена (по топче) 30 ден. Квантитативен податок
Квиз: видови податоци
Улога: Тапанар
❏ Континуиран податок
❏ Категоричен податок
❏ Квалитативен податок
Година на раѓање: 1963
❏ Квалитативен
❏ Одделен
❏ Континуиран
❏ Категоричен
Име: Елена Игнатова
❏ Квантитативен
❏ Квалитативен
❏ Одделен податок
Големина: M
❏ Реден податок
❏ Категоричен
❏ Континуиран
Висина: 187cm
❏ Одделен
❏ Категоричен
❏ Континуиран
❏ Квалитативен
Дата: 18 март 2015
❏ Одделен
❏ Категоричен
❏ Континуиран
Име Пол Возраст Висина Чувство
Дона Ж 21 190cm Изненадене
Елена Ж 23 167cm Благодарна
Тин М 25 167cm Заинтересиран
Дарко М 22 163cm Релаксиран
Ана Ж 22 156cm Оптимистична
Борис М 36 200cm Избезумен
Владимир М 35 167cm Возбуден
Бане M 24 180cm Нервозен
Милена Ж 29 160cm Многу
возбудена
Неструктурирани наспроти структурирани податоци
Податоци за луѓе
● „Имаме 5 користени топчиња за голф со дијаметар 43 mm и секое чини 30 ден.“
● Неструктуриран податок. Нема одредена структура – реченицата може лесно да
биде променета и не е јасно секој збор на што се однесува.
● Скениран ПДФ и фотографии - пријатни за око, не за машина
● Најчесто употребувани машински читливи формати: JSON, XML, RDF, CSV (Comma
Separated Files)...
Податоци за компјутери
● Некои задачи се лесни за луѓе, комплицирани за компјутерите.
● Пример: Текст претставен како слика.
● Одредена структура = машински читливи.
Што се отворени податоци?
Отворени податоци се сите информации кои
може да бидат слободно употребувани,
реупотребувани и дистрибуирани од секого,
секаде и за секоја цел.
- OpenDefinition.org
Отворените податоци не се PDF!
● Машински читливи - во формат кој лесно може да биде обработен од
страна на компјутер
● Дигитално ≠ машински читливо
● Машински читливи формати: XML, CSV (comma separated values),
JSON
Буџетите не се единствените владини
податоци кои треба/може да бидат
отворени!
Владините податоци НЕ се единствените
отворени податоци!
Кои податоци може да бидат
отворени?
● Административни: Буџети, трошоци, потрошувачка на енергија...
● Демографски: Приходи, возраст, струка...
● Демократски: Податоци од избори, податоци за средби, членови...
● Просторни: Згради на јавни институции, паркови, велосипедски
патеки, автобуски станици...
● Податоци за квалитет на животна средина: квалитет на вода,
воздух, почва...
● Плански: Искористеност на земја, катастарски податоци, барања...
Отворени владини податоци во Македонија
● www.otvorenipodatoci.gov.mk
● Државен завод за статистика
● World Bank
● Народна Банка на РМ
Discrete data is counted, Continuous data is measured
Discrete Data
Discrete Data can only take certain values.
Example: the number of students in a class (you can't have half a student).
Continuous Data
Continuous Data can take any value (within a range)
Examples:
A person's height: could be any value (within the range of human heights), not just certain fixed heights,
Time in a race: you could even measure it to fractions of a second,
A dog's weight,
The length of a leaf