1. JPEG (wym. dżej-peg lub jot-peg) – standard kompresji statycznych obrazów rastrowych,
przeznaczony głównie do przetwarzania obrazów naturalnych (zdjęć satelitarnych, pejzaży,
portretów itp.), charakteryzujących się płynnymi przejściami barw oraz brakiem lub małą
ilością ostrych krawędzi i drobnych detali.
Algorytm kompresji używany przez JPEG jest algorytmem stratnym, tzn. w czasie jego
wykonywania tracona jest bezpowrotnie część pierwotnej informacji.
Algorytm przebiega następująco:
• obraz jest konwertowany z kanałów czerwony-zielony-niebieski (RGB) na jasność
(luminancję) i 2 kanały barwy (chrominancje). Ludzie znacznie dokładniej postrzegają
drobne różnice jasności od drobnych różnic barwy, a więc użyteczne jest tutaj użycie
różnych parametrów kompresji. Krok nie jest obowiązkowy (opcjonalnie można go
pominąć).
wstępnie odrzucana jest część pikseli kanałów barwy, ponieważ ludzkie oko ma
•
znacznie niższą rozdzielczość barwy niż rozdzielczość jasności. Można nie redukować
wcale, redukować 2 do 1 lub 4 do 1.
kanały są dzielone na bloki 8x8. W przypadku kanałów kolorów, jest to 8x8 aktualnych
•
danych, a więc zwykle 16x8.
na blokach wykonywana jest dyskretna transformata kosinusowa (DCT). Zamiast
•
wartości pikseli mamy teraz średnią wartość wewnątrz bloku oraz częstotliwości zmian
wewnątrz bloku, obie wyrażone przez liczby zmiennoprzecinkowe. Transformata DCT
jest odwracalna, więc na razie nie tracimy żadnych danych.
Zastąpienie średnich wartości bloków przez różnice wobec wartości poprzedniej.
•
Poprawia to w pewnym stopniu współczynnik kompresji.
Kwantyzacja, czyli zastąpienie danych zmiennoprzecinkowych przez liczby całkowite.
•
To właśnie tutaj występują straty danych. Zależnie od parametrów kompresora, odrzuca
się mniej lub więcej danych. Zasadniczo większa dokładność jest stosowana do danych
dotyczących niskich częstotliwości niż wysokich.
współczynniki DCT są uporządkowywane zygzakowato, aby zera leżały obok siebie.
•
współczynniki niezerowe są kompresowane algorytmem Huffmana. Są specjalne kody
•
dla ciągów zer.
Użyta transformata powoduje efekty blokowe w przypadku mocno skompresowanych
obrazków.
Wielką innowacją algorytmu JPEG była możliwość kontroli stopnia kompresji w jej trakcie, co
umożliwia dobranie jego stopnia do danego obrazka, tak aby uzyskać jak najmniejszy plik, ale
o zadowalającej jakości.
Model HSV nawiązuje do sposobu, w jakim widzi ludzki narząd wzroku, gdzie wszystkie
barwy postrzegane są jako światło pochodzące z oświetlenia. Według tego modelu wszelkie
barwy wywodzą się ze światła białego, gdzie część widma zostaje wchłonięta a część odbita od
oświetlanych przedmiotów.
Symbole w nazwie modelu to pierwsze litery nazw angielskich dla składowych opisu barwy: H
– barwa światła (ang. Hue) wyrażona kątem na kole barw przyjmująca wartości od 0° do 360°.
Model jest rozpatrywany jako stożek, którego podstawą jest koło barw.
2. Wymiary stożka opisuje składowa S – nasycenie koloru (ang. Saturation) jako promień
podstawy oraz składowa V – (ang. Value) równoważna nazwie B – moc światła białego (ang.
Brightness) jako wysokość stożka.
Przyporządkowanie częstotliwości fal świetlnych na kole barw w modelu HSV jest takie samo
jak w modelach HSL, tzn. centrum barwy czerwonej odpowiada kąt 0° lub 360°. Centrum
barwy zielonej odpowiada kąt 120°. Centrum barwy niebieskiej odpowiada kąt 240°. Pozostałe
barwy pośrednie dla składowej Hue są odpowiednio rozłożone pomiędzy kolorami czerwonym,
zielonym i niebieskim.
CMYK – zestaw czterech podstawowych kolorów farb drukarskich stosowanych
powszechnie w druku kolorowym w poligrafii i metodach pokrewnych (atramenty, tonery i inne
materiały barwiące w drukarkach komputerowych, kserokopiarkach itp.). Na zestaw tych
kolorów mówi się również barwy procesowe lub kolory triadowe (kolor i barwa w jęz.
polskim to synonimy). CMYK to jednocześnie jedna z przestrzeni barw w pracy z grafiką
komputerową.
C cyjan (ang. Cyan)
Skrót CMYK powstał jako złożenie pierwszych liter
M magenta (ang. Magenta)
angielskich nazw kolorów prócz koloru czarnego, z którego
wzięto literę ostatnią, ponieważ litera B jest skrótem jednego z Y żółty (ang. Yellow)
podstawowych kolorów w analogicznym skrócie RGB. (Inne, K czarny (ang. blacK)
mniej popularne rozwinięcia skrótu K to Key color, Karbon lub
Kontur.)
Cyjan – odcień niebieskiego, ale trochę bledszy i bardziej spłowiały, można go określić
•
jako szarobłękitny lub sinoniebieski. Najbardziej podobne kolory to błękit, szafir i
turkus. Nazywanie koloru cyjanowego kolorem quot;zielononiebieskimquot; jest błędem
wynikającym z niezrozumienia różnic pomiędzy addytywną i subtraktywną metodą
mieszania barw. W syntezie addytywnej kolor uzyskany w wyniku połączenia zielonego
i niebieskiego.
Magenta – W syntezie addytywnej kolor uzyskany w wyniku połączenia czerwieni i
•
niebieskiego. Najbardziej podobne kolory to purpura, karmazyn i amarant.
3. Yellow – kolor bardzo podobny do żółtego, jednak trochę bledszy od typowej nasyconej
•
żółcieni. W syntezie addytywnej kolor uzyskany w wyniku połączenia czerwieni i
zielonego.
Black – kolor czarny, jednak o niezbyt głębokiej czerni.
•
RGB – jeden z modeli przestrzeni barw, opisywanej współrzędnymi RGB. Jego nazwa
powstała ze złożenia pierwszych liter angielskich nazw barw: R – red (czerwonej), G – green
(zielonej) i B – blue (niebieskiej), z których model ten się składa. Jest to model wynikający z
właściwości odbiorczych ludzkiego oka, w którym wrażenie widzenia dowolnej barwy można
wywołać przez zmieszanie w ustalonych proporcjach trzech wiązek światła o barwie czerwonej,
zielonej i niebieskiej
Barwę czarną reprezentuje punkt, w którym intensywność wszystkich składowych wynosi 0, a
więc (0, 0, 0). Gdy zmieszamy wszystkie barwy składowe w maksymalnych ilościach, wówczas
otrzymamy barwę białą, taki punkt to (1, 1, 1). Wszystkie pośrednie barwy, w których
wszystkie składowe mają tą samą intensywność to szarości. Można zauważyć że jeżeli k1 < k1
to wówczas kolor szary zdefiniowany jako (k1, k1, k1) będzie ciemniejszy niż szarość
zdefiniowana jako (k2, k2, k2).
Skala Decybelowa
a) O ile dB wzrośnie wartość układu jeżeli jego moc zwiększymy 20 krotnie??
20 p p p
= 10 log(20 * ) = 10 log 20 + 10 log
10 log
p0 p0 p0
Więc wartość układu wzrośnie o
4. 10log20 =10log(2*10)=10log2+10log10=10*0,3+10*1=3+10=13dB
b) Wartość układu zmniejszyła się 4-krotnie. o ile zmniejszyła się ta moc w dB?
p p p
= 10 log(1 / 4 * ) = 10 log 1 / 4 + 10 log
10 log
4 p0 p0 p0
10log1/4=10*(-0,6)= -6dB
Drzewo czwórkowe
1 2
4 3
Biały kwadrat = 0
Czarny kwadrat = 1
Szary kwadrat = rozpisujemy ( )
Lista dla tego drzewa : (0,(0,0,(1,0,0,0),1),(1,0,(0,0,1,0),0),1)
Fraktal (łac. fractus – złamany, cząstkowy) w znaczeniu potocznym oznacza zwykle obiekt
samo-podobny (tzn. taki, którego części są podobne do całości) albo quot;nieskończenie subtelnyquot;
(ukazujący subtelne detale nawet w wielokrotnym powiększeniu). Ze względu na olbrzymią
różnorodność przykładów matematycy obecnie unikają podawania ścisłej definicji i proponują
określać fraktal jako zbiór, który:
ma nietrywialną strukturę w każdej skali,
•
struktura ta nie daje się łatwo opisać w języku tradycyjnej geometrii euklidesowej,
•
jest samo-podobny, jeśli nie w sensie dokładnym, to przybliżonym lub stochastycznym,
•
jego wymiar Hausdorffa jest większy niż jego wymiar topologiczny,
•
ma względnie prostą definicję rekurencyjną,
•
ma naturalny (quot;poszarpanyquot;, quot;kłębiastyquot; itp.) wygląd.
•
Fraktale w matematyce
5. • Zbiór Mandelbrota
• Kostka Mengera (IFS)
• Atraktor IFS
• Paproć Barnsleya (Atraktor IFS)
• Zbiór Julii
Fraktale w grafice komputerowej.
Kompresja fraktalna.
Przykłady Fraktali:
Dywan Sierpińskiego to fraktal otrzymany z kwadratu za pomocą podzielenia go na dziewięć
(3x3) mniejszych kwadratów, usunięcia środkowego kwadratu i ponownego rekurencyjnego
zastosowania tej samej procedury do każdego z pozostałych ośmiu kwadratów.
Krzywa Kocha to krzywa matematyczna, którą można zdefiniować jako pewien atraktor IFS
lub jako granicę ciągu krzywych opisanych poniżej. Krzywa ta jest nieskończenie długa, mieści
się jednak na skończonej powierzchni. Można więc narysować pewne jej przybliżenie.
Połączenie trzech krzywych przypomina płatek śniegu i nazywany jest płatkiem Kocha (na
rysunku z prawej). Etapy powstawania:
6. Trójkąt Sierpińskiego (znany też jako uszczelka Sierpińskiego) jest jednym z najprostszych
fraktali, znanym na długo przed powstaniem tego pojęcia (patrz Benoit Mandelbrot).
Konstrukcja tego zbioru była podana przez polskiego matematyka Wacława Sierpińskiego w
1915.Trójkat Sierpińskiego otrzymuje się następująco: w trójkącie równobocznym łączy się
środki boków, dzieląc go w ten sposób na cztery mniejsze trójkąty. Trójkąt środkowy usuwa
się, a wobec trzech pozostałych trójkątów operację się powtarza, dzieląc każdy z nich na cztery
mniejsze trójkąty, usuwając środkowy, a wobec pozostałych czynności się powtarzają. Punkty
pozostające po nieskończenie wielu powtórzeniach tej operacji tworzą trójkąt Sierpińskiego.
Postscript
x y moveto – ustawienie pisaka w punkcie x,y
x y rlineto - przesuń pisak na pozycję x,y
k setlinewidth – ustawienie grubości linni na wartość k
R G B setrgbcolor – ustawienie koloru RGB, R-czerwony, G-zielony, B-niebieski
Closepath – zamknij przestrzen, figurę
fill –wypełnij, zamaluj
stroke –wykonaj
showpage – pokaż na koniec co narysowano
/Times-Bold findfont - znajduje wskazaną czcionkę i czyni bieżącym
72 scalefont setfont - skalowanie czcionki do 72p
(NAPIS) true charpath - deklaracja napisu jako ciągu znaków
x y (NAPIS) ashow – przesunięcie liter napisu o x y
0.9 setgray - wprowadzenie nowego koloru, odcień szarości (1-biały, 0-czarny)
x y scale – skaluj po x, y
grestore – zamyka obiekt lokalny i przywraca wcześniejsze ustawienia
grave – otwiera obiekt lokalny (procedura)
Z rotate – obrót o Z stopni
x y translate – przesunięcie początku układu współrzędnych
x0, y0, R , Y0, YK arc – rysowanie łuku x0,y0- początek, R – promień, Y0- kąt początkowy
YK- kąt końcowy
newpath – inicjowanie nowej ścieżki
x1,y1,x2,y2 arcto – rysuje łuk styczny do dwóch linii
7. x1,y1,x2,y2,xk,yk curveto – rysowanie krzywej x1,y1,x2,y2 –punkty pomocnicze ,xk,yk –
punky końcowy
HSL - to jeden z modeli opisowych dla kolorów postrzeganych przez ludzi. Ten sposób
opisowy miał polegać na tym, że każdej barwie postrzeganej przez człowieka jest
przyporządkowany jeden punkt w przestrzeni trójwymiarowej identyfikowany przez trzy
składowe: (h,s,l). Model pojawił się w okresie startu telewizji - pierwsze demonstracje w latach
1926-1930.
Znaczenie i zakresy współrzędnych:
H: Hue - (z ang. odcień, barwa), o wartościach z przedziału: od 0 do 360 stopni.
S: Saturation - nasycenie koloru. z przedziału 0...1 albo 0...100%.
L: Lightness - średnie światło białe, z przedziału 0...1 albo 0...100%.
Ten model zakładał, że barwy postrzegane przez człowieka dadzą się opisać właśnie za pomocą
takich trzech współrzędnych oraz dodatkowo z warunkiem, że punkty znajdują się na
powierzchni bryły obustronnego stożka. Przy czym bryła takiego stożka to forma dynamiczna,
wyznaczona przez aktualny stan współrzędnych l oraz s, natomiast wysokość stożka ma
związek ze światłem białym - tzw. światłem Brightness. Światło Brightness to najmniejsze
światło białe z którego pochodzi rozpatrywana barwa (h,s,l). W ten sposób dana trójka (h,s,l)
determinuje inną bryłę obustronnego stożka. Natomiast bryła stożka wprowadza wzajemne
zależności dla współrzędnych. Współrzędne nie są w pełni ortogonalne.
Model HSL nie potrafi opisać wszelkich barw widzialnych przez człowieka. Zakłada on
mianowicie, że każdą barwę da się określić za pomocą jednego reprezentanta - jednej fali
światła, opisuje to współrzędna Hue. Oko człowieka potrafi odróżniać mieszanki zawierające
wiele różnych fal światła. Są takie mieszanki, dla których rzeczywiście istnieją pojedyncze fale
światła dające takie samo wrażenie jak dana mieszanka fal - zjawisko metameryzmu. Ale
istnieją też takie mieszanki, dla których nie ma pojedynczej fali światła, która mogłaby być
reprezentantem dającym takie samo wrażenie jak dana mieszanka. Na przykład taką mieszanką
jest mieszanka niebieskiego i czerwonego nazywana purpurą. I nie ma pojedynczej fali światła,
która by wywoływała wrażenie purpury.
Model HSL ma znaczenie historyczne i bywa nazywany modelem kolorów dla artystów.
Grafika wektorowa (obiektowa) – jeden z dwóch podstawowych rodzajów grafiki
komputerowej, w której obraz opisany jest za pomocą figur geometrycznych (w przypadku
grafiki dwuwymiarowej) lub brył geometrycznych (w przypadku grafiki trójwymiarowej),
umiejscowionych w matematycznie zdefiniowanym układzie współrzędnych, odpowiednio
dwu- lub trójwymiarowym. Oprócz grafiki wektorowej jest jeszcze grafika rastrowa, która nie
jest aż tak bardzo zaawansowana.
Druga nazwa grafiki wektorowej – grafika obiektowa – związana jest z faktem, iż obraz
opisany jest za pomocą tzw. obiektów, które zbudowane są z podstawowych elementów
nazywanych prymitywami, czyli prostych figur geometrycznych takich jak odcinki, krzywe,
okręgi, wielokąty. Każdy z prymitywów opisywany jest za pomocą parametrów np. w
przypadku odcinka - współrzędnych jego końców, a w przypadku okręgu - współrzędnych
środka i długości promienia. Obiekty takie mają także określone atrybuty mówiące np. o
grubości i kolorze linii, kolorze wypełnienia figury lub wypełnieniu niejednolitym jak
8. wypełnienie gradientem albo wzorem, stopniu przezroczystości. Atrybuty zależą głównie od
stosowanego standardu opisu grafiki wektorowej.
W przeciwieństwie do grafiki rastrowej grafika wektorowa jest grafiką w pełni skalowalną, co
oznacza, iż obrazy wektorowe można nieograniczenie powiększać oraz zmieniać ich proporcje
bez uszczerbku na jakości. Ma to swoje uzasadnienie w matematycznym opisie elementów
(prymitywów), dlatego też obraz może być wyświetlony w maksymalnie dostępnej dla ekranu
czy wydruku rozdzielczości. Sama jakość obrazu uzależniona jest wyłącznie od dokładności
opisu obrazu przez prymitywy: czarne włosy rysowanej postaci można określić jako zamkniętą
krzywą wypełnioną na czarno, choć można też opisać każdy włos krzywą o względnie
niewielkiej grubości i czarnym kolorze.
W przypadku grafiki rastrowej obrót obrazu może zniekształcić go powodując utratę jakości (w
szczególności, jeśli nie jest to obrót o wielokrotność kąta prostego). Typowe edytory grafiki
wektorowej pozwalają oprócz zmiany parametrów i atrybutów prymitywów także na
przekształcenia na obiektach, np.: obrót, przesunięcie, odbicie lustrzane, rozciąganie,
pochylanie, czy zmiana kolejności obiektów na osi głębokości. Jest to więc kolejny stopień
opisu obrazu ideowego, nie zaś literalnego.
Obrazy wektorowe można łatwo przetwarzać w ich odpowiedniki bitmapowe podając jedynie
docelową rozdzielczość obrazu rastrowego. W rzeczywistości operacja ta jest wykonywana
przed jakimkolwiek obrazowaniem grafiki wektorowej na monitorze, czy drukarce. Istnieją
jednakże urządzenia takie jak plotery, np. ploter tnący, dla których opis wektorowy jest
naturalnym sposobem działania.
Operacja konwersji w przeciwną stronę, tzw. wektoryzacja lub trasowanie, jest trudna i
niejednokrotnie nie daje spodziewanych wyników. Głównym problemem jest tzw.
wyszukiwanie krawędzi, które często nie jest oczywiste. Podczas rozwiązywania tego
zagadnienia stosuje się często techniki z dziedziny sztucznej inteligencji, najczęściej bada się
zmiany parametrów takich jak kontrast, barwa, czy nasycenie.
Grafika rastrowa - reprezentacja obrazu za pomocą pionowo-poziomej siatki odpowiednio
kolorowanych pikseli na monitorze komputera, drukarce lub innym urządzeniu wyjściowym
Bez zastosowania kompresji kolor każdego piksela jest definiowany osobno. Obrazki z głębią
kolorów RGB często składają się z kolorowych pikseli zdefiniowanych przez trzy bajty – jeden
bajt na kolor czerwony, jeden na zielony i jeden na kolor niebieski. Mniej kolorowe obrazki
potrzebują mniej informacji na piksel, np. obrazek w kolorach czarnym i białym wymaga tylko
jednego bitu na każdy piksel. Grafika rastrowa różni się od wektorowej tym, że grafika
wektorowa pokazuje obraz używając obiektów geometrycznych takich, jak krzywe, czy
wielokąty.
Bitmapę charakteryzują następujące podstawowe właściwości:
wysokość i szerokość bitmapy liczona jako liczba pikseli
•
liczba bitów na piksel opisująca liczbę możliwych do uzyskania kolorów
•
Kolorowa grafika rastrowa zwykle zawiera piksele z jednym do ośmiu bitów dla każdego z
kolorów bazowych.
9. Jakość obrazu a wielkość pliku
Jakość obrazka rastrowego jest określana przez całkowitą liczbę pikseli (wielkość obrazu) oraz
ilości informacji przechowywanych w każdym pikselu (głębia koloru). Na przykład obrazek
zapisujący 24 bity informacji o kolorze (standard dla większości wyświetlaczy w 2004 roku)
może pokazać łagodniejsze cieniowanie od obrazka zapisującego jedynie 15 bitów informacji
na jeden piksel, ale też nie pokaże łagodniejszego obrazka od zapisującego 48 bitów na piksel.
Podobnie, obrazek o wymiarach 640 x 480 pikseli (zawierający ok. 307 tys. pikseli) będzie
wyglądał nierówno i chropowato w porównaniu do obrazka o wymiarach 1280 x 1024 (ponad
1,3 mln pikseli).Ponieważ taka ilość danych zajmuje ogromną powierzchnię, często stosuje się
technikę kompresji danych celem zmniejszenia wielkości zajmowanego miejsca.
GIF (ang. Graphics Interchange Format) – format pliku graficznego z kompresją bezstratną
(opis niżej) stworzony w 1987 r. przez firmę CompuServe. Pliki tego typu są powszechnie
używane na stronach WWW, gdyż pozwalają na tworzenie animacji dwustanową
przezroczystością. Jest wiele nieporozumień związanych z techniką zapisu obrazu w formacie
GIF. Z założenia jest to zapis danych tzw. bezstratny z czystego ujęcia algorytmicznego, czyli
wszystkie piksele są wiernie zakodowane w pliku (ich umiejscowienie oraz kolor).
Jednak format GIF potrafi zapisać jedynie piksel z dostępnej palety 256 kolorów w bloku
obrazu. Z racji tego, że większość obecnie przetwarzanych obrazów posiada paletę 24-bitową
(ok. 16,7 milionów kolorów) a większość programów do obróbki obrazu potrafi zakodować w
tym formacie jedynie jeden blok, przed zapisaniem obrazu GIF następuje szereg procesów
stratnych:
wyznaczenie 256 kolorów (lub mniej), które jak najwierniej oddają oryginalny zestaw
•
kolorów obecnych w obrazie; jest tzw. kwantyzacja kolorów
zapis tych kolorów do palety (może być również stratny)
•
opcjonalnie: dithering
•