1. SPSS‐Praxisleitfaden
Exemplarische Fragestellungen und mögliche Lösungsmethoden
Dieser Leitfaden orientiert sich an den Kursinhalten der SPSS‐Einführung, erhebt jedoch keinen Anspruch
auf Vollständigkeit und stellt keine Zusammenfassung dar. Die Bedienung von SPSS, wie bspw. das
Bearbeiten der Grafiken, der Tabellen und die theoretischen Grundlagen sind nicht Bestandteil dieses
Dokuments.
Aufgehend von praxisnahen Fragestellungen, die in dieser Form auch in der Hausarbeit zu lösen sein
könnten, wird ein exemplarischer Lösungsweg in SPSS beschrieben. Es wird angenommen, dass die
Datenquelle in einer Form vorliegt, welche die direkte Verarbeitung möglich macht. In der Praxis sind jedoch
häufig vorherige Analysen, bspw. auf Ausreißer, oder Umkodierungen, das Gewichten von Fällen, etc.
notwendig. Dies muss bei der Anwendung beachtet werden.
Inhalt
1 Eine kategoriale Variable .............................................................................................................................
2
1.1 Kommen alle Kategorien gleich häufig vor? ........................................................................................
2
1.1.1 Numerische Beschreibung ...........................................................................................................
2
1.1.2 Grafische Beschreibung ...............................................................................................................
2
1.1.3 Statistische Analyse .....................................................................................................................
4
1.2 Entsprechen Häufigkeiten bestimmten Vorgaben? ............................................................................
5
1.2.1 Numerische und grafische Beschreibung ....................................................................................
5
1.2.2 Statistische Analyse .....................................................................................................................
5
2 Mehrere kategoriale Variablen ...................................................................................................................
6
2.1 Datenbeschreibung .............................................................................................................................
6
2.1.1 Numerische Beschreibung ...........................................................................................................
6
2.1.2 Grafische Beschreibung ...............................................................................................................
7
2.2 Sind zwei kategoriale Variablen unabhängig? .....................................................................................
9
2.2.1 Datenbeschreibung .....................................................................................................................
9
2.2.2 Unabhängigkeitstest ....................................................................................................................
9
3 Eine metrische Variable ............................................................................................................................. 0
1
3.1 Wie kann man die Verteilung einer metrischen Variablen beschreiben? ........................................ 0
. 1
3.1.1 Klassifizieren, Tabellen und Histogramme ................................................................................ 0
1
3.1.2 Maßzahlen zur Beschreibung der Verteilung ............................................................................ 2
1
3.1.3 Boxplott ..................................................................................................................................... 3
1
4 Mehrere metrische Variablen ................................................................................................................... 3
1
4.1 Wie stark ist der Zusammenhang zwischen zwei metrischen Variablen? ........................................ 3
. 1
Einführung in SPSS / SS 2010 – HAW Hamburg – René Reineke 1
2. 4.1.1 Grafisc
che Beschrei
ibung ...........
........................................
............................................................. 3
1
2
4.1.2 Korrelationskoeffiz
zient nach Pe
earson und S
Spearman ....
............................................................. 4
1
1 Ein
ne katego
oriale Var
riable
Dieses Ka
apitel beschr
ränkt sich auf Fragestellu
ungen in Zusa
ammenhang
g mit einer eiinzelnen kate
egorialen
Variable.
1.1 Ko
ommen al
lle Katego
orien glei
ich häufig
g vor?
1.1.1 N Numerische e Beschreib bung
Analysier
ren ‐> Deskri
iptive Statisti
iken ‐> Häufi
figkeiten … ‐>
> markieren d
der auszuwe
ertenden Var
riable (siehe
Abb.)‐> H
Häkchen bei HHäufigkeitstaabellen setzeen ‐> OK.
A
Abbildung 1: Di
ie auszuwerten
nde Variable wiird per Doppelklick oder Klick
ken+Ziehen in d
die rechte Spalt
te gelegt
In der Au
usgabe sind in den ersten
n beiden Spa lten die (abs
soluten) Häufigkeiten und
d Prozentwe
erte enthalte
en.
1.1.2 GGrafische Beschreibunng
Balkendiagramm Diagramme e ‐> Diagram
mmerstellung
g ‐> Galerie (B
Balken) ‐> Do
oppelklick au
uf einfaches
Balkendiagramm ‐> unt tersuchende Variable in X
X‐Achse zieh en ‐> OK.
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 2
3. Abbildu
ung 2: Zu unter
rsuchende Varia
able wird per K
Klicken+Ziehen auf die X‐Achs
se gezogen
Anschließend öffnet sic
ch das Ausgabefenster vo
on SPSS und man erhält d
das
Balkendiagramm, welch hes anschließ
ßend ggf. we
eiterbearbeit
tet werden k
kann.
Abbildung 3: Häufi gkeitsverteilun
ng einer katego
orialen Variable
e als Balkendiagramm
gramm
Kreisdiag Eine alterna
ative Form sttellt das Kreisdiagramm dar. Die Kateegorien sind hierbei die
Kreissegme ente, deren F
Fläche propo ortional die H
Häufigkeitsve
erteilung der
r einzelnen
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 3
4. Merkmale d darstellt.
Diagramme e ‐> Diagram mmerstellung
g ‐> Galerie (K
Kreis/Polar) ‐> Doppelklick auf
Kreisdiagra
amm ‐> unter rsuchende V
Variable in Au
ufteilen nach
h ziehen ‐> OK K.
Abbildung 4: U
Unbearbeitetes Kreisdiagram
mm
Nachteilig ist, dass sich die tatsächlichen Häufiggkeiten nicht
t ablesen lass
sen und feinee
Unterschied de schwer zu u erkennen s sind. Über Annpassungen an der Darst tellung lassen
sich allerdin
ngs Beschrifttungen auf d der Kreisfläch
he nachtrageen, um die Auussagekraft
deutlich zu erhöhen.
1.1.3 S Statistischee Analyse
Über eineen Ein‐Stichpproben‐Chi‐QQuadrat‐Test t kann die Fr
rage beantwo ortet werden
n, ob eine Au
usprägung
signifikan
nt häufiger auftritt oder a
alle Auspräg ungen gleich
h verteilt sind
d.
Analysier
ren ‐> Nichtp
parametrisch
he Tests ‐> Ch
hi‐Quadrat ‐>
> untersuche
ende Variable
le zu Testvari
iablen ziehen
n ‐
> OK.
Die „Erwa
artete Anzahhl“ in der mit
ttleren Spalt e gibt die erwarteten (ab
bsoluten) Hääufigkeiten b
bei einer
Gleichver
rteilung an. D
Das Residuum ist die Diffferenz der er rsten beiden
n Spalten.
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 4
5. Abbildung 5
5: Chi‐Quadrat
t‐Ausgabe von S
SPSS
Die asym
mptotische Sig
gnifikanz ist gleich dem p
p‐Wert und l erpretieren, ob die zuvor
lässt uns inte r aufgestellte
e
Nullhypo
othese verwoorfen wird od der beizubehhalten ist (nä
ähere Informationen hier rzu in der PowerPoint‐
Präsentat
tion).
1.2 En
ntspreche
en Häufigk
keiten be
estimmten
n Vorgabe
en?
Statt einee kategoriale
e Variable au
uf eine Gleichhverteilung z
zu überprüfeen, kann auch
h auf eine be
estimmte
Verteilunng geprüft we erden. Beisp
piel: Erste Kat
tegorie 30%,, zweite Kate
egorie 60%, d
dritte Katego
orie 10%. Die
e
statistische Frage ist dann, ob die
e Anteile vonn einzelnen K
Kategorien in
n einer Stichp
probe den taatsächlichen
Anteilen in der Population entspr rechen.
1.2.1 N Numerischee und grafissche Beschr reibung
Siehe „Ko gleich häufig vor?“, S. 2.
ommen alle Kategorien g
1.2.2 S Statistische e Analyse
Ähnlich z
zum vorherig gen Fall, jedo
och ist die Nu
ullhypothese
e in diesem Fall, dass die Verteilung in
n bestimmte
er
Form festtgelegt ist.
Die Berec
chnung erfol
lgt über:
Analysier
ren ‐> Nichtp
parametrisch he Tests ‐> Ch
hi‐Quadrat ‐>> untersuche
ende Variable
le zu Testvari
iablen ziehen
n ‐
> Erwarte
ete Werte markieren ‐> in das Feld W Werte der Reiihe nach die erwarteten rrelativen Häufigkeiten (a
also
in Prozen
nt!) einfügen,
, jeweils per Hinzufügen bestätigen ‐> OK.
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 5
6. Abbildung 6: Der Reihe nach we
erden die Werte
e eingeben
Der Outpput gibt nun a
an der Stelle
e „Erwartete Anzahl“ die,
, auf Grund d
der eben ein gegeben erw
warteten
relativen
Häufigkeiten, die erwartteten absolu
uten Häufigkeiten aus.
Die Interpretation erf
folgt identisc erigen Fall.
ch zum vorhe
2 Me
ehrere ka
ategoriale Variabl
len
Im Gegen
nsatz zum 1. Kapital werd
den einzelne
e kategoriale
e Variablen nicht für sich untersucht, sondern das
s
gemeinsa
ame Auftreteen von zweieen oder mehhr Variablen z
zu beschreib
ben und zu an nalysieren.
2.1 Da
atenbesch
hreibung
2.1.1 N Numerische e Beschreib bung
Ein schne
eller numeris
scher Überbllick kann übeer die Erzeuggung einer Kr
reuztabelle (
(auch: Kontin
ngenztabelle
e)
erhalten werden. Erg
gebnis in eine
e Matrix, in d
der relative w
wie auch abssolute Häufig
gkeiten ausgegeben
werden.
Analysier
ren ‐> Deskri
iptive Statisti
iken ‐> Kreuzztabellen ‐> u
untersuchende Variablen n in Zeilenvar
riable und
Spaltenva
ariable einfü
ügen ‐> Buttoon „Zellen…“ “ ‐> Häkchen bei „Beobac chtet“ setzen
n im Feld „Hä
äufigkeiten“ ‐
‐>
Optional:
: Häkchen beei Prozentwe erten setzen ‐‐> Klick auf W
Weiter ‐> Klic
ck auf OK
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 6
7. Abbildu
ung 7: Dialog der Kreuztabelle
e
Das Ergeb
bnis sieht ist
t daraufhin ähnlich der fo
olgenden Darstellung:
Abbildung
g 8: Exemplaris
sche Kreuztabe
elle
2.1.2 G Grafische Beschreibun ng
Zur Darst nen sich idealerweise gru
tellung eigen uppierte oder gestapelte Balkendiagr
ramme. Exem mplarisch wirrd
im Folgen
nden die Ersttellung eines
s gestapelten
n Balkendiag
gramms wied dergegeben. Dieses wird folgt erzeug
gt:
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 7
8. Diagramm me ‐> Diagraammerstellung ‐> in Gale erie Balken aauswählen ‐> > Doppelklick
k auf „gestap
pelte Balken“
“ ‐>
Variable 1 in die X‐Ac
chse ziehen ‐>
> Variable 2 in das Feld „
„Stapel: Farb
be festlegen“
“ ziehen ‐> OK
Abbildung
g 9: Gestapeltes
s Balkendiagram
mm
Um die A
Aussagekraft zu erhöhen, , kann es ma nchmal nütz
zlich sein das auf 100% zu skalieren.
s Diagramm a
Dazu empfiehlt sich d
die folgende Vorgehenswweise:
Doppelkli
ick auf das D
Diagramm ‐>
> Optionen ‐>
> Auf 100% skalieren
Abbild
dung 10: Gesta
apeltes Balkend
diagramm, auf 100% skaliert
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 8
9. Durch die
ese Form der Darstellung
g ist ein Verg
gleich wesentlich einfacher möglich.
2.2 Sind zwei k
kategorial
le Variabl
len unabh
hängig?
Gruppenunabhängig wird die Frage gestellt, o ob zwischen zwei kategorialen Variab blen eine Bez
ziehung
oder nicht. In
besteht o n der Ausganngssituation können bspw
w. zwei ordin
nalskalierte V
Variablen in Form einer
Likertskala untersuchht werden.
2.2.1 D Datenbesch hreibung
Orientierrung an „Datenbeschreib bung“, S. 6 zu
ur Anfertigun
ng einer Kreu
uztabelle. Be
ei der graphis
schen Form
eignet sic
ch hier das gruppierte Ba
alkendiagram mm.
2.2.2 UUnabhängig gkeitstest
Zum Eins
satz kommt d
der Chi‐Quaddrat‐Unabhä ngigkeitstest
t, der folgendes Hypothe
esenpaar auf
fstellt:
ä .
ä .
Analysierren ‐> Deskriiptive Statisti
iken ‐> Kreuz
ztabellen ‐> u
untersuchende Variablen n in Zeilen un
nd Spalten
ziehen ‐>
> Klick auf „Sttatistiken“ ‐>
> Häkchen beei „Chi‐Quaddrat“ setzen ‐
‐> Weiter ‐> Klick auf OK
Abb
bildung 11: Var
riablen per Klic
cken + Ziehen e
einsetzen, dann
n auf „Statistike
en“ klicken
Wir erhalten daraufhin eine Tabe elle als Outpu
ut, die uns Aufschluss über den p‐We
ert gibt und e
eine
Interprettation der Erg
gebnisse erm
möglicht. Dieeser kann als Wert unter „Asymptotis
sche Signifika
anz“ in der
Zeile Chi‐
‐Quadrat nac ch Pearson a
abgelesen we erden.
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 9
10. Abbildung 12
2: Exemplarisch
hes Ergebnis ein
nes Chi‐Quadra
at‐Homogenität
tstests
Anschließ
ßend folgt eine Interpret
tation des p‐W
Werts.
3 Ein
ne metris
sche Vari
iable
3.1 W
Wie kann m
man die V
Verteilung
g einer me
etrischen Variablen
n beschre
eiben?
Folgende
e Punkte können betrachtet werden, wenn man d
die Verteilun
ng einer metr
rischen Varia
ablen
untersuchen möchte:
In welchem BBereich die D
Daten liegen,
,
die Verteilung der Werte innerhalb d ieses Bereich
d und weniger ausgeprägt
hes, also wo sie stärker u
s
sind,
o
ob es ein Zen
ntrum oder mmehrere Zent tren gibt undd ob
d
die Daten stä
ärker oder weniger stark variieren.
3.1.1 K Klassifizieren, Tabelle en und Histo ogramme
Klassifizie
eren Wen nn nur wenig ge Beobacht ungen vorlie egen, kann eine einfache e Häufigkeitsvverteilung
wie bei einer me etrischen Va riable vorgenommen we erden.
Diess ist allerding
gs nicht prakktikabel, sobaald mehr als ca. fünf Aus prägungen v vorliegen. In
der Praxis trifft mman häufig eeher auf einee große Anza ahl von Ausp prägungen (>100+), so
dasss per man Hä äufigkeitsverrteilung keine aussagekrä äftige Darste
ellung mehr erhält. Als
Wor rkaround bie etet es sich a
an eine Klassifizierung der Daten durc ch Intervalle
vorzzunehmen. D Die Anzahl de er Klassen ka
ann sich an foolgenden Fo ormeln orient tieren, mit
Klasssenzahl k be ei n Beobacht tungen:
5 20
2 √
In SPSS kann über die Funktiion „Visuelle es Klassieren“ eine derart tige Einteilun
ng
vorggenommen w werden, wob bei die grafische Verteilung direkt im Dialogfenster angezeigt t
wirdd.
Trannsformieren ‐> Visuelles K Klassieren ‐>
> untersuchende Variable e auswählen ‐> neue,
klas
ssierte Variab ble bezeichne en unter „Klaassierte Variable“ ‐> Trennnwerte eing geben oder
autoomatisch übe er „Trennwe rte erstellen…“ anlegen ‐ ‐> OK
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 10
11. Abbild
dung 13: Einste
ellungen für visuelles Klassiere
en
Es g
gilt die Trennwerte so zu wählen, dass konzentriertere Bereic he durch kle einere
Inte
ervalle klassie
ert werden, aals die übrigen Bereiche. .
Tabellen Die zuvor klassie e kann nun über eine reguläre Häufig
erte Variable gkeitstabelle ausgewertet
werrden:
Anaalysieren ‐> D
Deskriptive Sttatistiken ‐> Häufigkeitenn ‐> untersuc
chende Varia able
auswwählen ‐> OK K
Histogram
mme ernativ kann, ohne eine v
Alte vorherige ma anuelle Klassierung, ein H
Histogramm zur
grap
phischen Dar rstellung erzeeugt werden n. Im Unterscchied zum Ba alkendiagrammm, erfolgt
die Darstellung oohne Zwisch henräume, da a eine metris
sche Variablee als Datenquelle dient.
Eine
e Klassierungg findet hier aautomatisch h statt.
Diaggramm ‐> Diagrammerst tellung ‐> Kategorie Histo
ogramm ‐> D Doppelklick a
auf
„ein
nfaches Histoogramm“ ‐> u untersuchende, metrische Variable in n die X‐Achsee ziehen ‐>
Optiional: Klasse
enzahl‐ oder b breite manuell setzen. Im
m Fenster „Ellementeigenschaften auf f
„Parrameter festtlegen…“ kliccken, anschlie eßend Wertee eingeben ‐>> OK
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 11
12. Abbildung 1
14: Optionales f
festlegen der K
Klassenbreite‐ o
oder zahl
3.1.2 M Maßzahlen zur Beschr reibung der r Verteilungg
Zur Besch
hreibung ein
ner metrische
en Variablen können aucch Lagemaße
e und Streuu ngsmaße verwendet
werden, um Angaben n über die Ve
erteilung zu t
treffen.
Analysierren ‐> Deskriiptive Statisti
iken ‐> Häufi
figkeiten ‐> u
untersuche Vaariable ausw
wählen und in
n die rechte
Spalte zie
ehen ‐> Klick auf „Statistiiken…“ ‐> rellevante Lagee‐ und Streuu
ungsmaße au uswählen ‐> Weiter ‐> OK.
K
Abbildung 15: Auswahl vo
on zu berechne
enden Lage‐ und Streuungsma
aßen
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 12
13. 3.1.3 B Boxplott
Der Boxp
plott stellt ein
ne weitere M
Methode zur graphischenn Visualisieru
ung dar. Er er
rlaubt einen schnellen
Überblick
k über die Ve erteilung und
d wird beson
nders aussaggekräftig, wenn zwei Variiablenverteilungen
miteinander vergliche en werden. DDarüber hina
aus lassen sic
ch Ausreißerr besonders eeinfach Iden
ntifizieren.
A
Abbildung 16: B
Boxplott
Innerhalbb der Box befinden sich 5
50% der Date
en und, eingeschlossen vvon Box inkl. Whiskern, d
der Großteil d
der
Daten. MModerater Auusreißer werdden per Krei s und Zeilenzahl gekennz
zeichnet, ext
treme Ausreeißer mit eineem
Stern.
Diagrammme ‐> Diagra
ammerstellung ‐> in Gale erie Boxplott
t auswählen ‐> Doppelklic
ck auf 1D‐Bo
oxplott ‐>
untersuch
hende Variab
ble in X‐Achs
se ziehen ‐> O
OK.
4 Me
ehrere me
etrische Variable
en
4.1 W
Wie stark ist der Zus
sammenh
hang zwis
schen zwe
ei metrisc
chen Varia
ablen?
4.1.1 G Grafische Beschreibun ng
Zur Darst
tellung eigneen sich Streudiagramme. Die Werte e
einer Variablen werden je
eweils auf de
er X‐ und Y‐
Achse dargestellt.
Diagramm ammerstellung ‐> in Gale
me ‐> Diagra erie „Streu‐/P
Punktdiagram mm“ auswäh hlen ‐> Dopp pelklick auf
„einfache
es Streudiagrramm“ ‐> Va ariable 1 in X
X‐Achse zieheen, Variable 2
2 in Y‐Achse ziehen ‐> op
ptional:
Punktbesschriftung üb
ber Klick auf Registerreiteer Punkt/Gru
uppen‐ID, dan nn „Punkt‐IDD‐Beschriftunng“ anklicken n
und Varia
able 3 in das
s neue Feld zi
iehen ‐> OK.
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 13
14. Abbildung 1
17: Exemplarisc
ches Streudiagr
ramm
4.1.2 KKorrelationnskoeffiziennt nach Peaarson und SSpearman
Zur nume
erischen Beschreibung veerwendet m an den Korre
elationskoeff
fizienten, de
er normiert is
st und sich im
m
Wertebereich zwischen 1 1 bewegt t.
Die Berec
chnung erfol
lgt über:
Analysierren ‐> Korrela
ation ‐> Biva
ariat ‐> zwei z
zu korreliere
ende Variablee auswählen echte Spalte
n und in die re
ziehen ‐>
> relevante Koorrelationskooeffizienten auswählen pper Klick auf Checkbox ‐>
> OK.
Abbildung 18: Eigens chaftendialog f
für Korrelationskoeffizienten
Der ausgegebene p‐W
Wert kann an
nschließend interpretiert
t werden.
Einführun
ng in SPSS / S
SS 2010 – HA
AW Hamburg
g – René Reineke 14