Similar presentations:
Základy demografie a hospodářské statistiky
1. Základy demografie a hospodářské statistiky
Prof. Ing. Libuše Svatošová, CSc.Katedra statistiky – č. dveří 434
e-mail : [email protected]
Konzultační hodiny : úterý 10,30-12 hodin
2.
Základy demografie a hospodářská statistikaPřednášky: prof. Ing. Libuše Svatošová, CSc.
PEF E 434, [email protected]
Konzultační hodiny: úterý 1030 – 12,00 hod.
Cvičení :
Ing. Jana Kőppelová
PEF E 421, [email protected]
Konzultační hodiny: čtvrtek 10,30 – 12,00 hod.
Moodle : heslo ZDHS1819
3. Základy demografie a hospodářské statistiky
Literatura :1. Kába, B. Svatošová, L. : Statistické nástroje ekonomického výzkumu, Vydavatelství a
nakladatelství Aleš Čeněk, s.r.o., Plzeň, 2012
2. Svatošová, L., Kába, B. : Statistické metody I a II, PEF ČZU, Praha 2004
3. Svatošová, L. Prášilová, M. : Statistické metody v příkladech PEF ČZU, Praha 2004
4. Kol. : Statistický software na ČZU, PEF ČZU, Praha 2007
4.
Přednášky1. Výběrová šetření, návrh a plán šetření. Metody sběru dat. Explorační analýza dat. Příprava
dotazníkového šetření. Zásady při tvorbě a zpracování dotazníkových a anketních průzkumů
2. Analýza závislosti kvalitativních znaků - asociační a kontingenční tabulky
3. Analýza závislosti kvalitativních znaků - znaménkové schéma, MC Nemarův test, relativní
riziko a další testy
4. Analýza časových řad
5. Analýza časových řad.
6. Indexní analýza- individuální indexy
7. Indexní analýza – souhrnné indexy
8. Základy demografie – ukazatele stavu obyvatelstva
9. Základy demografie – ukazatele pohybu obyvatelstva
10. Statistika obyvatelstva, rodin a domácností
11. Statistika ekonomické aktivity obyvatelstva
12. Statistika příjmů a spotřeby obyvatelstva. Životní úroveň obyvatelstva
5.
Mimořádná přednáškaPondělí 3.12.2018, 12,15 – 13,35 EII
Téma : Populační vývoj v ČR
Přednáší Ing. M. Němečková - ČSÚ
6. Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky
Tento výrok o statistice údajně zazněl súsměškem v britském parlamentě. Nám pak
byl svěřen nelehký úkol – tento obecně
rozšířený názor světu vyvrátit.
7. Úvod do kvantitativního výzkumu
Úvod do kvantitativníhovýzkumu
Role statistiky ve výzkumu
8. Model empirického výzkumu
Model vědecké práceÚvaha
Vědecká otázka
Proč
Návrh teorie
Naše řešení
Identifikace proměnných
Co sledovat
Určení hypotéz
Co očekávat
Plán výzkumu
Jak
Sběr dat
Shromažďování
Testování hypotéz
Analýza dat
Vyhodnocování výsledků
Co to znamená
Kritické shrnutí
Jaká to má význam
9. Plán výzkumu
Otázka výběru statistických jednotek – vymezenívěcné, časové, prostorové
Rozhodnutí o šetření jednotek – vyčerpávající – úplné ,
neúplné - výběrové (základní soubor, výběrový
soubor)
Výběrové šetření - typ výběru – pravděpodobnostní,
nepravděpodobnostní
Reprezentativnost výběru
10. Rozhodování o výběrovém šetření
Definovat základní souborJaké ukazatele budeme sledovat
Jaký je typ výběru.
Co je oporou výběru
Jak velký výběrový soubor budeme
potřebovat
Jaká bude organizační a finanční
náročnost
11. Výběrová zjišťování
Pravděpodobnostní výběryProstý náhodný výběr
Systematický výběr
Stratifikovaný výběr
Skupinový výběr
Dvoustupňový výběr
12. Výběrová zjišťování
Nepravděpodobnostní výběryZáměrný
výběr
Anketa
Dotazník
Metoda
základního masivu
Kvótní výběr
Sněhová koule
Samovolný výběr
13. Plán výzkumu
Charakter datVýběr ukazatelů
Kontrola správnosti dat
Metodika zjišťování
Vyloučení chyb vzniklých špatným zápisem
Logická kontrola
Problém chybějících hodnot
14. Přehled základních statistických metod
Přehled základních statistickýchmetod
Analýza jednorozměrných souborů
15. Deskriptivní statistika a metody explorační analýzy dat
K jednoduchému popisu a charakteristice datvolíme metody deskriptivní statistiky –
základní statistické charakteristiky popisující
polohu středu a variabilitu rozdělení,
doplněním o tabulky četností a grafické
vyjádření rozdělení četností. Grafické
vyjádření pomocí spojnicových, sloupcových
grafů či diagramů vhodným způsobem vždy
doplňuje text a podává dobrý vizuální
přehled o zkoumaných datech.
16.
Spojnicový graf30
25
20
15
Řada1
10
5
0
1
2
3
4
5
6
7
8
9
17.
Sloupcový graf30
25
20
15
Řada1
10
5
0
1
2
3
4
5
6
7
8
18.
Kruhový diagram1
2
3
4
5
19. Explorační analýza dat
Základní číselné popisné charakteristikyMíry polohy
Aritmetický průměr
Medián
Modus
Míry variablility
Variační rozpětí
Rozptyl
Směrodatná odchylka
Variační koeficient
Míry šikmosti - posuzují symetrii rozdělení.
Míry špičatosti - posuzují koncentraci rozdělení - plochost,
špičatost
20. Grafické a semigrafické techniky
Box-and-whisker plot -představuje grafickou prezentaci tzv.pětičíselného souhrnu (kvartily a minimální a maximální
hodnotou výběru). Jedná se o speciální diagram, ve kterém jsou
data zobrazena ve tvaru obdélníku (box- krabice) a dvou úseček
(whiskers-vousy), které z ní vybíhají. Levá, respektive dolní
strana obdélníka odpovídá dolnímu kvartilu, pravá, nebo horní
strana pak hodnotě horního kvartilu. Délka krabice je tedy
rovna kvartilovému rozpětí, čára uprostřed krabice představuje
pak medián, + představuje aritmetický průměr. Úsečky
vybíhající z krabice spojují ty body, které se nacházejí
v intervalu 0,5 IQR –1,5 IQR
Hodnoty, které leží mimo takto vymezený interval představují
odlehlá pozorování v v diagramu bývají znázorněny jako
izolované body.
21.
Box plot22. Stem-and-leaf display
Představuje kombinaci numerické techniky třídění dat,tedy tabulky rozdělení četností a grafické techniky
histogramu. Oproti oběma metodám, z nichž vychází,
má stem-and-leaf tu výhodu, že z něho lze kdykoliv
rekonstruovat původní data. Vzhledem k tomu, že
data jsou v diagramu uspořádaná podle velikosti, lze
snadno určit i základní popisné charakteristiky.
Výsledkem zobrazení je v podstatě vodorovný
sloupcový graf, kde před hlavní čárou (lodyhou) jsou
hlavní jednotky, za ní pak jako listy jsou vyznačeny
vedlejší jednotky
23.
Stem-and-Leaf DisplayLodyha
Listy
1113
224467
30123579
4678
52
24. Posouzení normality dat
Vizuálně – pomocí normálníhopravděpodobnostního grafu (Normal
Probability Plot), který představuje orientační
grafickou pomůcku pro posouzení normality.
Analyzované výběrové hodnoty jsou označeny
hvězdičkami (*) a znaménky + jsou označeny
stupně tzv. referenční přímky. Jestliže výběr
pochází z normálního rozdělení, měly by
výběrové hodnoty rovněž vykazovat lineární
průběh a výrazněji se nelišit od zmíněné
referenční přímky.
25. Normal Plot ( Q-Q graf)
26. Testování normality
Shapiro-Wilkův test normalityKolmogorov-Smirnovův test normality
Davidův test normality
27. Explorační analýza dat (výstupSAS)
28.
29.
30. Když má hlavu v sauně a nohy v ledničce, hovoří statistik o příjemné průměrné teplotě.
31. Střední hodnoty – porovnání průměru a mediánu
Průměrná hrubá měsíční mzda a medián mezd - mezikrajské srovnání - rok 2015Měřicí jednotka: Kč
ČR, kraje
Česká republika
Průměrná měsíční
mzda
Medián měsíčních
mezd
celkem
celkem
27 811
23 726
Hlavní město Praha
36 371
28 677
Středočeský kraj
27 997
24 582
Jihočeský kraj
25 246
22 697
Plzeňský kraj
27 013
24 135
Karlovarský kraj
24 119
21 747
Ústecký kraj
25 301
22 644
Liberecký kraj
26 358
23 946
Královéhradecký kraj
25 192
22 521
Pardubický kraj
24 856
22 283
Kraj Vysočina
25 258
22 600
Jihomoravský kraj
27 051
23 328
Olomoucký kraj
24 584
21 918
Zlínský kraj
24 554
21 770
Moravskoslezský kraj
25 475
23 116
32. Informace o variabilitě ukazatelů
Směrodatná odchylkaRozptyl
Variační koeficient
33. Výsledky přijímacích zkoušek
PředmětPrůměr
Matematika
20,1
Angličtina
31,9
Němčina
28,7
Čeština
32,5
34. Výsledky přijímacích zkoušek
PředmětPrůměr Rozptyl Směr.odchylka
Matematika
20,1
86,49
9,3
Angličtina
31,9
68,89
8,3
Němčina
28,7
104,04
10,2
Čeština
32,5
54,76
7,4
35. Výsledky přijímacích zkoušek
PředmětSměr.
Průměr Rozptyl odchylka
Variační
koeficient
Matematika
20,1
86,49
9,3
46,3
Angličtina
31,9
68,89
8,3
26
Němčina
28,7
104,04
10,2
35,5
Čeština
32,5
54,76
7,4
22,7
36. Výsledky přijímacích zkoušek
PředmětSměr.
Průměr Rozptyl odchylka
Variační
koeficient
Počet
Matematika
20,1
86,49
9,3
46,3
4389
Angličtina
31,9
68,89
8,3
26
3435
Němčina
28,7
104,04
10,2
35,5
75
Čeština
32,5
54,76
7,4
22,7
879
37. Výsledky testu
Skupina, ve které bylo 108 studentů,psala test .Maximální počet bodů byl
170. Výsledné hodnocení skupiny bylo:
Průměrný počet bodů
85
Směrodatná odchylka
25,8
38. Možné výsledky testu
Graf 1 – průměr = 85, směrodatná odchylka = 25,839. Možné výsledky testu Graf 2 – průměr = 85, směrodatná odchylka = 25,8
Graf 2 – průměr = 85, směrodatná odchylka = 25,840. Možné výsledky testu Graf 3 – průměr = 85, směrodatná odchylka = 25,8
Graf 3 – průměr = 85, směrodatná odchylka = 25,841. Možné výsledky testu Graf 4 – průměr = 85, směrodatná odchylka = 25,8
Graf 4 – průměr = 85, směrodatná odchylka = 25,842.
Metody analýzy dat•Parametrické a neparametrické testy
•Metody regresní a korelační analýzy
•Metody analýzy kvalitativních znaků
•Analýza časových řad
•Vícerozměrné statistické metody
43. Sociologický výzkum
Sociologický výzkumAnketa , dotazník
Role :
1. Výzkumník – badatel
2. Tazatel
3. Dotazovaný
44. Sociologický výzkum
Požadavek invariance - během šetřeníse nemá nic měnit - jednotnost,
srovnatelnost šetření
Rozdělení rolí badatele a tazatele
45. Etapy sociologického výzkumu:
1. Sestavení projektu výzkumu2. Určení výběr, tj. jednotek,které
budeme zkoumat
3. Rozpracování prostředků k získávání
materiálu
4. Shromažďování materiálu
5. Analýza materiálu a jeho zobecnění
46. Určení výběru (jednotek,které budeme zkoumat)
ReprezentativníPřibližně reprezentativní
Nereprezentativní
47. Sestavení projektu výzkumu
Co chceme zkoumat a pročProgramová otázka
Zjišťovací otázka
Převod programové otázky na otázky
zjišťovací
48. Formy dotazování
OsobníNeosobní –písemné, telefonické,
elektronické
Monotématické –speciální výzkumy
Omnibusové – spojení několika
nesouvisejících témat
49. Formy dotazování
JednorázovéOpakované –soubor opakovaně
dotazovaných = panel
50. Rozpracování prostředků k získávání materiálu
Rozpracování prostředkůk získávání materiálu
Formy dotazování - ankety
dotazníky
rozhovory
Zásady konstrukce dotazníku
Druhy otázek
Problematika přípravy otázek
Předvýzkum
Konference o dotazníku
51. Zásady konstrukce dotazníku
Délka rozhovoruPočet otázek
Forma otázek
Srozumitelnost
Ochota odpovídat
Problém dotazování na vzdálené
události
52. Hodnocení obsahu otázek
Zda respondent otázce porozumíZda je respondent schopen požadované
informace poskytnout (zda disponuje
potřebnými znalostmi, aby mohl
odpovědět)
Zda respondent bude ochoten potřebné
informace poskytnout
53. Problematika přípravy otázek
Nezjišťuje dotaz záležitost, kterouběžný respondent nevnímá, vnímá
nepřesně, nebo pomíjivě?
Nezabraňuje nedůvěra hospodářského,
politického či společenského
charakteru objektivní odpovědi?
Nezkreslují dotázaní odpověď z
prestižních důvodů?
54. Problematika přípravy otázek
Nevzniknou potíže se správnýmpochopením otázek?
Není použitý příliš abstraktní jazyk?
Vystačí jazykové schopnosti
dotázaného k tomu, aby formuloval
odpověď?
55. Problematika přípravy otázek
Nezaměřuje se výzkum na skutečnosti,které dotázaní považují za osobní
záležitost a buď o ní nechtějí hovořit
nebo nehovoří upřímně?
Nesleduje výzkum takové skutečnosti,
které jsou technikami sociologického
šetření nezjistitelné?
56. Problematika přípravy otázek
Scénář rozhovoruPředvýzkum
Konference o dotazníku
57. Druhy otázek
UzavřenéOtevřené
Polootevřené
Filtrační
Identifikační
Odlehčovací
Kontaktní
58.
59.
60.
61. Statistická analýza
Zpracování :Popisné charakteristiky třídění vždy
podle jednoho znaku (jedné odpovědi)tabulky , grafy
Zkoumání závislosti mezi dvěma
proměnnými – kontingenční tabulky.
62. Statistická analýza
Jaká byla vaše příprava na přijímacízkoušku ?
Návštěva intenzivních přípravných kurzů
…… 150
Návštěva základních opakovacích kurzů
….. 144
Bez kurzů
… 126
63. Příprava na zkoušku
155150
145
140
135
130
125
120
115
110
1
2
3
1
2
3
Řada1
64. Příprava na zkoušku
12
3
65. Statistická analýza
Jaký byl výsledek přijímací zkoušky?Výborný ……… 130
Dobrý …………. 180
Nevyhovující ….. 110
66. Výsledek zkoušky
200150
100
Řada1
50
0
1
2
3
67. Výsledek zkoušky
12
3
68. Analýza závislostí- kontingenční tabulka
A1
2
3
Celkem
B
1
A1
2
A2
3
A3
Celkem
B1
B2
B3
n
69. Analýza závislostí
Výsledek přijímacízkoušky
Příprava na přijímací zkoušku
Celkem
Intenzivní
kurz
Základní kurz
Žádný kurs
Výborný
60
52
18
130
Dobrý
75
68
37
180
Nevyhovující
15
24
71
110
Celkem
150
144
126
420
70. 2 test pro nezávislost
2 test pro nezávislost2
= 87,679
2 0,05(4) = 9,488
Hodnota testového kritéria je větší než
hodnota kritická, proto nulovou
hypotézu o nezávislosti zamítáme.
Absolvování přípravných kurzů má vliv
na výsledek zkoušky.
71. Síla závislosti
Pearsonův normalizovaný koeficientkontingence
Cn = 0,508
Závislost lze charakterizovat jako
středně silnou
72. Závěry výzkumu
Úvod – kdo zadal a kdo uskutečnilvýzkum
Cíl a předmět výzkumu
Metodika – charakteristika souboru,
metoda sběru dat, termín sběru
Výsledková část
Závěry