Základy demografie a hospodářské statistiky
Základy demografie a hospodářské statistiky
Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky
  Úvod do kvantitativního výzkumu
Model empirického výzkumu
Plán výzkumu
Rozhodování o výběrovém šetření
Výběrová zjišťování
Výběrová zjišťování
Plán výzkumu
Přehled základních statistických metod  
Deskriptivní statistika a metody explorační analýzy dat
Explorační analýza dat
Grafické a semigrafické techniky
Stem-and-leaf display
Posouzení normality dat
Normal Plot ( Q-Q graf)
Testování normality
Explorační analýza dat (výstupSAS)
Když má hlavu v sauně a nohy v ledničce, hovoří statistik o příjemné průměrné teplotě.
Střední hodnoty – porovnání průměru a mediánu
Informace o variabilitě ukazatelů
Výsledky přijímacích zkoušek
Výsledky přijímacích zkoušek
Výsledky přijímacích zkoušek
Výsledky přijímacích zkoušek
Výsledky testu
Možné výsledky testu
Možné výsledky testu Graf 2 – průměr = 85, směrodatná odchylka = 25,8
Možné výsledky testu Graf 3 – průměr = 85, směrodatná odchylka = 25,8
Možné výsledky testu Graf 4 – průměr = 85, směrodatná odchylka = 25,8
  Sociologický výzkum
Sociologický výzkum
Etapy sociologického výzkumu:
Určení výběru (jednotek,které budeme zkoumat)
Sestavení projektu výzkumu
Formy dotazování
Formy dotazování
Rozpracování prostředků k získávání materiálu
Zásady konstrukce dotazníku
Hodnocení obsahu otázek
Problematika přípravy otázek
Problematika přípravy otázek
Problematika přípravy otázek
Problematika přípravy otázek
Druhy otázek
Statistická analýza
Statistická analýza
Příprava na zkoušku
Příprava na zkoušku
Statistická analýza
Výsledek zkoušky
Výsledek zkoušky
Analýza závislostí- kontingenční tabulka
Analýza závislostí
2 test pro nezávislost
Síla závislosti
Závěry výzkumu
3.23M
Category: mathematicsmathematics

Základy demografie a hospodářské statistiky

1. Základy demografie a hospodářské statistiky

Prof. Ing. Libuše Svatošová, CSc.
Katedra statistiky – č. dveří 434
e-mail : [email protected]
Konzultační hodiny : úterý 10,30-12 hodin

2.

Základy demografie a hospodářská statistika
Přednášky: prof. Ing. Libuše Svatošová, CSc.
PEF E 434, [email protected]
Konzultační hodiny: úterý 1030 – 12,00 hod.
Cvičení :
Ing. Jana Kőppelová
PEF E 421, [email protected]
Konzultační hodiny: čtvrtek 10,30 – 12,00 hod.
Moodle : heslo ZDHS1819

3. Základy demografie a hospodářské statistiky

Literatura :
1. Kába, B. Svatošová, L. : Statistické nástroje ekonomického výzkumu, Vydavatelství a
nakladatelství Aleš Čeněk, s.r.o., Plzeň, 2012
2. Svatošová, L., Kába, B. : Statistické metody I a II, PEF ČZU, Praha 2004
3. Svatošová, L. Prášilová, M. : Statistické metody v příkladech PEF ČZU, Praha 2004
4. Kol. : Statistický software na ČZU, PEF ČZU, Praha 2007

4.

Přednášky
1. Výběrová šetření, návrh a plán šetření. Metody sběru dat. Explorační analýza dat. Příprava
dotazníkového šetření. Zásady při tvorbě a zpracování dotazníkových a anketních průzkumů
2. Analýza závislosti kvalitativních znaků - asociační a kontingenční tabulky
3. Analýza závislosti kvalitativních znaků - znaménkové schéma, MC Nemarův test, relativní
riziko a další testy
4. Analýza časových řad
5. Analýza časových řad.
6. Indexní analýza- individuální indexy
7. Indexní analýza – souhrnné indexy
8. Základy demografie – ukazatele stavu obyvatelstva
9. Základy demografie – ukazatele pohybu obyvatelstva
10. Statistika obyvatelstva, rodin a domácností
11. Statistika ekonomické aktivity obyvatelstva
12. Statistika příjmů a spotřeby obyvatelstva. Životní úroveň obyvatelstva

5.

Mimořádná přednáška
Pondělí 3.12.2018, 12,15 – 13,35 EII
Téma : Populační vývoj v ČR
Přednáší Ing. M. Němečková - ČSÚ

6. Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky

Tento výrok o statistice údajně zazněl s
úsměškem v britském parlamentě. Nám pak
byl svěřen nelehký úkol – tento obecně
rozšířený názor světu vyvrátit.

7.   Úvod do kvantitativního výzkumu

Úvod do kvantitativního
výzkumu
Role statistiky ve výzkumu

8. Model empirického výzkumu

Model vědecké práce
Úvaha
Vědecká otázka
Proč
Návrh teorie
Naše řešení
Identifikace proměnných
Co sledovat
Určení hypotéz
Co očekávat
Plán výzkumu
Jak
Sběr dat
Shromažďování
Testování hypotéz
Analýza dat
Vyhodnocování výsledků
Co to znamená
Kritické shrnutí
Jaká to má význam

9. Plán výzkumu

Otázka výběru statistických jednotek – vymezení
věcné, časové, prostorové
Rozhodnutí o šetření jednotek – vyčerpávající – úplné ,
neúplné - výběrové (základní soubor, výběrový
soubor)
Výběrové šetření - typ výběru – pravděpodobnostní,
nepravděpodobnostní
Reprezentativnost výběru

10. Rozhodování o výběrovém šetření

Definovat základní soubor
Jaké ukazatele budeme sledovat
Jaký je typ výběru.
Co je oporou výběru
Jak velký výběrový soubor budeme
potřebovat
Jaká bude organizační a finanční
náročnost

11. Výběrová zjišťování

Pravděpodobnostní výběry
Prostý náhodný výběr
Systematický výběr
Stratifikovaný výběr
Skupinový výběr
Dvoustupňový výběr

12. Výběrová zjišťování

Nepravděpodobnostní výběry
Záměrný
výběr
Anketa
Dotazník
Metoda
základního masivu
Kvótní výběr
Sněhová koule
Samovolný výběr

13. Plán výzkumu

Charakter dat
Výběr ukazatelů
Kontrola správnosti dat
Metodika zjišťování
Vyloučení chyb vzniklých špatným zápisem
Logická kontrola
Problém chybějících hodnot

14. Přehled základních statistických metod  

Přehled základních statistických
metod
Analýza jednorozměrných souborů

15. Deskriptivní statistika a metody explorační analýzy dat

K jednoduchému popisu a charakteristice dat
volíme metody deskriptivní statistiky –
základní statistické charakteristiky popisující
polohu středu a variabilitu rozdělení,
doplněním o tabulky četností a grafické
vyjádření rozdělení četností. Grafické
vyjádření pomocí spojnicových, sloupcových
grafů či diagramů vhodným způsobem vždy
doplňuje text a podává dobrý vizuální
přehled o zkoumaných datech.

16.

Spojnicový graf
30
25
20
15
Řada1
10
5
0
1
2
3
4
5
6
7
8
9

17.

Sloupcový graf
30
25
20
15
Řada1
10
5
0
1
2
3
4
5
6
7
8

18.

Kruhový diagram
1
2
3
4
5

19. Explorační analýza dat

Základní číselné popisné charakteristiky
Míry polohy
Aritmetický průměr
Medián
Modus
Míry variablility
Variační rozpětí
Rozptyl
Směrodatná odchylka
Variační koeficient
Míry šikmosti - posuzují symetrii rozdělení.
Míry špičatosti - posuzují koncentraci rozdělení - plochost,
špičatost

20. Grafické a semigrafické techniky

Box-and-whisker plot -představuje grafickou prezentaci tzv.
pětičíselného souhrnu (kvartily a minimální a maximální
hodnotou výběru). Jedná se o speciální diagram, ve kterém jsou
data zobrazena ve tvaru obdélníku (box- krabice) a dvou úseček
(whiskers-vousy), které z ní vybíhají. Levá, respektive dolní
strana obdélníka odpovídá dolnímu kvartilu, pravá, nebo horní
strana pak hodnotě horního kvartilu. Délka krabice je tedy
rovna kvartilovému rozpětí, čára uprostřed krabice představuje
pak medián, + představuje aritmetický průměr. Úsečky
vybíhající z krabice spojují ty body, které se nacházejí
v intervalu 0,5 IQR –1,5 IQR
Hodnoty, které leží mimo takto vymezený interval představují
odlehlá pozorování v v diagramu bývají znázorněny jako
izolované body.

21.

Box plot

22. Stem-and-leaf display

Představuje kombinaci numerické techniky třídění dat,
tedy tabulky rozdělení četností a grafické techniky
histogramu. Oproti oběma metodám, z nichž vychází,
má stem-and-leaf tu výhodu, že z něho lze kdykoliv
rekonstruovat původní data. Vzhledem k tomu, že
data jsou v diagramu uspořádaná podle velikosti, lze
snadno určit i základní popisné charakteristiky.
Výsledkem zobrazení je v podstatě vodorovný
sloupcový graf, kde před hlavní čárou (lodyhou) jsou
hlavní jednotky, za ní pak jako listy jsou vyznačeny
vedlejší jednotky

23.

Stem-and-Leaf Display
Lodyha
Listy
1113
224467
30123579
4678
52

24. Posouzení normality dat

Vizuálně – pomocí normálního
pravděpodobnostního grafu (Normal
Probability Plot), který představuje orientační
grafickou pomůcku pro posouzení normality.
Analyzované výběrové hodnoty jsou označeny
hvězdičkami (*) a znaménky + jsou označeny
stupně tzv. referenční přímky. Jestliže výběr
pochází z normálního rozdělení, měly by
výběrové hodnoty rovněž vykazovat lineární
průběh a výrazněji se nelišit od zmíněné
referenční přímky.

25. Normal Plot ( Q-Q graf)

26. Testování normality

Shapiro-Wilkův test normality
Kolmogorov-Smirnovův test normality
Davidův test normality

27. Explorační analýza dat (výstupSAS)

28.

29.

30. Když má hlavu v sauně a nohy v ledničce, hovoří statistik o příjemné průměrné teplotě.

31. Střední hodnoty – porovnání průměru a mediánu

Průměrná hrubá měsíční mzda a medián mezd - mezikrajské srovnání - rok 2015
Měřicí jednotka: Kč
ČR, kraje
Česká republika
Průměrná měsíční
mzda
Medián měsíčních
mezd
celkem
celkem
27 811
23 726
Hlavní město Praha
36 371
28 677
Středočeský kraj
27 997
24 582
Jihočeský kraj
25 246
22 697
Plzeňský kraj
27 013
24 135
Karlovarský kraj
24 119
21 747
Ústecký kraj
25 301
22 644
Liberecký kraj
26 358
23 946
Královéhradecký kraj
25 192
22 521
Pardubický kraj
24 856
22 283
Kraj Vysočina
25 258
22 600
Jihomoravský kraj
27 051
23 328
Olomoucký kraj
24 584
21 918
Zlínský kraj
24 554
21 770
Moravskoslezský kraj
25 475
23 116

32. Informace o variabilitě ukazatelů

Směrodatná odchylka
Rozptyl
Variační koeficient

33. Výsledky přijímacích zkoušek

Předmět
Průměr
Matematika
20,1
Angličtina
31,9
Němčina
28,7
Čeština
32,5

34. Výsledky přijímacích zkoušek

Předmět
Průměr Rozptyl Směr.odchylka
Matematika
20,1
86,49
9,3
Angličtina
31,9
68,89
8,3
Němčina
28,7
104,04
10,2
Čeština
32,5
54,76
7,4

35. Výsledky přijímacích zkoušek

Předmět
Směr.
Průměr Rozptyl odchylka
Variační
koeficient
Matematika
20,1
86,49
9,3
46,3
Angličtina
31,9
68,89
8,3
26
Němčina
28,7
104,04
10,2
35,5
Čeština
32,5
54,76
7,4
22,7

36. Výsledky přijímacích zkoušek

Předmět
Směr.
Průměr Rozptyl odchylka
Variační
koeficient
Počet
Matematika
20,1
86,49
9,3
46,3
4389
Angličtina
31,9
68,89
8,3
26
3435
Němčina
28,7
104,04
10,2
35,5
75
Čeština
32,5
54,76
7,4
22,7
879

37. Výsledky testu

Skupina, ve které bylo 108 studentů,
psala test .Maximální počet bodů byl
170. Výsledné hodnocení skupiny bylo:
Průměrný počet bodů
85
Směrodatná odchylka
25,8

38. Možné výsledky testu

Graf 1 – průměr = 85, směrodatná odchylka = 25,8

39. Možné výsledky testu Graf 2 – průměr = 85, směrodatná odchylka = 25,8

Graf 2 – průměr = 85, směrodatná odchylka = 25,8

40. Možné výsledky testu Graf 3 – průměr = 85, směrodatná odchylka = 25,8

Graf 3 – průměr = 85, směrodatná odchylka = 25,8

41. Možné výsledky testu Graf 4 – průměr = 85, směrodatná odchylka = 25,8

Graf 4 – průměr = 85, směrodatná odchylka = 25,8

42.

Metody analýzy dat
•Parametrické a neparametrické testy
•Metody regresní a korelační analýzy
•Metody analýzy kvalitativních znaků
•Analýza časových řad
•Vícerozměrné statistické metody

43.   Sociologický výzkum

Sociologický výzkum
Anketa , dotazník
Role :
1. Výzkumník – badatel
2. Tazatel
3. Dotazovaný

44. Sociologický výzkum

Požadavek invariance - během šetření
se nemá nic měnit - jednotnost,
srovnatelnost šetření
Rozdělení rolí badatele a tazatele

45. Etapy sociologického výzkumu:

1. Sestavení projektu výzkumu
2. Určení výběr, tj. jednotek,které
budeme zkoumat
3. Rozpracování prostředků k získávání
materiálu
4. Shromažďování materiálu
5. Analýza materiálu a jeho zobecnění

46. Určení výběru (jednotek,které budeme zkoumat)

Reprezentativní
Přibližně reprezentativní
Nereprezentativní

47. Sestavení projektu výzkumu

Co chceme zkoumat a proč
Programová otázka
Zjišťovací otázka
Převod programové otázky na otázky
zjišťovací

48. Formy dotazování

Osobní
Neosobní –písemné, telefonické,
elektronické
Monotématické –speciální výzkumy
Omnibusové – spojení několika
nesouvisejících témat

49. Formy dotazování

Jednorázové
Opakované –soubor opakovaně
dotazovaných = panel

50. Rozpracování prostředků k získávání materiálu

Rozpracování prostředků
k získávání materiálu
Formy dotazování - ankety
dotazníky
rozhovory
Zásady konstrukce dotazníku
Druhy otázek
Problematika přípravy otázek
Předvýzkum
Konference o dotazníku

51. Zásady konstrukce dotazníku

Délka rozhovoru
Počet otázek
Forma otázek
Srozumitelnost
Ochota odpovídat
Problém dotazování na vzdálené
události

52. Hodnocení obsahu otázek

Zda respondent otázce porozumí
Zda je respondent schopen požadované
informace poskytnout (zda disponuje
potřebnými znalostmi, aby mohl
odpovědět)
Zda respondent bude ochoten potřebné
informace poskytnout

53. Problematika přípravy otázek

Nezjišťuje dotaz záležitost, kterou
běžný respondent nevnímá, vnímá
nepřesně, nebo pomíjivě?
Nezabraňuje nedůvěra hospodářského,
politického či společenského
charakteru objektivní odpovědi?
Nezkreslují dotázaní odpověď z
prestižních důvodů?

54. Problematika přípravy otázek

Nevzniknou potíže se správným
pochopením otázek?
Není použitý příliš abstraktní jazyk?
Vystačí jazykové schopnosti
dotázaného k tomu, aby formuloval
odpověď?

55. Problematika přípravy otázek

Nezaměřuje se výzkum na skutečnosti,
které dotázaní považují za osobní
záležitost a buď o ní nechtějí hovořit
nebo nehovoří upřímně?
Nesleduje výzkum takové skutečnosti,
které jsou technikami sociologického
šetření nezjistitelné?

56. Problematika přípravy otázek

Scénář rozhovoru
Předvýzkum
Konference o dotazníku

57. Druhy otázek

Uzavřené
Otevřené
Polootevřené
Filtrační
Identifikační
Odlehčovací
Kontaktní

58.

59.

60.

61. Statistická analýza

Zpracování :
Popisné charakteristiky třídění vždy
podle jednoho znaku (jedné odpovědi)tabulky , grafy
Zkoumání závislosti mezi dvěma
proměnnými – kontingenční tabulky.

62. Statistická analýza

Jaká byla vaše příprava na přijímací
zkoušku ?
Návštěva intenzivních přípravných kurzů


…… 150
Návštěva základních opakovacích kurzů
….. 144
Bez kurzů
… 126

63. Příprava na zkoušku

155
150
145
140
135
130
125
120
115
110
1
2
3
1
2
3
Řada1

64. Příprava na zkoušku

1
2
3

65. Statistická analýza

Jaký byl výsledek přijímací zkoušky?
Výborný ……… 130
Dobrý …………. 180
Nevyhovující ….. 110

66. Výsledek zkoušky

200
150
100
Řada1
50
0
1
2
3

67. Výsledek zkoušky

1
2
3

68. Analýza závislostí- kontingenční tabulka

A
1
2
3
Celkem
B
1
A1
2
A2
3
A3
Celkem
B1
B2
B3
n

69. Analýza závislostí

Výsledek přijímací
zkoušky
Příprava na přijímací zkoušku
Celkem
Intenzivní
kurz
Základní kurz
Žádný kurs
Výborný
60
52
18
130
Dobrý
75
68
37
180
Nevyhovující
15
24
71
110
Celkem
150
144
126
420

70. 2 test pro nezávislost

2 test pro nezávislost
2
= 87,679
2 0,05(4) = 9,488
Hodnota testového kritéria je větší než
hodnota kritická, proto nulovou
hypotézu o nezávislosti zamítáme.
Absolvování přípravných kurzů má vliv
na výsledek zkoušky.

71. Síla závislosti

Pearsonův normalizovaný koeficient
kontingence
Cn = 0,508
Závislost lze charakterizovat jako
středně silnou

72. Závěry výzkumu

Úvod – kdo zadal a kdo uskutečnil
výzkum
Cíl a předmět výzkumu
Metodika – charakteristika souboru,
metoda sběru dat, termín sběru
Výsledková část
Závěry
English     Русский Rules