2024. augusztus 31., szombat

33. Statisztikai adatgyűjtés

Forrás: https://www.tankonyvkatalogus.hu/storage/pdf/OH-MAT12TA__teljes.pdf

BEVEZETŐ

A XX. század első évtizedeiben népszerű amerikai magazin volt a The Literary Digest.
Ismert volt közvélemény-kutatásairól, és négyévente megbízható előrejelzést adott az amerikai elnökválasztás kimeneteléről.
Ennek ellenére 1936-ban nagyot tévedtek.
A felvett 2,4 millió válasz alapján magabiztos (+19%) befutónak vélték Alfred Landont, ám Franklin Delano Roosevelt elsöprő fölénnyel (+24%) győzött.
Mi okozhatta a közvélemény-kutatás ekkora tévedését?
A hibához többek között az is hozzájárult, hogy a saját olvasóikat, illetve az autó- és telefontulajdonosokat kérdezték meg.
Mindhárom csoportba a vagyonosabb amerikaiak tartoztak, így a felmérés nagyon erősen torzított.
Ugyanekkor a Gallup, egy amerikai elemző- és tanácsadócég már 50 000 fős reprezentatív minta alapján pontos becslést adott a végeredményre.

ELMÉLET

Reprezentatív minta

A statisztikai adatgyűjtés során gondosan meg kell határozni a gyűjtés körülményeit, a gyűjtés módszertanát és a kiválasztott mintát.
Akkor mondunk reprezentatívnak egy mintavételt, ha a mintához tartozó adatok megfelelő módon tükrözik a teljes adatsokaságot.
Több kritériumnak is teljesülnie kell ahhoz, hogy reprezentatív mintáról beszélhessünk.
Fontos kritérium, hogy ha a válaszadókat több, egymástól elkülönülő csoportba tudjuk sorolni (például életkor, iskolai végzettség, lakókörnyezet szerint stb.), akkor a csoportokra jellemzo létszámarányok közelítoleg ugyanazok legyenek a mintában, mint a teljes adatsokaságban.
A minta nagysága is lényeges szempont.

FELADAT

1. Egy város önkormányzata az alábbi statisztikát készítette a helyi lakosságról:
Legmagasabb iskolai végzettség Legfeljebb alapfokú Szakiskolai Érettségi Felsőfokú
nők 1927 1281 2271 1121
Férfiak 1610 1963 1845 982
Ez a táblázat 8 osztályba sorolta a lakosságot.
a) Állíts össze ezeknek a szempontoknak megfelelően a teljes lakosságból egy 2000 fős, a táblázattal megadott 8 osztályba sorolt reprezentatív mintát!
Eredményeidet táblázatban add meg!

b) Mennyi annak a valószínűsége, hogy a város teljes lakosságából véletlenszerűen kiválasztott személy férfi , és a legmagasabb végzettsége szakiskola?

c) Mennyi annak a valószínűsége, hogy a 2000 fős mintádból véletlenszerűen kiválasztott személy férfi , és a legmagasabb végzettsége szakiskola?

d) Mennyi annak a valószínűsége, hogy a 2000 fős mintádból véletlenszerűen kiválasztott személy érettségizett nő?
(Vigyázz, nem biztos, hogy az érettségi a legmagasabb végzettsége!)



2. Egy élelmiszer-áruház reprezentatív felmérés keretében arról kérdezte meg vásárlóit, hogy van-e törzsvásárlói kártyájuk, illetve hogy igénybe veszik-e az áruház által felkínált kuponokat.
A válaszadók 60%-ának van törzsvásárlói kártyája, 25%-uk használja a kuponokat.
A felmérésben részt vevok 12%-a válaszolt igennel mindkét kérdésre.
a) Készíts Venn-diagramot a vásárlókról, köztük a törzsvásárlókról és a kuponhasználókról!
Írd a Venn-diagram megfelelő tartományaiba, hogy a vásárlók hány százaléka tartozik a felmérés szerint ahhoz a csoporthoz!

b) Mennyi a valószínűsége, hogy egy véletlenszerűen kiválasztott vásárló használja a két kedvezmény valamelyikét?

c) Az áruház becslése szerint körülbelül 10 000 vásárlójuk van.
Közülük hányan nem élnek a fenti lehetoségek egyikével sem?



3. Egy biztosító a náluk biztosított 5000 személygépkocsiról baleseti statisztikát készített 5000 ügyfelük megkérdezésével.
Megállapították, hogy ezen ügyfelek 72%-a napi rendszerességgel vezet gépkocsit.
Az elmúlt 12 hónapban az 5000 ügyfél közül 6% volt érintett különféle gépjárműbalesetekben.
A statisztikából azonban az is kiderült, hogy a nem rendszeresen vezetok között ez az arány 9%.
a) A nem rendszeres vezetok közül hánynak volt balesete?

b) Hány rendszeresen vezeto ügyfél volt érintett autóbalesetben az elmúlt évben?

c) Mekkora a valószínűsége, hogy a balesetben érintett ügyfelek közül egyet tetszőlegesen kiválasztva éppen egy rendszeres vezetőt választunk?


HÁZI FELADAT

1. Az alábbi táblázat a KSH 2021-es adatai alapján készült.
A külföldi látogatók számát tartalmazza (ezer fore kerekítve) 15 osztályba sorolva.
2021-ben a táblázatban megadott országokból érkezett a legtöbb látogató Magyarországra.
Románia Szlovákia Ausztria Lengyelország Németország
1 napos látogatók 8528 5710 4800 1167 1038
1–3 éjszakát eltöltok 458 492 520 82 540
4 vagy több éjszakát eltöltők 274 93 409 233 910
Összesen
Az alábbi 1000 fős minta azt mutatja, hogy a magyarországi tapasztalataikról hány látogatót kérdeztek meg az egyes osztályokból.
Románia Szlovákia Ausztria Lengyelország Németország
1 napos látogatók 293 188 160 35 69
1–3 éjszakát eltöltők 38 52 34 9 10
4 vagy több éjszakát eltöltők 34 10 32 16 20
Összesen
a) Töltsd ki a táblázatok utolsó sorait!

b) Keress érveket amellett, hogy az 1000 fős minta nem reprezentatív!

c) Mutasd meg, hogy a látogatók nemzetek szerinti eloszlását tekintve a minta reprezentatívnak tekinthető!

d) Ha véletlenszerűen kiválasztunk egy olyan látogatót, aki legfeljebb 3 éjszakára marad (az összes látogatóból, az első táblázat adatai szerint), akkor mennyi a valószínűsége, hogy német?


NÉV:
Azonosító:
Eredmény: /