..::BMF Levelezős Hallgatóinak Oldala::..
Keress a Google-n!
Google
 
Menü
 
Google
 
UNITELSHOP

Unitel City Distribution Partner

 
Magyarorszag.hu
 
Keress pénzt!

 
Lehet itt is postafiókod!!
Felhasználónév:
Jelszó:
  SúgóSúgó

Új postafiók regisztrációja
 
Bejelentkezés
Felhasználónév:

Jelszó:
SúgóSúgó
Regisztráció
Elfelejtettem a jelszót
 
 
freeaudit.hu freeaudit.hu
 
Hírek
Hírek : A leíró statisztikák

A leíró statisztikák

  2005.05.11. 19:58

A leíró statisztikák

A leíró statisztikák

  • A leíró statisztikák fogalma, haszna
  • A statisztikák fogalma általában
  • Leíró statisztikák:
    • a minta elemszáma (mintanagyság)
    • maximum
    • minimum
    • mintaterjedelem
    • számtani átlag
    • szórás
    • variancia
    • variációs koefficiens
    • rendezett minta
    • kvantilisek
      • medián
      • kvartilisek
      • percentilisek
    • interkvartilis terjedelem
    • korrelációs együttható
    • rang
    • rangkorreláció

A leíró statisztikák fogalma, haszna

Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az adatokból viszonylag könnyen kiszámítható paramétereket leíró statisztikáknak (vagy ritkán, de pontosabban: leíró statisztikai függvényeknek) nevezzük. Sok ilyen van, két legfontosabb csoportjuk az ún. elhelyezkedési (measures of location or central tendency) és a szóródást jellemző paraméterek (measures of spread). Az elhelyezkedési paraméterek azt az értéket igyekeznek megadni, ami körül a mintánk elemei csoportosulnak (ilyen pl. átlag, medián) míg a szóródási paraméterek azt igyekeznek jellemezni, hogy értékeink mennyire szorosan vagy lazán helyezkednek el ekörül a pont körül (pl. szórás).
Előfordul, hogy a minta elemeiről nem csak egyfajta adattal rendelkezünk. Kétféle adat esetén, így összetartozó értékpárok jönnek létre (pl. emberek mintájában a testsúly és testmagasság). Az értékpárok közötti összefüggésről adnak információt a kapcsolatot jellemző paraméterek (measures of correlation).

A legfontosabb leíró statisztikák

Elhelyezkedést Szóródást Kapcsolatot
jellemző statisztikák
átlag szórás
(tapasztalati)
korrelációs együttható
(r, r2)
medián interkvartilis terjedelem rangkorreláció

A leíró statisztikák közül azok a legfontosabbak, amelyek a mintánkat adó populáció elméleti eloszlásfüggvényének valamelyik paraméterére adnak jó becslést a mintánkból. A leíró statisztikák gyakorlati alkalmazhatóságának ez az elméleti alapja. Itt csak annyit jegyzünk meg, hogy pl. a mintánkból meghatározott számtani átlag a populáció eloszlásfüggvényének várható értékére ad ->torzítatlan becslést. A mintából számított (ún. tapasztalati) szórás pedig a populáció eloszlásfüggvényét jellemző (ún. elméleti) szórás paraméter becslését adja.

A képet tovább bonyolítja, hogy a statisztikák a minta választásának esetlegessége miatt maguk is valószínűségi változók, melyeknek meghatározható az eloszlásfüggvénye, sőt ennek paraméterei becsülhetők, éspedig ismét valamilyen statisztikával. Ezt a következő példán illusztrálhatjuk. Nagyon gyakori, hogy összekeverik a mintából számított tapasztalati szórást (SD) az ugyancsak a mintából számítható 'átlag szórása' (standard error of the mean, SE) nevű paraméterrel. Sokan úgy gondolják, hogy a kettő lényegében ugyanaz, csak éppen az SE kisebb, mint az SD, ezért jobban fest a grafikonokon. Valójában az SE a mintaátlag (mint statisztika) elméleti eloszlásfüggvénye ismeretlen szórásparaméterének a becslése. Azt is mondhatjuk, hogy az SD egyszerű statisztika, az SE pedig egy statisztika statisztikája, tehát egy fokkal bonyolultabb fogalom.

A statisztikák fogalma általában

Matematikailag statisztikai függvénynek vagy röviden statisztikának neveznek minden olyan (rendszerint skaláris, olykor vektorértékű) függvényt, amelynek értelmezési tartománya a mintatér. (Magyarul statisztika az, ami az adatainkból egy képlettel kiszámítható, vagy más módon meghatározható.) Az említett leíró statisztikákon kívül igen fontosak még a hipotézisvizsgálatoknál használt statisztikák (pl. t, F statisztika).
Hipotézisvizsgálathoz használt statisztikák -> hipotézisvizsgálatok

A leíró statisztikák

Az alább ismertetett statisztikák java része csak numerikus skálájú adatokon értelmezhető. Zárójelben megadtuk a kérdéses szakkifejezés angol megfelelőjét is.
A minta elemszáma (mintanagyság, sample size)
Ez a legegyszerűbb, s egyben egyik legfontosabb leíró statisztika. Rendszerint n betűvel jelöljük (latin numerus=szám).
Maximum
A legnagyobb előforduló számérték.
Minimum
A legkisebb előforduló számérték.
Mintaterjedelem (range)
A legnagyobb (maximum) és legkisebb (minimum) előforduló számérték különbsége. Akkor használjuk csak, ha hangsúlyozni kívánjuk a mintánkban előforduló extrém értékeket (vagy éppen ellenkezőleg, az igen kicsi szóródást).
Számtani átlag (mean, arithmetic mean)
Az értékek összege, osztva az elemszámmal. A legjobban ismert, leggyakrabban használt paraméter az eloszlás elhelyezkedésének becslésére. Érdemes tudni, hogy erősen érzékeny a mintában esetleg előforduló kilógó (outlier) értékekre. Ilyenkor célszerűbb a medián használata. Ugyancsak félrevezető lehet az átlag erősen ferde eloszlás esetén.
Variancia, tapasztalati szórásnégyzet (variance)
Az adatoknak az átlagtól való négyzetes eltéréseinek átlaga (pontosabban az elemszám helyett n-1-gyel szokás osztani a ->>{torzítatlan becslés} érdekében.). (latin variantia = különbözőség) Bár az elméleti statisztikában fontos fogalom, a gyakorlatban helyette az SD használatos.
Szórás, tapasztalati szórás (standard deviation)
A variancia négyzetgyöke. Jelölésére az angol kifejezés rövidítését (SD) használjuk. Mint fentebb említettük, nem tévesztendő össze az átlag szórásával (SE vagy SEM = standard error of the mean). Az SD a legfontosabb, adataink szóródását jellemző paraméter. Fontos tudnunk azonban, hogy értéke függ adataink mértékegységétől, így két adathalmaz szórása csak akkor hasonlítható össze, ha ugyanazt a mértékegységet használtuk. Egységfüggetlen mérőszám viszont a következő statisztika.
Variációs koefficiens (coefficient of variation, CV)
A szórás százalékos aránya az átlaghoz viszonyítva. Méréskor ez nem más, mint a relatív hiba. Dimenzió nélküli szám, bármely adathalmaz variációs koefficiense összehasonlítható.
Rendezett minta
Az eredeti minta, az előforduló értékek nagysága szerint sorba rendezve. (pl. egy iskolai osztály a tornasorban, ha a tanulók magasságát vizsgáljuk). Önmagában nem használjuk, de több fontos további statisztika meghatározásához nélkülözhetetlen. Ilyenek pl. a következőkben ismertetendő kvantilisek. A rendezett minta és a belőle származtatott további statisztikák értelmezéséhez nem szükséges, hogy adataink numerikusak legyenek, elég, ha ordinális skálán mérhetők.
Kvantilisek: (quantiles) A rendezett mintából tovább származtatott statisztikák összefoglaló neve, amikor a rendezett mintát több egyenlő részre osztjuk, és a részhatárokon levő mintaelemek értékét tekintjük. (latin quantum = mennyi, ti. hány részre osztjuk a mintát)
Medián (median)
A medián (latin medius = középső) annak az adatnak a számértéke, amelyik a rendezett minta közepén van (pl. egy iskolai osztályban a magasságértékek mediánja a tornasor közepén álló tanuló magassága). Mint említettük, jó tulajdonsága, hogy sokkal kevésbé érzékeny a kilógó (outlier) értékekre, mint az átlag, továbbá ferde eloszlások esetén is használhatóbb. Ordinális skála esetén az átlag értelmezhetetlen, míg a medián igen.
Kvartilisek (quartiles)
Az alsó kvartilis (latin quarta pars = negyedrész) a legkisebb és a medián között középen elhelyezkedő adat számértéke a rendezett mintában. (A tornasorban a legkisebb és a középső diák között középen levő tanuló magassága).
A felső kvartilis hasonlóan a medián és a legnagyobb érték között van középen. A kvartilisek az SD-hez hasonlóan az adatok szóródásáról tájékoztatnak, elsősorban ferde eloszlás esetén érdemes őket használni. (A kvartilisek mutatják a ferdeséget, az SD nem).
Percentilisek (percentiles)
Ha elég adatunk van, akkor percentilisek is definiálhatók. (latin per centum = százalék) Pl. az n%-os (vagy n-edik) percentilis azt jelenti, hogy az adatok n%-a kisebb, mint ez az érték. (Így a medián az 50%-os percentilisnek, az alsó és felső kvartilisek pedig a 25% ill. 75%-os percentilisnek felelnek meg.) A percentiliseknek óriási jelentősége van a 'mit tekintünk normálisnak?' kérdés eldöntésében. Az alsó és felső néhány percentilis közötti részt (2.5% - 97.5% vagy 5% - 95%) szokás normális (referencia) értéknek elfogadni. Akkor szokás pl. egy gyermekről feltételezni, hogy elmaradt a növekedésben, ha magassága (vagy súlya) nem éri el az azonos korú társaira jellemző 5%-os percentilis értéket. A laboratóriumi normálértékeket is a megfelelő percentilisek alapján definiálják.
A percentilisek összessége valójában a tapasztalati eloszlásnak felel meg. Ilyen alapon - ha tetszik - a tapasztalati eloszlásfüggvényt (és az abból származtatott dolgokat, pl. a hisztogramot) is tekinthetjük statisztikának.
Interkvartilis terjedelem (interquartile range)
A felső és alsó kvartilis különbsége. Ugyanakkor használatos, amikor a kvartilis.
Korrelációs együttható (correlation coefficient)
Pearson féle korrelációs együtthatónak is nevezik. Összetartozó értékpárok lineáris kapcsolatát jellemző, dimenzió nélküli szám. Kétféle módon adják meg: r a jele a tulajdonképpeni korrelációs együtthatónak, míg r2 (az előbbi négyzete) hivatalos megnevezése: coefficient of determination. A tökéletes pozitív lineáris összefüggés esetén r = 1, tökéletes negatív lineáris összefüggés esetén r = -1, míg függetlenség esetén r = 0. A korrelációs együtthatóval kapcsolatban gyakoriak a félreértések. Ezek részletesen olvashatók a Változók összefüggései c. fejezetben. Fontos tudni, hogy a korrelációs együttható értéke erősen függ a kilógó értékektől.
Rang (rank)
Ezt a statisztikát úgy kapjuk, ha a rendezett mintában minden elem értékét a rendezésben elfoglalt sorszámával helyettesítünk. Mint a rendezett mintát, ezt a statisztikát sem önmagában használjuk, hanem további statisztikákat származtatunk belőle.
Rangkorreláció (rank correlation)
A rangokból számított korrelációs együttható (Spearman féle korrelációs együtthatónak is nevezik). Akkor használjuk az eredeti Pearson féle korrelációs együttható helyett, ha az adatpárok közül legalább egy nem numerikus, hanem ordinális skálájú, vagy ha az eloszlás nagyon ferde, esetleg kilógó értékek vannak a mintában.

Ugrások: hipotézisvizsgálatok, torzítatlan becslés, Változók összefüggései

 
Kedvenc oldalak
 
Google
 
OnlineRádió

Online rádióhallgatás:

 
Valami kellene, de nem kapod meg sehol sem? Nézd meg itt!
Válogass termékeink közül - licitálj - vagy add el amire már nincs szükséged! Kattints ide!
 
Keress! Licitálj! Vedd meg! Add el! :-))
Csak különleges ajánlatok!

Csak különleges ajánlatok!



 
Chat -- Online
Név:

Üzenet:
:)) :) :@ :? :(( :o :D ;) 8o 8p 8) 8| :( :'( ;D :$
 
Látogatottság!
Indulás: 2004-11-23
 

Dryvit, hõszigetelés! Vállaljuk családi házak, nyaralók és egyéb épületek homlokzati szigetelését! 0630/583-3168 Hívjon!    *****    A legfrissebb hírek a Super Mario világából és a legteljesebb adatbázis a Mario játékokról.Folyamatosan bõvülõ tartalom.    *****    Gigágá! Márton napján is gyertek a Mesetárba! Nemcsak libát, de kacsát is kaptok! Játsszatok velünk!    *****    A Nintendo a Nintendo Music-kal megint valami kiváló dolgot hozott létre! Alaposan nagyító alá vettem, az eredmény itt.    *****    Leanderek, Parfümök, Olajok, és Szépségápolási termékek! Használd a LEVI10 kupont és kapj 10% kedvezményt!Megnyitottunk    *****    Megjelent a Nintendo saját gyártású órája, a Nintendo Sound Clock Alarmo! Ha kíváncsi vagy, mit tud, itt olvashatsz róla    *****    Megnyílt a webáruházunk! Parfümök, Szépségápolási termékek, Olajok mind egy helyen! Nyitási akciók, siess mert limitált!    *****    Az általam legjobbnak vélt sportanimék listája itt olvasható. Top 10 Sportanime az Anime Odyssey-n!    *****    Pont ITT Pont MOST! Pont NEKED! Már fejlesztés alatt is szebbnél szebb képek! Ha gondolod gyere less be!    *****    Megnyílt a webáruházunk! NYITÁSI AKCIÓK! Tusfürdõ+Fogkrém+Sampon+Izzadásgátló+multifunkcionális balzsam most csak 4.490!    *****    Új mese a Mesetárban! Téged is vár, gyere bátran!    *****    Veterán anime rajongók egyik kedvence a Vadmacska kommandó. Retrospektív cikket olvashatsz róla az Anime Odyssey blogban    *****    Parfümök, Olajok, Párologtatók mind egy weboldalon! Siess mert nyitási AKCIÓNK nem sokáig tart! Nagy kedvezmények várnak    *****    Dryvit, hõszigetelés! Vállaljuk családi házak, nyaralók és egyéb épületek homlokzati szigetelését! 0630/583-3168 Hívjon!    *****    Aki érdeklõdik a horoszkópja után, az nem kíváncsi, hanem intelligens. Rendeld meg most és én segítek az értelmezésben!    *****    A Múzsa, egy gruppi élményei a színfalak mögött + napi agymenések és bölcseletek    *****    KARATE OKTATÁS *** kicsiknek és nagyoknak *** Budapest I. II. XII.kerületekben +36 70 779-55-77    *****    Augusztus 26-án Kutyák Világnapja! Gyertek a Mesetárba, és ünnepeljétek kutyás színezõkkel! Vau-vau!    *****    A horoszkóp elemzésed utáni érdeklõdés, nem kíváncsiság hanem intelligencia. Rendeld meg és nem fogod megbánni. Katt!!!    *****    Cikksorozatba kezdtem a PlayStation történelmérõl. Miért indult nehezen a Sony karrierje a konzoliparban?