Hipotézis tesztelés - varianciaanalízis (ANOVA)

Ezután az ANOVA eljárást az öt lépéses megközelítéssel szemléltetjük. Mivel a tesztstatisztika kiszámítása érintett, a számításokat gyakran egy ANOVA táblázatba rendezik. Az ANOVA táblázat az adatok variációjának összetevőit bontja a kezelések közötti eltérésekre és a hibákra vagy a maradék variációkra. A statisztikai számítási csomagok ANOVA táblákat is készítenek az ANOVA szabványos kimenetének részeként, és az ANOVA táblázatot a következőképpen állítják fel:

teljes minta

A variáció forrása

Négyzetek összege (SS)

A szabadság fokai (df)

Átlagos négyzetek (MS)

Hiba (vagy maradék)

  • X = egyéni megfigyelés,
  • = a j-edik kezelés (vagy csoport) mintaátlaga,
  • = a teljes minta átlaga,
  • k = a kezelések vagy független összehasonlító csoportok száma, és
  • N = a megfigyelések teljes száma vagy a teljes minta nagysága.

A fenti ANOVA táblázat az alábbiak szerint rendeződik.

  • Az első oszlop a címet viseli "Variáció forrása" és meghatározza a kezelés és a hiba vagy a maradék variáció közötti különbséget. A teljes variáció a kezelés és a hibaváltozás összege.
  • A második oszlop a címet viseli "Négyzetek összege (SS)" . A négyzetek kezelési összegei közötti

és az egyes kezelések (vagy csoportok) átlagának és a teljes átlagnak a négyzetnyi különbségével összegzik. A négyzetbeli különbségeket súlyozzuk a csoportonkénti mintanagysággal (nj). A négyzetek hibaösszege:

és az egyes megfigyelések és a csoportok átlagának négyzetbeli különbségeinek összegzésével (azaz az 1. és az 1. csoport egyes megfigyelései közötti négyzetbeli különbségek, a 2. és a 2. csoport egyes megfigyelései közötti négyzetbeli különbségek és így tovább). A kettős összegzés (SS) az egyes kezeléseken belüli négyzetbeli különbségek összegzését jelzi, majd ezek összértékeinek összegzését a kezelések között, hogy egyetlen értéket kapjon. (Ezt a következő példák szemléltetik). A négyzetek teljes összege:

és az egyes megfigyelések és a teljes minta átlag közötti négyzetbeli különbségek összegzésével számítják ki. Az ANOVA-ban az adatokat összehasonlítási vagy kezelési csoportok szerint rendezik. Ha az összes adatot egyetlen mintába egyesítenék, az SST az összesített vagy a teljes mintán kiszámított minta varianciájának számlálóját tükrözné. Az SST nem szerepel közvetlenül az F statisztikában. Azonban SST = SSB + SSE, tehát ha két négyzetösszeg ismert, a harmadik kiszámítható a másik kettőből.

  • A harmadik oszlop tartalmazza: a szabadság fokai . A kezelési szabadságfokok között df1 = k-1. A hiba szabadsági foka df2 = N - k. A teljes szabadságfok N-1 (és az is igaz, hogy (k-1) + (N-k) = N-1).
  • A negyedik oszlop tartalmazza: "Mean Squares (MS)" amelyeket négyzetösszegek (SS) és szabadságfokok (df) felosztásával számolunk, soronként. Pontosabban: MSB = SSB/(k-1) és MSE = SSE/(N-k). Az SST/(N-1) osztása a teljes minta varianciáját eredményezi. Az F statisztika az ANOVA táblázat jobb szélső oszlopában található, és az MSB/MSE arány felvételével kerül kiszámításra.

Klinikai vizsgálatot végeznek a súlycsökkentő programok összehasonlítására, és a résztvevőket véletlenszerűen hozzárendelik az egyik összehasonlító programhoz, és tanácsot adnak nekik a kijelölt program részleteiről. A résztvevők 8 hétig követik a kijelölt programot. Az érdekes eredmény a súlycsökkenés, amelyet a vizsgálat kezdetén mért súlykülönbségként határoznak meg (kiindulási érték) és a vizsgálat végén mért súly különbségként fontban mérve.