Razlika između T-TEST-a i ANOVA-e

T-TEST vs. ANOVA

Prikupljanje i izračunavanje statističkih podataka radi dobivanja srednje vrijednosti često je dug i mučan proces. T-test i jednosmjerna analiza varijance (ANOVA) su dva najčešća ispitivanja koja se koriste u tu svrhu.

T-test je test statističke hipoteze gdje statistika testa prati Studentovu t-distribuciju ako se podržava nulta hipoteza. Ovaj test se primjenjuje kada statistika ispitivanja slijedi normalnu raspodjelu i ako je poznata vrijednost pojma skaliranja u statistici testa. Ako je termin skaliranja nepoznat, on se zamjenjuje procjenom na temelju dostupnih podataka. Statistika testa uslijedit će na Studentovu t-distribuciju.

William Sealy Gosset predstavio je t-statistiku 1908. Gosset je bio ljekar kemijske pivovare Guinness u Dublinu, Irska. Guinnessova pivovara vodila je politiku zapošljavanja najboljih diplomanata iz Oxforda i Cambridgea, birajući one koji bi mogli pružiti primjene biokemije i statistike u etabliranim industrijskim procesima. William Sealy Gosset bio je jedan takav diplomski rad. U tom je postupku William Sealy Gosset osmislio t-test, koji je prvobitno bio zamišljen kao način praćenja kvalitete stout-a (tamnog piva koje pivovara proizvodi) na ekonomičan način. Gosset je test objavio pod nazivom olovke 'Student' u Biometriki, oko 1908. Razlog za ime olovke bilo je Guinnessovo inzistiranje, jer je tvrtka htjela zadržati svoju politiku korištenja statistika kao dijela svojih 'poslovnih tajni'.

Statistika T-testa općenito slijedi oblik T = Z / s, gdje su Z i s funkcije podataka. Z varijabla Z je dizajnirana tako da bude osjetljiva na alternativnu hipotezu; Učinkovito, jačina Z varijable je veća kada je alternativna hipoteza istinita. U međuvremenu, 's' je parametar skaliranja, koji omogućuje određivanje distribucije T. Pretpostavke na kojima se temelji t-test su da a) Z slijedi standardnu ​​normalnu distribuciju pod nultom hipotezom; b) ps2 slijedi Ï ‡ 2 distribuciju s p stupnjevima slobode pod nultom hipotezom (gdje je p pozitivna konstanta); i c) Z vrijednost i s vrijednost su neovisni. U određenoj vrsti t-testa, ti su uvjeti posljedica populacije koja se proučava, kao i načina uzorkovanja podataka..

S druge strane, analiza varijance (ANOVA) zbirka je statističkih modela. Iako su istraživači i statističari dugo koristili principe ANOVA-e, sir Ronald Fisher dao je prijedlog za formalizaciju analize varijance u članku pod naslovom "Korelacija između srodnika sa pretpostavkom mendelijskog nasljedstva" tek 1918. godine. , Od tada je ANOVA proširena u svom djelokrugu i primjeni. ANOVA je zapravo pogrešan naziv, jer nije izveden iz razlika varijacija, već iz razlika između sredstava skupina. To uključuje pridružene postupke kod kojih je promatrana varijanca u određenoj varijabli podijeljena na komponente koje se mogu pripisati različitim izvorima varijacije.

U osnovi, ANOVA pruža statistički test kako bi se utvrdilo jesu li sredstva nekoliko skupina jednaka i, kao rezultat, t-test generalizira na više od dvije skupine. ANOVA može biti korisniji od t-testa s dva uzorka jer ima manju vjerojatnost počinjenja pogreške tipa I. Na primjer, ako imate više t-testova s ​​dva uzorka, veća je vjerojatnost počinjenja pogreške od ANOVA istih uključenih istih varijabli da bi se dobila srednja vrijednost. Model je isti, a test test statistike je F omjer. Jednostavnije rečeno, t-testovi su samo poseban slučaj ANOVE: ako radite ANOVA, isti će rezultat imati više t-testova. Postoje tri klase ANOVA modela: a) Modeli s fiksnim efektima koji pretpostavljaju da podaci potječu iz normalne populacije, razlikujući se samo u svojim sredstvima; b) Modeli slučajnih efekata koji pretpostavljaju da podaci opisuju hijerarhiju različitih populacija čije razlike ograničava hijerarhija; i c) Modeli mješovitih učinaka koji su situacije u kojima su prisutni i fiksni i slučajni učinci.

Sažetak:

  1.  T-test upotrebljava se za određivanje jesu li dva prosjeka ili sredstva jednaka ili različita. ANOVA se preferira kada se uspoređuju tri ili više prosjeka ili sredstava.
  2.  T-test ima više izgleda za pogrešku što se više sredstava koristi, zbog čega se ANOVA koristi kada se uspoređuju dva ili više sredstava.