Uvod
Standard Dzrakoplovstvo (SD) i Standard Error (SE) naizgled su slične terminologije; Međutim, oni su pojmovno toliko raznoliki da se u literaturi o statistici gotovo naizmjenično koriste. Oba termina obično prethode znaku plus-minus (+/-), što ukazuje na činjenicu da oni definiraju simetričnu vrijednost ili predstavljaju raspon vrijednosti. Neizmjenično se oba termina pojavljuju s prosjekom (srednjim) skupa izmjerenih vrijednosti.
Zanimljivo je da SE nema nikakve veze sa standardima, s pogreškama ili s komuniciranjem znanstvenih podataka.
Detaljan pogled na podrijetlo i objašnjenje SD i SE otkrit će zašto profesionalni statističari i oni koji ga oprezno koriste, obojica imaju tendenciju greške.
Standardno odstupanje (SD)
SD je a opisni statistika koja opisuje širenje distribucije. Kao metrika korisna je kada se podaci normalno distribuiraju. Međutim, manje je koristan kada su podaci izrazito iskrivljeni ili bimodalni jer to ne opisuje baš dobro oblik distribucije. Mi obično koristimo SD pri prijavljivanju karakteristika uzorka, jer to namjeravamo opisati koliko se podaci razlikuju oko srednje vrijednosti. Ostale korisne statistike za opisivanje širenja podataka su interkvartilni raspon, 25. i 75. postotil i raspon podataka.
Slika 1. SD je mjera širenja podataka. Kad su podaci uzorak iz normalno raspodijeljene distribucije, očekuje se da će dvije trećine podataka ležati unutar 1 standardnog odstupanja od prosjeka.
Varijanca je a opisni statistika također, a definira se kao kvadrat standardnog odstupanja. Obično se ne izvještava pri opisivanju rezultata, ali je matematički formula koja se može pratiti (a.k.a. zbroj odstupanja u kvadratu) i igra ulogu u proračunu statistike..
Na primjer, ako imamo dvije statistike P & P s poznatim varijankama var(P) & var(Q), zatim varijanca zbroja P + Q jednak je zbroju varijacija: var(P) +var(Q). Sada je vidljivo zašto statističari vole razgovarati o odstupanjima.
Ali standardna odstupanja imaju važno značenje za širenje, posebno kada se podaci normalno raspodjeljuju: Srednja vrijednost +/ - 1 SD može se očekivati da će uzeti 2/3 uzorka, a interval interval +- 2 SD može se očekivati da će obuhvatiti 95% uzorka.
SD pruža naznaku u kojoj mjeri pojedinačni odgovori na pitanje variraju ili odstupaju od prosjeka. SD kaže istraživaču kako su rašireni odgovori - jesu li koncentrirani oko srednje vrijednosti, ili su raštrkani daleko i široko? Jesu li svi vaši ispitanici ocijenili vaš proizvod na sredini vaše skale ili su ga neki odobrili, a neki ne odobrili?
Razmotrite eksperiment u kojem se od ispitanika traži da ocjenjuju proizvod na nizu atributa na skali od 5 bodova. Prosjek za skupinu od deset ispitanika (s dolje navedenim oznakama „od A“ do „J“) za „dobru vrijednost za novac“ bio je 3,2, a SD je iznosio 0,4, a prosjek „pouzdanost proizvoda“ bio je 3,4, a SD je iznosio 2,1.
Na prvi pogled (gledajući samo na sredstva) čini se da je pouzdanost ocijenjena višom od vrijednosti. No, viši SD za pouzdanost mogao je ukazati (što je prikazano u distribuciji ispod) da su odgovori vrlo polarizirani, gdje većina ispitanika nije imala problema s pouzdanošću (ocjenjivao je atribut „5“), ali je manji, ali važan segment ispitanika problem pouzdanosti i ocijenio je atribut „1“. Gledajući samo sredstvo govori samo dio priče, međutim, to se istraživači češće usredotočuju. Raspodjela odgovora je važno uzeti u obzir i SD pruža vrijednu opisnu mjeru ovoga.
tuženik | Dobra vrijednost za novac | Pouzdanost proizvoda |
3 | 1 | |
B | 3 | 1 |
C | 3 | 1 |
D | 3 | 1 |
E | 4 | 5 |
F | 4 | 5 |
G | 3 | 5 |
H | 3 | 5 |
ja | 3 | 5 |
J | 3 | 5 |
srednja | 3.2 | 3.4 |
Std. Dev. | 0.4 | 2.1 |
Prvo istraživanje: Ispitanici ocjenjuju proizvod na skali od 5 bodova
Dvije vrlo različite distribucije odgovora na 5-bodnu ljestvicu mogu dati istu sredinu. Razmotrite sljedeći primjer koji prikazuje vrijednosti odziva za dvije različite ocjene.
U prvom primjeru (ocjena „A“) SD je nula jer su SVI odgovori bili točno srednja vrijednost. Pojedinačni odgovori uopće nisu odstupili od prosjeka.
U ocjeni "B", iako je prosjek grupe isti (3,0) kao i prva distribucija, Standard Deviacija je veća. Standardno odstupanje od 1,15 pokazuje da su pojedinačni odgovori u prosjeku * bili nešto više od 1 boda od srednjeg.
tuženik | Ocjena „A“ | Ocjena „B“ |
3 | 1 | |
B | 3 | 2 |
C | 3 | 2 |
D | 3 | 3 |
E | 3 | 3 |
F | 3 | 3 |
G | 3 | 3 |
H | 3 | 4 |
ja | 3 | 4 |
J | 3 | 5 |
srednja | 3.0 | 3.0 |
Std. Dev. | 0.00 | 1.15 |
Drugo istraživanje: Ispitanici ocjenjuju proizvod na skali od 5 bodova
Drugi način gledanja na SD je iscrtavanje raspodjele kao histogram odgovora. Distribucija s niskim SD-om prikazala bi se kao visoki uski oblik, dok bi veliki SD označio širi oblik.
SD općenito ne označava "ispravno ili pogrešno" ili "bolje ili gore" - niži SD nije nužno poželjniji. Koristi se čisto kao opisna statistika. Opisuje raspodjelu u odnosu na srednju vrijednost.
Ttehnički odricanje od odgovornosti za SD
Razmišljanje o SD-u kao "prosječnom odstupanju" izvrstan je način konceptualnog razumijevanja njegovog značenja. Međutim, on se u stvari i ne izračunava kao prosjek (da jest, nazvali bismo ga „prosječnim odstupanjem“). Umjesto toga, „standardizirana“, pomalo složena metoda izračunavanja vrijednosti koristeći zbroj kvadrata.
U praktične svrhe, računanje nije važno. Većina programa tabela, proračunskih tablica ili drugih alata za upravljanje podacima izračunavaće SD za vas. Važnije je razumjeti što statistika prenosi.
Standardna pogreška
Standardna je pogreška zaključni veznik statistika koja se koristi pri uspoređivanju uzoraka znači (prosjek) za populaciju. To je mjera od preciznost srednje vrijednosti uzorka. Srednja vrijednost uzorka je statistika izvedena iz podataka koji imaju temeljnu distribuciju. Ne možemo ga vizualizirati na isti način kao i podatke jer smo izveli jedan eksperiment i imaju samo jednu vrijednost. Statistička teorija nam govori kako se prosječna vrijednost uzorka (za veliki „dovoljno“ uzorak i pod nekoliko uvjeta regularnosti) približno normalno distribuira. Standardno odstupanje ove normalne raspodjele nazivamo standardnom pogreškom.
Slika 2. Raspodjela na dnu reprešalje distribuciju podataka, dok je distribucija na vrhu teorijska raspodjela uzorka. SD 20 je mjera širenja podataka, dok je SE 5 mjera nesigurnosti oko uzorka..
Kad želimo usporediti rezultate rezultata dvostrukog uzorka pokusa Liječenje A i Liječenje B, tada trebamo procijeniti koliko smo točno izmjerili sredstva.
Zapravo nas zanima kako smo precizno izmjerili razliku između dva sredstva. Ovu mjeru nazivamo standardnom pogreškom razlike. Možda se ne iznenadite kad saznate da je standardna pogreška razlike u sredstvima uzorka funkcija standardnih pogrešaka sredstava:
Sad kad ste shvatili da su standardna pogreška srednje vrijednosti (SE) i standardno odstupanje distribucije (SD) dvije različite zvijeri, možda se pitate kako su se oni zbunili na prvom mjestu. Iako se pojmovno razlikuju, oni matematički imaju jednostavan odnos:
,gdje je n broj točaka podataka.
Primijetite da standardna pogreška ovisi o dvije komponente: standardnom odstupanju uzorka i veličini uzorka n. Ovo ima intuitivnog smisla: što je veće standardno odstupanje uzorka, manje precizni možemo procijeniti istinsku srednju vrijednost.
Također, što je veća veličina uzorka, to više podataka imamo o populaciji i točnije možemo procijeniti pravu sredinu.
SE je pokazatelj pouzdanosti srednje vrijednosti. Mali SE je pokazatelj da je vrijednost uzorka točniji odraz stvarne srednje vrijednosti stanovništva. Veća veličina uzorka obično rezultira manjom SE (dok veličina uzorka ne utječe izravno na SD).
Većina istraživačkih istraživanja uključuje uzimanje uzorka iz neke populacije. Tada ćemo izvesti zaključke o populaciji na temelju rezultata dobivenih iz tog uzorka. Ako je izvučen drugi uzorak, rezultati vjerojatno neće točno odgovarati prvom uzorku. Ako je prosječna vrijednost za atribut ocjenjivanja bila 3,2 za jedan uzorak, to bi mogla biti 3,4 za drugi uzorak iste veličine. Ako bismo izvukli beskonačni broj uzoraka (jednake veličine) iz naše populacije, mogli bismo prikazati promatrano sredstvo kao raspodjelu. Tada bismo mogli izračunati prosjek svih naših uzoraka. To bi značilo jednaku stvarnoj vrijednosti stanovništva. Također možemo izračunati i SD distribucije uzoraka. SD ove distribucije uzoraka znači SE svake pojedinačne srednje vrijednosti uzorka.
Stoga imamo svoje najznačajnije zapažanje: SE je SD populacija srednje vrijednosti.
Uzorak | srednja |
1. | 3.2 |
2. | 3.4 |
3. | 3.3 |
4. | 3.2 |
5. | 3.1 |
... . | ... . |
... . | ... . |
... . | ... . |
... . | ... . |
... . | ... . |
srednja | 3.3 |
Std. Dev. | 0.13 |
Tablica koja prikazuje odnos SD i SE
Sada je jasno da ako nam SD iz te distribucije pomaže da shvatimo koliko je uzorak prosjek od stvarne srednje populacije, tada to možemo iskoristiti da shvatimo koliko je točno bilo koji pojedinačni uzorak u odnosu na stvarnu sredinu. To je suština SE-a.
Zapravo smo izvukli samo jedan uzorak iz naše populacije, ali ovaj rezultat možemo iskoristiti za procjenu pouzdanosti promatranog prosjeka.
U stvari, SE nam govori da možemo biti 95% sigurni da je naša promatrana vrijednost uzorka plus ili minus otprilike 2 (zapravo 1,96) Standardne pogreške iz populacije znače.
Donja tablica prikazuje raspodjelu odgovora iz našeg prvog (i jedinog) uzorka korištenog za naše istraživanje. JZ od 0,13, budući da je relativno mali, daje nam naznaku da je naša srednja vrijednost relativno blizu stvarne srednje vrijednosti naše ukupne populacije. Granica pogreške (s 95% pouzdanosti) za našu sredinu je (otprilike) dvostruko veća od ove vrijednosti (+/- 0,26), što nam govori da je istinska vrijednost najvjerojatnije između 2,94 i 3,46.
tuženik | Ocjena |
3 | |
B | 3 |
C | 3 |
D | 3 |
E | 4 |
F | 4 |
G | 3 |
H | 3 |
ja | 3 |
J | 3 |
srednja | 3.2 |
Std. pogriješiti | 0.13 |
Sažetak
Mnogi istraživači ne razumiju razliku između Standardnog odstupanja i Standardne pogreške, iako su oni često uključeni u analizu podataka. Iako stvarni proračuni za Standard Deviation i Standard Error izgledaju vrlo slično, oni predstavljaju dvije vrlo različite, ali komplementarne mjere. SD nam govori o obliku naše distribucije, koliko su pojedinačne vrijednosti podataka bliske od srednje vrijednosti. SE govori nam koliko je naša vrijednost uzorka bliska stvarnoj vrijednosti cjelokupne populacije. Zajedno pomažu u pružanju cjelovitije slike nego što nam može reći samo sredina.