Statistika

Gustina verovatnoće se povećava sa približavanjem očekivanoj (srednjoj) vrednosti u normalnoj distribuciji. Statistički parametri koja se koriste u procenama standardizovanog testiranja su prikazani. Skale obuhvataju standardne devijacije, kumulativne procente, percentilne ekvivalente, Z-skorove, T-skorove, standardne devetke, i procente u standardnim devetkama.
Dijagrami raspršenja se koriste u opisnoj statistici za prikazivanje uočenih relacija između različitih promenljivih.

Statistika je oblast matematike koja se bavi sakupljanjem, analizom, interpretacijom, objašnjavanjem i prezentacijom podataka.[1][2] Ona se primenjuje u širokom spektru akademskih disciplina, od fizike do ekonomije i sociologije.

Neke od popularnih definicija su:

  • Merijam-Vebsterov rečnik navodi da je statistika „grana matematike koja se bavi sakupljanjem, analizom, interpretacijom, i prezentacijom mase numeričkih podataka.“[3]
  • Statističar Ser Artur Lion Bouli je definisao statistiku kao „numeričku izjavu činjenica u bilo kojoj objasti ispitivanja postavljenih u međusobnu relaciju.“[4]

Matematički metodi statistike su potekli iz teorije verovatnoće, iz vremena dopisivanja Pjera Ferma i Bleza Paskala (1654). Kristijan Hajgens (1657) je dao prvo poznato naučno tretiranje ove teme. Jakob Bernuli u delu Ars Conjectandi (posthumno, 1713) i Abram d Moavr u delu Doktrina šansi (1718) su statistiku posmatrali kao granu matematike[5] U moderno doba, rad Kolmogorova je bio bitan za formulisanje osnovnog modela teorije verovatnoće koji se koristi u osnovi statistike.

Osnovna podela statistike je na deskriptivnu i inferencijalnu..[6] Deskriptivna statistika bavi se merama centralne tendencije (aritmetička sredina, medijana i mod), merama varijabiliteta (raspon, standardna devijacija, varijanca, interkvartilni raspon, semiinterkvartilni raspon i prosečno odstupanje), kao i grafičkim i tabelarnim prikazivanjem osnovnih statističkih vrednosti. S druge strane, inferencijalna statistika se odnosi na proveravanje postavljenih hipoteza (nultih i afirmativnih/alternativnih), uz pomoć statističkih testova, koeficijenata i njihove značajnosti (t-test, analiza varijance, hi-kvadrat test, koeficijenti asocijacije i korelacije, diskriminaciona analiza, Man-Vitnijev test, Test znaka ...). U statističkom žargonu, deskriptivna statistika se naziva statistikom sa malim s, a inferencijalna statistikom sa velikim S, jer je osnovni cilj deskriptivne statistike da ponudi podatke koji se dalje mogu obrađivati uz pomoć tehnika inferencijalne statistike.[7]

Druga podela se odnosi na tehnike koje se koriste u statistici. Saglasno tome, razlikuje se parametrijska i neparametrijska statistika.[8] U slučaju parametrijske statistike, proračuni se temelje na normalnoj (Gausovoj) distribuciji, dok se u slučaju neparametrijske statistike sprovode testovi koji ne moraju podrazumevati normalnost distribucije podataka kojima raspolažemo. Primeri prve grupe tehnika su: složena analiza varijanse, Pirsonov produkat - koeficijent korelacije, aritmetička sredina, standardna devijacija ... Primeri za drugu grupu tehnika su: Spirmanov koeficijent korelacije, hi-kvadratni test, Kruskal-Valisov test, medijana, moduo i sl.

Statistika je neodvojiva od teorije verovatnoće, koja predstavlja skup matematičkih modela za opisivanje odnosa između ostvarenih događaja (ishoda) i mogućih događaja. Najvažniji koncept teorije vjerovatnoće koji ima široku primenu u statistici je normalna raspodela. Standardna normalna raspodela ima aritmetičku sredinu M = 0 i standardnu devijaciju koja iznosi SD = 1. Udaljenost nekog rezultata (podatka) od aritmetičke sredine, u jedinicama standardne devijacije, predstavlja tzv. z-vrednost. Ukoliko je z-vrednost viša od nule, rezultat se nalazi iznad aritmetičke sredine. U suprotnom, dati rezultat pada ispod proseka.

Kako bi se primenila neka od statističkih tehnika/procedura, potrebno je prvo postaviti adekvatnu hipotezu. Hipoteze mogu biti nulte (gde se ne pretpostavlja razlika između dve ili više grupa ispitanika ili se ne pretpostavlja da će korelacija između nekoliko varijabli biti statistički značajna). Takođe, postoje i afirmativne hipoteze, kojima se pretpostavlja neka statistički značajna razlika ili povezanost.[9]

Primeri za nulte hipoteze su:

  • Nema statistički značajnih spolnih razlika u stavovima prema eutanaziji.
  • Ne očekuje se statistički značajna korelacija između telesne mase i inteligencije.

Primeri za afirmativne hipoteze su:

  • Postoje statistički značajne dobne razlike u vremenu reakcije na prezentirane stimuluse.
  • Postoji statistički značajna povezanost između alkoholizma i impotencije kod muškaraca.
  1. Dodge, Y (2006). The Oxford Dictionary of Statistical Terms. Oxford University Press. ISBN 978-0-19-920613-1. 
  2. Romijn, Jan-Willem (2014). „Philosophy of statistics”. Stanford Encyclopedia of Philosophy. 
  3. „Definition of STATISTICS”. www.merriam-webster.com. Pristupljeno 28. 5. 2016. 
  4. „Essay on Statistics: Meaning and Definition of Statistics” (en-US). Economics Discussion. 2. 12. 2014. Pristupljeno 28. 5. 2016. 
  5. Vidi delo The Emergence of Probability Ijana Hakinga za istoriju ranog razvoja samog koncepta matematičke verovatnoće.
  6. Lund Research Ltd.. „Descriptive and Inferential Statistics”. statistics.laerd.com. Pristupljeno 23. 3. 2014. 
  7. Devlin, K. & Lorden, G. (2007). The numbers behind NUMB3RS: Solving crime with mathematics. New York: Penguin Group.
  8. Petz, B. (2004). Osnovne statističke metode za nematematičare (peto izdanje). Jastrebarsko: Naklada Slap.
  9. „What Is the Difference Between Type I and Type II Hypothesis Testing Errors?”. About.com Education. Arhivirano iz originala na datum 27. 02. 2017. Pristupljeno 27. 11. 2015. 

Developed by StudentB