Kriteria en metodes om statistiese hipoteses te toets, voorbeelde

INHOUDSOPGAWE:

Kriteria en metodes om statistiese hipoteses te toets, voorbeelde
Kriteria en metodes om statistiese hipoteses te toets, voorbeelde
Anonim

Hipotesetoetsing is 'n noodsaaklike prosedure in statistiek. 'n Hipotesetoets evalueer twee onderling uitsluitende stellings om te bepaal watter stelling die beste deur die steekproefdata ondersteun word. Wanneer gesê word dat 'n bevinding statisties beduidend is, is dit te danke aan 'n hipotesetoets.

Verifikasiemetodes

Metodes vir die toets van statistiese hipoteses is metodes van statistiese analise. Tipies word twee stelle statistieke vergelyk, of 'n steekproefdatastel word vergelyk met 'n sintetiese datastel van 'n geïdealiseerde model. Die data moet op so 'n manier geïnterpreteer word dat dit nuwe betekenisse byvoeg. Jy kan dit interpreteer deur 'n sekere struktuur van die finale resultaat te aanvaar en statistiese metodes te gebruik om die aanname te bevestig of te verwerp. Die aanname word 'n hipotese genoem, en die statistiese toetse wat vir hierdie doel gebruik word, word statistiese hipoteses genoem.

H0- en H1-hipoteses

Daar is twee hoofdie konsepte van statistiese toetsing van hipoteses - die sogenaamde "hoof- of nulhipotese" en " alternatiewe hipotese". Hulle word ook Neyman-Pearson-hipoteses genoem. Die statistiese toetsaanname word die nulhipotese, die hoofhipotese, of kortweg H0 genoem. Dit word dikwels na verwys as die verstek aanname of die aanname dat niks verander het nie. Daar word dikwels na 'n toetsaanname-oortreding verwys as die eerste hipotese, alternatiewe hipotese of H1. H1 is snelskrif vir een of ander hipotese, want al wat ons daarvan weet is dat die H0-data weggegooi kan word.

nulhipotese toets
nulhipotese toets

Voordat die nulhipotese verwerp of nie verwerp word nie, moet die toetsresultaat geïnterpreteer word.’n Vergelyking word as statisties beduidend beskou as die verwantskap tussen die datastelle waarskynlik nie die implementering van die nulhipotese sal wees volgens die drempelwaarskynlikheid – die vlak van betekenisvolheid nie. Daar is ook goedheid-van-pas-kriteria vir statistiese hipotesetoetsing. Dit is die naam van die hipotesetoetskriterium, wat geassosieer word met die veronderstelde wet van die onbekende verspreiding. Dit is 'n numeriese maatstaf van die verskil tussen die empiriese en teoretiese verdelings.

Prosedure en kriteria vir die toets van statistiese hipoteses

Die mees algemene hipotese-seleksiemetodes is gebaseer op óf die Akaike-inligtingmaatstaf óf die Bayesiaanse koëffisiënt. Statistiese hipotesetoetsing is 'n sleuteltegniek in beide inferensie en Bayesiaanse afleiding, alhoewel die twee tipes noemenswaardige verskille het. Statistiese Hipotese Toetse'n prosedure te definieer wat die waarskynlikheid beheer om verkeerdelik op 'n verkeerde verstek- of nulhipotese te besluit. Die prosedure is gebaseer op hoe waarskynlik dit is om te werk. Hierdie waarskynlikheid om 'n verkeerde besluit te neem is die onwaarskynlikheid dat die nulhipotese waar is en dat geen spesifieke alternatiewe hipotese bestaan nie. Die toets kan nie wys of dit waar of onwaar is nie.

Metodes om statistiese hipoteses te toets
Metodes om statistiese hipoteses te toets

Alternatiewe metodes van besluiteorie

Alternatiewe metodes van besluiteorie bestaan, waarin die nul- en eerste hipoteses op 'n meer gelyke voet beskou word. Ander besluitnemingsbenaderings, soos Bayesiaanse teorie, poog om die gevolge van slegte besluite oor alle moontlikhede te balanseer eerder as om op 'n enkele nulhipotese te fokus. 'n Aantal ander benaderings om te besluit watter van die hipoteses korrek is, is gebaseer op die data, watter van hulle die verlangde eienskappe het. Maar hipotesetoetsing is die dominante benadering tot data-analise in baie velde van wetenskap.

Toets die statistiese hipotese

Wanneer een stel resultate van 'n ander stel verskil, moet 'n mens staatmaak op statistiese hipotesetoetsing of statistiese hipotesetoetse. Hul interpretasie vereis 'n behoorlike begrip van p-waardes en kritiese waardes. Dit is ook belangrik om te verstaan dat, ongeag die vlak van betekenisvolheid, toetse steeds foute kan bevat. Daarom is die gevolgtrekking dalk nie korrek nie.

Die toetsproses bestaan uitveelvuldige stappe:

  1. 'n Aanvanklike hipotese word vir navorsing geskep.
  2. Relevante nul- en alternatiewe hipoteses word aangedui.
  3. Verduidelik statistiese aannames oor die steekproef in die toets.
  4. Bepaal watter toets toepaslik is.
  5. Kies die beduidendheidsvlak en die waarskynlikheidsdrempel waaronder die nulhipotese verwerp sal word.
  6. Die verspreiding van die nulhipotese toetsstatistiek toon die moontlike waardes waarteen die nulhipotese verwerp word.
  7. Berekening aan die gang.
  8. 'n Besluit word geneem om die nulhipotese te verwerp of te aanvaar ten gunste van 'n alternatief.

Daar is 'n alternatief wat 'n p-waarde gebruik.

Voorbeelde van toetsing van statistiese hipoteses
Voorbeelde van toetsing van statistiese hipoteses

Betekenistoetse

Suiwer data is van geen praktiese nut sonder interpretasie nie. In statistiek, wanneer dit kom by die vra van vrae oor data en die interpretasie van resultate, word statistiese metodes gebruik om die akkuraatheid of waarskynlikheid van antwoorde te verseker. Wanneer statistiese hipoteses getoets word, word hierdie klas metodes statistiese toetsing, of beduidendheidstoetse, genoem. Die term “hipotese” herinner aan wetenskaplike metodes, waar hipoteses en teorieë ondersoek word. In statistiek lei 'n hipotesetoets tot 'n hoeveelheid gegewe 'n gegewe aanname. Dit laat jou toe om te interpreteer of 'n aanname waar is of 'n oortreding gemaak is.

Statistiese interpretasie van toetse

Hipotesetoetseword gebruik om te bepaal watter navorsingsresultate sal lei tot die verwerping van die nulhipotese vir 'n voorafbepaalde vlak van betekenis. Die resultate van 'n statistiese hipotesetoets moet geïnterpreteer word sodat daar verder gewerk kan word. Daar is twee algemene vorme van statistiese hipotesetoetskriteria. Dit is p-waarde en kritieke waardes. Afhangende van die geselekteerde maatstaf, moet die resultate wat verkry word verskillend geïnterpreteer word.

Wat is 'n p-waarde

Uitset word beskryf as statisties beduidend wanneer die p-waarde geïnterpreteer word. Trouens, hierdie aanwyser beteken die waarskynlikheid van fout as die nulhipotese verwerp word. Met ander woorde, dit kan gebruik word om 'n waarde te noem wat gebruik kan word om 'n toetsresultaat te interpreteer of te kwantifiseer, en om die waarskynlikheid van fout te bepaal in die verwerping van die nulhipotese. Byvoorbeeld, jy kan 'n normaliteitstoets op 'n steekproef van data uitvoer en vind dat daar min kans op uitskieter is. Die nulhipotese hoef egter nie verwerp te word nie. 'n Statistiese hipotesetoets kan 'n p-waarde gee. Dit word gedoen deur die waarde van p te vergelyk met 'n voorafbepaalde drempelwaarde wat die betekenisvlak genoem word.

Statistiese toetsing van nulhipoteses
Statistiese toetsing van nulhipoteses

Vlak van betekenis

Die vlak van betekenis word dikwels met die Griekse kleinletter "alfa" geskryf. Die algemene waarde wat vir alfa gebruik word, is 5%, of 0.05. 'n Kleiner alfawaarde dui op 'n meer betroubare interpretasie van die nulhipotese. Die p-waarde word vergelyk metvoorafgeselekteerde alfawaarde. Die resultaat is statisties betekenisvol as die p-waarde minder as alfa is. Die betekenisvlak kan omgekeer word deur dit van een af te trek. Dit word gedoen om die vertrouensvlak van die hipotese te bepaal gegewe die waargenome steekproefdata. Wanneer hierdie metode gebruik word om statistiese hipoteses te toets, is die P-waarde waarskynlikheid. Dit beteken dat in die proses om die uitslag van 'n statistiese toets te interpreteer, 'n mens nie weet wat waar of onwaar is nie.

Statistiese hipotesetoetsteorie

Verwerping van die nulhipotese beteken dat daar genoeg statistiese bewyse is dat dit waarskynlik lyk. Andersins beteken dit dat daar nie genoeg statistieke is om dit te verwerp nie.’n Mens kan aan statistiese toetse dink in terme van die tweesp alt van die verwerping en aanvaarding van die nulhipotese. Die gevaar van statistiese toetsing van die nulhipotese is dat, indien dit aanvaar word, dit dalk waar kan lyk. In plaas daarvan sal dit meer korrek wees om te sê dat die nulhipotese nie verwerp word nie omdat daar nie genoeg statistiese bewyse is om dit te verwerp nie.

Statistiese hipotese wat die goeie van pasmaatstawwe toets
Statistiese hipotese wat die goeie van pasmaatstawwe toets

Hierdie oomblik verwar dikwels beginner-ekstras. In so 'n geval is dit belangrik om jouself daaraan te herinner dat die resultaat waarskynlik is en dat selfs die aanvaarding van die nulhipotese steeds 'n klein kans op foute het.

Waar of onwaar nulhipotese

Interpretasie van die waarde van p beteken nie dat nul is niedie hipotese is waar of onwaar. Dit beteken dat 'n keuse gemaak is om die nulhipotese op 'n sekere vlak van statistiese betekenisvolheid te verwerp of nie te verwerp nie, gebaseer op die empiriese data en die gekose statistiese toets. Daarom kan die p-waarde beskou word as die waarskynlikheid van die data wat gegee word onder 'n voorafbepaalde aanname wat in die statistiese toetse ingebed is. Die p-waarde is 'n maatstaf van hoe waarskynlik die datasteekproef waargeneem sal word as die nulhipotese waar is.

Interpretasie van kritieke waardes

Sommige toetse gee nie terug bl. In plaas daarvan kan hulle 'n lys van kritieke waardes terugstuur. Die resultate van so 'n studie word op 'n soortgelyke wyse geïnterpreteer. In plaas daarvan om 'n enkele p-waarde met 'n voorafbepaalde vlak van betekenisvolheid te vergelyk, word die toetsstatistiek met 'n kritieke waarde vergelyk. As dit minder blyk te wees, beteken dit dat dit nie moontlik was om die nulhipotese te verwerp nie. Indien groter as of gelyk, moet die nulhipotese verwerp word. Die betekenis van die statistiese hipotesetoetsalgoritme en die interpretasie van die resultaat daarvan is soortgelyk aan die p-waarde. Die beduidendheidsvlak wat gekies is, is 'n waarskynlike besluit om die basistoetsaanname te verwerp of nie te verwerp nie, gegewe die data.

Foute in statistiese toetse

Die interpretasie van 'n statistiese hipotesetoets is waarskynlikheid. Die taak om statistiese hipoteses te toets is nie om 'n ware of onwaar stelling te vind nie. Toetsgetuienis kan foutief wees. Byvoorbeeld, as die alfa 5% was, beteken dit vir die grootste deel 1 uit 20die nulhipotese sal per abuis verwerp word. Of dit sal nie as gevolg van die statistiese geraas in die datamonster nie. Gegewe hierdie punt, kan 'n klein p-waarde waarteen die nulhipotese verwerp word, beteken dat dit vals is of dat 'n fout gemaak is. As hierdie tipe fout gemaak word, word die resultaat 'n vals positief genoem. En so 'n fout is 'n fout van die eerste soort wanneer statistiese hipoteses getoets word. Aan die ander kant, as die p-waarde groot genoeg is om verwerping van die nulhipotese te beteken, kan dit beteken dat dit waar is. Of is nie korrek nie, en een of ander onwaarskynlike gebeurtenis het plaasgevind as gevolg waarvan die fout gemaak is. Hierdie tipe fout word 'n vals negatief genoem.

Statistiese toetsing van nulhipoteses
Statistiese toetsing van nulhipoteses

Waarskynlikheid van foute

Wanneer statistiese hipoteses getoets word, is daar steeds 'n kans om enige van hierdie tipe foute te maak. Vals data of valse gevolgtrekkings is heel waarskynlik. Ideaal gesproke moet 'n beduidendheidsvlak gekies word wat die waarskynlikheid van een van hierdie foute minimaliseer. Byvoorbeeld, statistiese toetsing van nulhipoteses kan 'n baie lae vlak van betekenisvolheid hê. Alhoewel betekenisvlakke soos 0.05 en 0.01 algemeen in baie velde van wetenskap voorkom, is die mees gebruikte betekenisvlak 310^-7, of 0.0000003. Dit word dikwels na verwys as "5-sigma". Dit beteken dat die gevolgtrekking ewekansig was met 'n waarskynlikheid van 1 uit 3,5 miljoen onafhanklike herhalings van die eksperimente. Voorbeelde van toetsing van statistiese hipoteses dra dikwels sulke foute. Dit is ook die rede waarom dit belangrik is om onafhanklike resultate te hê.verifikasie.

Voorbeelde van die gebruik van statistiese verifikasie

Daar is verskeie algemene voorbeelde van hipotesetoetsing in die praktyk. Een van die gewildste is bekend as "Tee-proe". Dr. Muriel Bristol, 'n kollega van die stigter van biometrie, Robert Fisher, het beweer dat hy met sekerheid kon sê of dit eers by 'n koppie tee of melk gevoeg is. Fisher het aangebied om haar lukraak agt koppies (vier van elke variëteit) te gee. Die toetsstatistiek was eenvoudig: tel die aantal suksesse met die keuse van 'n beker. Die kritieke streek was die enigste sukses uit 4, moontlik gebaseer op die gewone waarskynlikheidskriterium (< 5%; 1 uit 70 ≈ 1,4%). Fisher het aangevoer dat 'n alternatiewe hipotese nie vereis word nie. Die dame het elke koppie korrek geïdentifiseer, wat as 'n statisties beduidende resultaat beskou is. Hierdie ervaring het gelei tot Fisher se boek Statistical Methods for Researchers.

Verweerder-voorbeeld

Die statistiese verhoorprosedure is vergelykbaar met 'n strafhof waar die beskuldigde onskuldig geag word totdat skuldig bewys word. Die aanklaer probeer om die skuld van die beskuldigde te bewys. Slegs wanneer daar voldoende bewyse vir 'n aanklag is, kan die verweerder skuldig bevind word. Aan die begin van die prosedure is daar twee hipoteses: "Die verweerder is nie skuldig nie" en "Die verweerder is skuldig." Die hipotese van onskuld kan slegs verwerp word wanneer fout baie onwaarskynlik is omdat 'n mens nie 'n onskuldige beskuldigde wil skuldig bevind nie. So 'n fout word 'n tipe I-fout genoem, en die voorkoms daarvanselde beheer. As gevolg van hierdie asimmetriese gedrag is Tipe II-fout, dit wil sê vryspraak van die oortreder, meer algemeen.

Statistiese Validasie Voorbeelde
Statistiese Validasie Voorbeelde

Statistieke is nuttig wanneer groot hoeveelhede data ontleed word. Dit geld eweneens vir die toetsing van hipoteses, wat die gevolgtrekkings kan regverdig selfs al bestaan geen wetenskaplike teorie nie. In die teeproe-voorbeeld was dit "duidelik" dat daar geen verskil was tussen melk in tee gooi of tee in melk gooi nie.

Regtig praktiese toepassing van hipotesetoetsing sluit in:

  • toets of mans meer nagmerries as vroue het;
  • dokument-toeskrywing;
  • Beoordeel die invloed van die volmaan op gedrag;
  • bepaal die omvang waarin 'n vlermuis 'n insek kan opspoor deur 'n eggo te gebruik;
  • kies die beste manier om op te hou rook;
  • Kyk of bufferplakkers die gedrag van die motoreienaar weerspieël.

Statistiese hipotesetoetsing speel 'n belangrike rol in statistiek in die algemeen en in statistiese afleiding. Waardetoetsing word gebruik as 'n plaasvervanger vir die tradisionele vergelyking van voorspelde waarde en eksperimentele resultaat in die kern van die wetenskaplike metode. Wanneer 'n teorie slegs in staat is om die teken van 'n verwantskap te voorspel, kan gerigte hipotesetoetse op so 'n manier gekonfigureer word dat slegs 'n statisties beduidende resultaat die teorie ondersteun. Hierdie vorm van evalueringsteorie is die mees rigiedekritiek op die gebruik van hipotesetoetsing.

Aanbeveel: