Wat is Pearson se verspreidingswet? Die antwoord op hierdie breë vraag kan nie eenvoudig en bondig wees nie. Die Pearson-stelsel is oorspronklik ontwerp om sigbare verwronge waarnemings te modelleer. Destyds was dit welbekend hoe om 'n teoretiese model in te stel om by die eerste twee kumulante of momente van waargenome data te pas: enige waarskynlikheidsverdeling kan direk uitgebrei word om 'n groep liggingskale te vorm.
Pearson se hipotese oor die normale verspreiding van kriteria
Behalwe in patologiese gevalle, kan die liggingskaal gemaak word om die waargenome gemiddelde (eerste kumulant) en variansie (tweede kumulant) op 'n arbitrêre wyse te pas. Dit was egter nie bekend hoe om waarskynlikheidsverdelings te konstrueer waarin skeefheid (gestandaardiseerde derde kumulant) en kurtose (gestandaardiseerde vierde kumulant) ewe vrylik beheer kan word nie. Hierdie behoefte het duidelik geword toe probeer om bekende teoretiese modelle te pas by waargenome data,wat asimmetrie getoon het.
In die video hieronder kan jy die ontleding van Pearson se chi-verspreiding sien.
Geskiedenis
In sy oorspronklike werk het Pearson vier tipes verdelings (genommer I tot IV) geïdentifiseer bykomend tot die normale verspreiding (wat oorspronklik as tipe V bekend gestaan het). Die klassifikasie hang daarvan af of die verdelings oor 'n beperkte interval, op 'n semi-as, of op die hele reële lyn ondersteun word, en of hulle potensieel skeef of noodwendig simmetries was.
Twee weglatings is in die tweede vraestel reggestel: hy herdefinieer die tipe V-verspreiding (oorspronklik was dit net die normale verspreiding, maar nou met inverse gamma) en het die tipe VI-verspreiding ingestel. Saam dek die eerste twee artikels die vyf hooftipes van die Pearson-stelsel (I, III, IV, V en VI). In die derde referaat het Pearson (1916) bykomende subtipes bekendgestel.
Verbeter die konsep
Rind het 'n eenvoudige manier uitgevind om die parameterruimte van die Pearson-stelsel (of die verspreiding van kriteria) te visualiseer, wat hy later aangeneem het. Vandag gebruik baie wiskundiges en statistici hierdie metode. Die tipes Pearson-verdelings word gekenmerk deur twee hoeveelhede, gewoonlik genoem β1 en β2. Die eerste is die vierkant van asimmetrie. Die tweede is die tradisionele kurtosis, of die vierde gestandaardiseerde moment: β2=γ2 + 3.
Moderne wiskundige metodes definieer kurtosis γ2 as kumulante in plaas van momente, dus vir 'n normaleverspreiding het ons γ2=0 en β2=3. Hier is dit die moeite werd om die historiese presedent te volg en β2 te gebruik. Die diagram aan die regterkant wys watter tipe 'n spesifieke Pearson-verspreiding is (aangedui deur die kolletjie (β1, β2).
Baie van die skewe en/of nie-mesokurtiese verspreidings wat ons vandag ken, was nog nie bekend in die vroeë 1890's nie. Wat nou bekend staan as die beta-verspreiding is deur Thomas Bayes gebruik as die posterior parameter van die Bernoulli-verspreiding in sy 1763-vraestel oor inverse waarskynlikheid.
Die beta-verspreiding het prominent geword as gevolg van sy teenwoordigheid in die Pearson-stelsel en was tot in die 1940's bekend as die Pearson tipe I-verspreiding. Die Tipe II-verspreiding is 'n spesiale geval van Tipe I, maar dit word gewoonlik nie meer uitgesonder nie.
Die Gamma-verspreiding het uit sy eie werk ontstaan en was bekend as die Pearson Type III Normal Distribution voordat dit sy moderne naam in die 1930's en 1940's verkry het. 'n Referaat van 1895 deur 'n wetenskaplike het die Tipe IV-verspreiding, wat Student se t-verspreiding bevat, as 'n spesiale geval aangebied, wat die daaropvolgende gebruik van William Seely Gosset met etlike jare voorafgegaan het. Sy referaat van 1901 het 'n verspreiding met inverse gamma (tipe V) en beta-prime (tipe VI) aangebied.
Nog 'n mening
Volgens Ord het Pearson die basiese vorm van vergelyking (1) ontwikkel gebaseer op die formule vir die afgeleide van die logaritme van die normaalverspreidingsdigtheidfunksie (wat 'n lineêre deling deur die kwadratiese geestruktuur). Baie spesialiste is steeds besig om die hipotese oor die verspreiding van die Pearson-kriteria te toets. En dit bewys die doeltreffendheid daarvan.
Wie was Karl Pearson
Karl Pearson was 'n Engelse wiskundige en biostatistikus. Hy word gekrediteer met die skep van die dissipline van wiskundige statistiek. In 1911 het hy die wêreld se eerste departement van statistiek by die Universiteitskollege in Londen gestig en beduidende bydraes tot die velde van biometrie en meteorologie gelewer. Pearson was ook 'n voorstander van sosiale Darwinisme en eugenetika. Hy was sir Francis G alton se protégé en biograaf.
Biometrics
Karl Pearson was instrumenteel in die skepping van die skool van biometrie, wat 'n mededingende teorie was vir die beskrywing van die evolusie en oorerwing van bevolkings aan die draai van die 20ste eeu. Sy reeks van agtien referate "Wiskundige bydraes tot die evolusieteorie" het hom gevestig as die stigter van die biometriese skool van oorerwing. In werklikheid het Pearson baie van sy tyd gedurende 1893-1904 daaraan gewy ontwikkeling van statistiese metodes vir biometrie. Hierdie metodes, wat vandag wyd gebruik word vir statistiese analise, sluit die chi-kwadraattoets, standaardafwyking, korrelasie- en regressiekoëffisiënte in.
Die kwessie van oorerwing
Pearson se wet van oorerwing het verklaar dat die kiemplasma bestaan uit elemente wat van ouers geërf is, sowel as van verder afgeleë voorouers, waarvan die verhouding volgens verskillende kenmerke gewissel het. Karl Pearson was 'n volgeling van G alton, en hoewel hullewerke in sekere opsigte verskil het, het Pearson 'n aansienlike hoeveelheid van sy onderwyser se statistiese konsepte gebruik in die formulering van 'n biometriese skool vir oorerwing, soos die wet van regressie.
Skoolkenmerke
Die biometriese skool, anders as die Mendeliërs, was nie daarop gefokus om 'n meganisme vir oorerwing te verskaf nie, maar om 'n wiskundige beskrywing te verskaf wat nie kousaal van aard was nie. Terwyl G alton 'n diskontinue evolusieteorie voorgestel het waarin spesies in groot spronge sou verander eerder as klein veranderinge wat mettertyd opgehoop het, het Pearson foute in hierdie argument uitgewys en eintlik sy idees gebruik om 'n deurlopende evolusieteorie te ontwikkel. Die Mendeliërs het die diskontinue evolusieteorie verkies.
Terwyl G alton hoofsaaklik gefokus het op die toepassing van statistiese metodes vir die studie van oorerwing, het Pearson en sy kollega Weldon hul redenasie uitgebrei op hierdie gebied, variasie, korrelasies van natuurlike en seksuele seleksie.
'n Kykie na evolusie
Vir Pearson was die evolusieteorie nie bedoel om die biologiese meganisme wat die patrone van oorerwing verklaar te identifiseer nie, terwyl die Mendeliese benadering die geen as die meganisme van oorerwing verklaar het.
Pearson het Bateson en ander bioloë gekritiseer omdat hulle nie biometriese metodes in hul studie van evolusie gebruik het nie. Hy het wetenskaplikes veroordeel wat nie daarop gefokus het niestatistiese geldigheid van hul teorieë, wat sê:
"Voordat ons [enige oorsaak van progressiewe verandering] as 'n faktor kan aanvaar, moet ons nie net die aanneemlikheid daarvan toon nie, maar, indien moontlik, sy kwantitatiewe vermoë demonstreer."
Bioloë het geswig voor "amper metafisiese bespiegelings oor die oorsake van oorerwing" wat die proses van die insameling van eksperimentele data vervang het, wat wetenskaplikes eintlik in staat kan stel om potensiële teorieë te beperk.
Natuurwette
Vir Pearson was die natuurwette nuttig om akkurate voorspellings te maak en om tendense in waargenome data op te som. Die rede was die ervaring "dat 'n sekere volgorde in die verlede gebeur en herhaal het."
Daarom was die identifisering van 'n bepaalde meganisme van genetika nie 'n waardige poging vir bioloë nie, wat eerder op wiskundige beskrywings van die empiriese data moet fokus. Dit het deels gelei tot 'n bitter dispuut tussen biometriste en Mendeliërs, insluitend Bateson.
Nadat laasgenoemde een van Pearson se manuskripte verwerp het wat 'n nuwe teorie van nageslagvariasie of homotipie beskryf, het Pearson en Weldon die Biometrika-maatskappy in 1902 gestig. Alhoewel die biometriese benadering tot oorerwing uiteindelik sy Mendeliese perspektief verloor het, is die metodes wat hulle destyds ontwikkel het noodsaaklik vir die studie van biologie en evolusie vandag.