Wiskundige statistiek is 'n metodologie wat jou toelaat om ingeligte besluite te neem in die lig van onsekere toestande. Die studie van metodes vir die insameling en sistematisering van data, die verwerking van die finale resultate van eksperimente en eksperimente met massa-willekeurigheid, en die ontdekking van enige patrone is wat hierdie tak van wiskunde doen. Oorweeg die basiese konsepte van wiskundige statistiek.
Verskil met waarskynlikheidsteorie
Metodes van wiskundige statistiek sny nou saam met waarskynlikheidsteorie. Beide takke van wiskunde handel oor die studie van talle ewekansige verskynsels. Die twee dissiplines word deur limietstellings verbind. Daar is egter 'n groot verskil tussen hierdie wetenskappe. As die waarskynlikheidsteorie die kenmerke van 'n proses in die werklike wêreld op grond van 'n wiskundige model bepaal, dan doen wiskundige statistiek die teenoorgestelde - dit stel die eienskappe van die model totgebaseer op waargenome inligting.
Step
Die toepassing van wiskundige statistieke kan slegs uitgevoer word met betrekking tot ewekansige gebeure of prosesse, of eerder, op data verkry uit die waarneming daarvan. En dit gebeur in verskeie stadiums. Eerstens ondergaan die data van eksperimente en eksperimente sekere verwerking. Hulle word georden vir duidelikheid en gemak van analise. Dan word 'n presiese of benaderde skatting van die vereiste parameters van die waargenome ewekansige proses gemaak. Hulle kan wees:
- assessering van die waarskynlikheid van 'n gebeurtenis (die waarskynlikheid daarvan is aanvanklik onbekend);
- bestudering van die gedrag van 'n onbepaalde verspreidingsfunksie;
- verwagtingskatting;
- variansieberaming
- ens.
Die derde fase is die verifikasie van enige hipoteses wat voor die analise gestel is, d.w.s. die verkryging van 'n antwoord op die vraag hoe die resultate van die eksperimente met die teoretiese berekeninge ooreenstem. Trouens, dit is die hoofstadium van wiskundige statistiek. 'n Voorbeeld sou wees om te oorweeg of die gedrag van 'n waargenome ewekansige proses binne die normale verspreiding is.
Bevolking
Die basiese konsepte van wiskundige statistiek sluit algemene en steekproefpopulasies in. Hierdie dissipline is gemoeid met die studie van 'n stel sekere objekte met betrekking tot een of ander eienskap. 'n Voorbeeld is die werk van 'n taxibestuurder. Oorweeg hierdie ewekansige veranderlikes:
- lading of aantal klante: per dag, voor middagete, na middagete, …;
- gemiddelde reistyd;
- aantal inkomende aansoeke of hul aanhangsel aan stadsdistrikte en nog baie meer.
Dit is ook opmerklik dat dit moontlik is om 'n stel soortgelyke ewekansige prosesse te bestudeer, wat ook 'n ewekansige veranderlike sal wees wat waargeneem kan word.
Dus, in die metodes van wiskundige statistiek, word die hele stel voorwerpe wat bestudeer word of die resultate van verskeie waarnemings wat onder dieselfde toestande op 'n gegewe voorwerp uitgevoer word, die algemene populasie genoem. Met ander woorde, wiskundig meer streng, dit is 'n ewekansige veranderlike wat in die ruimte van elementêre gebeurtenisse gedefinieer word, met 'n klas subversamelings daarin aangewys, waarvan die elemente 'n bekende waarskynlikheid het.
Voorbeeldpopulasie
Daar is gevalle waar dit onmoontlik of onprakties is om een of ander rede (koste, tyd) om 'n deurlopende studie te doen om elke voorwerp te bestudeer. Byvoorbeeld, om elke fles verseëlde konfyt oop te maak om die kwaliteit daarvan te kontroleer, is 'n twyfelagtige besluit, en om die trajek van elke lugmolekule in 'n kubieke meter te probeer skat, is onmoontlik. In sulke gevalle word die metode van selektiewe waarneming gebruik: 'n sekere aantal voorwerpe word (gewoonlik ewekansig) uit die algemene bevolking gekies, en hulle word aan hul ontleding onderwerp.
Hierdie konsepte lyk dalk aanvanklik ingewikkeld. Daarom, om die onderwerp ten volle te verstaan, moet u die handboek van V. E. Gmurman "Waarskynlikheidsteorie en wiskundige statistiek" bestudeer. Dus, 'n steekproefstel of steekproef is 'n reeks voorwerpe wat ewekansig uit die algemene versameling gekies is. In streng wiskundige terme is dit 'n reeks onafhanklike, eenvormig verspreide ewekansige veranderlikes, waarvan die verdeling saamval met dié wat vir die algemene ewekansige veranderlike aangedui word.
Basiese konsepte
Kom ons kyk kortliks na 'n aantal ander basiese konsepte van wiskundige statistiek. Die aantal voorwerpe in die algemene populasie of steekproef word volume genoem. Die steekproefwaardes wat tydens die eksperiment verkry word, word die steekproefrealisering genoem. Ten einde 'n skatting van die algemene populasie gebaseer op 'n steekproef betroubaar te wees, is dit belangrik om 'n sogenaamde verteenwoordigende of verteenwoordigende steekproef te hê. Dit beteken dat die steekproef die populasie volledig moet verteenwoordig. Dit kan slegs bereik word as alle elemente van die populasie 'n gelyke waarskynlikheid het om in die steekproef te wees.
Voorbeelde onderskei tussen terugkeer en nie-terugsending. In die eerste geval, in die inhoud van die monster, word die herhaalde element na die algemene stel teruggekeer, in die tweede geval is dit nie. Gewoonlik, in die praktyk, word monsterneming sonder vervangings gebruik. Daar moet ook op gelet word dat die grootte van die algemene bevolking altyd die grootte van die steekproef aansienlik oorskry. Bestaanbaie opsies vir die steekproefproses:
- eenvoudig - items word ewekansig een op 'n slag gekies;
- getik - die algemene bevolking word in tipes verdeel, en 'n keuse word uit elkeen gemaak; 'n voorbeeld is 'n opname van inwoners: mans en vroue afsonderlik;
- meganies - kies byvoorbeeld elke 10de element;
- reeks - seleksie word gemaak in reekse elemente.
Statistiese verspreiding
Volgens Gmurman is waarskynlikheidsteorie en wiskundige statistiek uiters belangrike dissiplines in die wetenskaplike wêreld, veral in die praktiese deel daarvan. Beskou die statistiese verspreiding van die steekproef.
Sê nou ons het 'n groep studente wat in wiskunde getoets is. As gevolg hiervan het ons 'n stel skattings: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - dit is ons primêre statistiese materiaal.
In die eerste plek moet ons dit sorteer, of 'n rangorde-bewerking uitvoer: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - en dus 'n variasiereeks kry. Die aantal herhalings van elk van die assesserings word die assesseringsfrekwensie genoem, en hul verhouding tot die steekproefgrootte word die relatiewe frekwensie genoem. Kom ons maak 'n tabel van die statistiese verspreiding van die steekproef, of net 'n statistiese reeks:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
of
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Kom ons het 'n ewekansige veranderlike waarop ons 'n reeks eksperimente sal uitvoer en kyk watter waarde hierdie veranderlike neem. Gestel sy het die waarde a1 - m1 keer geneem; a2 - m2 keer, ens. Die grootte van hierdie monster sal m1 + … + mk=m wees. Die versameling ai, waar i wissel van 1 tot k, is 'n statistiese reeks.
Intervalverspreiding
In die boek deur VE Gmurman "Probability Theory and Mathematical Statistics" word 'n interval statistiese reeks ook aangebied. Die samestelling daarvan is moontlik wanneer die waarde van die kenmerk wat bestudeer word, deurlopend in 'n sekere interval is, en die aantal waardes groot is. Beskou 'n groep studente, of eerder, hul lengte: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 713, 1, 173 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 studente in totaal. Uiteraard is die lengte van 'n persoon 'n deurlopende waarde. Ons moet die intervalstap definieer. Hiervoor word die Sturges-formule gebruik.
h= | max - min | = | 190 - 156 | = | 33 | = | 5, 59 |
1+log2m | 1+log230 | 5, 9 |
Dus kan die waarde van 6 geneem word as die grootte van die interval. Daar moet ook gesê word dat die waarde 1+log2m die formule is virdie bepaling van die aantal intervalle (natuurlik met afronding). Dus, volgens die formules, word 6 intervalle verkry, wat elk 'n grootte van 6 het. En die eerste waarde van die aanvanklike interval sal die getal wees wat deur die formule bepaal word: min - h / 2=156 - 6/2=153. Kom ons maak 'n tabel wat intervalle sal bevat en die aantal studente wie se groei binne 'n sekere interval geval het.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
Natuurlik is dit nie al nie, want daar is baie meer formules in wiskundige statistiek. Ons het net 'n paar basiese konsepte oorweeg.
Verspreidingskedule
Die basiese konsepte van wiskundige statistiek sluit ook 'n grafiese voorstelling van die verspreiding in, wat deur duidelikheid onderskei word. Daar is twee tipes grafieke: veelhoek en histogram. Die eerste word gebruik vir 'n diskrete statistiese reeks. En vir deurlopende verspreiding, onderskeidelik, die tweede een.