Statistiese inligting: versameling, verwerking, ontleding

INHOUDSOPGAWE:

Statistiese inligting: versameling, verwerking, ontleding
Statistiese inligting: versameling, verwerking, ontleding
Anonim

Deur die geskiedenis van statistiek is verskeie pogings aangewend om 'n taksonomie van metingsvlakke te skep. Psigofisikus Stanley Smith Stevens het nominale, ordinale, interval en proporsionele skale gedefinieer.

Nominale metings het geen noemenswaardige volgorde van rangorde onder waardes nie en laat enige een-tot-een-omskakeling toe.

Gereelde afmetings het onakkurate verskille tussen opeenvolgende waardes, maar het 'n spesifieke volgorde van daardie waardes en laat enige ordebehoudende transformasie toe.

Intervalmetings het betekenisvolle afstande tussen punte, maar die nulwaarde is arbitrêr (soos in die geval van lengtegraad- en temperatuurmetings in Celsius of Fahrenheit) en maak voorsiening vir enige lineêre transformasie.

Verhoudingdimensies het beide 'n betekenisvolle nulwaarde en afstande tussen verskillende dimensies, en maak voorsiening vir enige ska altransformasie.

Image
Image

Veranderlikes en klassifikasie van inligting

Omdat die veranderlikeswat slegs met nominale of ordinale metings ooreenstem, kan nie redelikerwys numeries gemeet word nie, en word soms as kategoriese veranderlikes gegroepeer. Die verhouding- en intervalmetings word as kwantitatiewe veranderlikes gegroepeer, wat óf diskreet óf kontinu kan wees as gevolg van hul numeriese aard. Sulke onderskeidings hou dikwels losweg verband met datatipe in rekenaarwetenskap, aangesien digotome kategoriese veranderlikes voorgestel kan word deur booleaanse waardes, politome kategoriese veranderlikes met arbitrêre heelgetalle in 'n integrale datatipe, en kontinue veranderlikes met reële komponente wat swaaipuntberekening behels. Maar die vertoning van statistiese inligting datatipes hang af van watter klassifikasie toegepas word.

Statistiese inligting oor werkers
Statistiese inligting oor werkers

Ander klassifikasies

Ander klassifikasies van statistiese data (inligting) is ook geskep. Mosteller en Tukey het byvoorbeeld onderskei tussen grade, range, getelde aandele, tellings, bedrae en saldo's. Nelder het op 'n tyd kontinue tellings, kontinue verhoudings, korrelasie van tellings en kategoriese maniere om data te kommunikeer beskryf. Al hierdie klassifikasiemetodes word gebruik in die versameling van statistiese inligting.

Probleme

Die vraag of dit gepas is om verskillende soorte statistiese metodes toe te pas op data wat deur verskillende metings- (versamel-) prosedures verkry is, word gekompliseer deur kwessies wat verband hou met die omskakeling van veranderlikes en die presiese interpretasie van vraenavorsing. “Die verhouding tussen data en wat dit beskryf weerspieël bloot die feit dat sekere soorte statistiese stellings waarheidswaardes kan hê wat nie onveranderlik is onder sekere transformasies nie. Of die transformasie die moeite werd is om te oorweeg, hang af van die vraag wat jy probeer beantwoord.

'n Voorbeeld van statistiese inligting
'n Voorbeeld van statistiese inligting

Wat is 'n datatipe

Die datatipe is 'n fundamentele komponent van die semantiese inhoud van 'n veranderlike en beheer watter soort waarskynlikheidsverdelings logies gebruik kan word om die veranderlike te beskryf, die bewerkings wat daarop toegelaat word, die tipe regressie-analise wat gebruik word om dit te voorspel, ens. Die konsep van 'n datatipe is soortgelyk op die konsep van metingsvlak, maar meer spesifiek - datatellings vereis byvoorbeeld 'n ander verspreiding (Poisson of binomiaal) as vir nie-negatiewe reële waardes, maar beide val onder dieselfde vlak van meting (koëffisiëntskaal).

Statistiese inligting oor beoordelaars
Statistiese inligting oor beoordelaars

Skale

Verskeie pogings is aangewend om 'n taksonomie van metingsvlakke vir die verwerking van statistiese inligting te skep. Die psigofisikus Stanley Smith Stevens het nominale, ordinale, interval en proporsionele skale gedefinieer. Nominale metings het nie 'n beduidende volgorde van rangorde onder die waardes nie en laat enige een-tot-een-omskakeling toe. Gewone metings het onakkurate verskille tussen opeenvolgende waardes, maar verskil in die betekenisvolle volgorde van daardie waardes, en laatenige ordebewarende transformasie. Intervalmetings het betekenisvolle afstande tussen metings, maar die nulwaarde is arbitrêr (soos in die geval van lengte- en temperatuurmetings in Celsius of Fahrenheit) en maak voorsiening vir enige lineêre transformasie. Verhoudingdimensies het beide 'n betekenisvolle nulwaarde en afstande tussen verskillende gedefinieerde dimensies, en maak voorsiening vir enige ska altransformasie.

Diagram model
Diagram model

Data wat nie met 'n enkele getal beskryf kan word nie, word dikwels ingesluit in ewekansige vektore van werklike ewekansige veranderlikes, hoewel daar 'n groeiende neiging is om dit self te verwerk. Sulke voorbeelde sal hieronder bespreek word.

Ewekansige vektore

Individuele elemente kan of mag nie gekorreleer word nie. Voorbeelde van verdelings wat gebruik word om gekorreleerde ewekansige vektore te beskryf, is die meerveranderlike normaalverdeling en die meerveranderlike t-verspreiding. Oor die algemeen kan daar arbitrêre korrelasies tussen enige elemente wees, maar dit word dikwels onhanteerbaar bo 'n sekere grootte, wat addisionele beperkings op die gekorreleerde komponente vereis.

statistiese eienskappe
statistiese eienskappe

Ewekansige matrikse

Ewekansige matrikse kan lineêr gerangskik en as ewekansige vektore behandel word, maar dit is dalk nie 'n doeltreffende manier om korrelasies tussen verskillende elemente voor te stel nie. Sommige waarskynlikheidsverdelings is spesifiek ontwerp vir ewekansige matrikse, soos die normale matriksverspreiding en Wishart-verspreiding.

Random Sequences

Soms word hulle as dieselfde as ewekansige vektore beskou, maar in ander gevalle word die term spesifiek toegepas op gevalle waar elke ewekansige veranderlike slegs met nabygeleë veranderlikes korreleer (soos in 'n Markov-model). Dit is 'n spesiale geval van die Bayes-netwerk en word gebruik vir baie lang rye, soos geenkettings of lang teksdokumente. 'n Aantal modelle is spesiaal ontwerp vir sulke reekse, soos versteekte Markov-reekse.

Tipiese grafiek
Tipiese grafiek

Ewekansige prosesse

Hulle is soortgelyk aan ewekansige rye, maar slegs wanneer die lengte van die ry onbepaald of oneindig is, en die elemente in die ry een vir een verwerk word. Dit word dikwels gebruik vir data wat as tydreekse beskryf kan word. Dit is waar wanneer dit kom by, byvoorbeeld, die aandeelprys die volgende dag.

Gevolgtrekking

Die ontleding van statistiese inligting hang geheel en al af van die kwaliteit van die versameling daarvan. Laasgenoemde hou op sy beurt sterk verband met die moontlikhede van die klassifikasie daarvan. Natuurlik is daar baie tipes klassifikasie van statistiese inligting wat die leser self kan sien wanneer hy hierdie artikel lees. Nietemin sal die teenwoordigheid van effektiewe gereedskap en 'n goeie beheersing van wiskunde, sowel as kennis op die gebied van sosiologie, hul werk doen, wat jou toelaat om enige opname of studie te doen sonder beduidende foutkorreksies. Bronne van statistiese inligting in die vormmense, organisasies en ander vakke van sosiologie word gelukkig in groot oorvloed verteenwoordig. En geen moeilikheid kan in die pad van 'n ware ontdekkingsreisiger staan nie.

Aanbeveel: