Multidimensionele skaal: definisie, doelwitte, doelwitte en voorbeeld

INHOUDSOPGAWE:

Multidimensionele skaal: definisie, doelwitte, doelwitte en voorbeeld
Multidimensionele skaal: definisie, doelwitte, doelwitte en voorbeeld
Anonim

Multivariate scaling (MDS) is 'n instrument om die vlak van ooreenkoms van individuele gevalle in 'n datastel te visualiseer. Dit verwys na 'n stel verwante ordeningsmetodes wat gebruik word in die visualisering van inligting, veral om die inligting vervat in 'n afstandmatriks te vertoon. Dit is 'n vorm van nie-lineêre dimensionaliteit vermindering. Die MDS-algoritme het ten doel om elke voorwerp in 'n N-dimensionele ruimte op so 'n manier te plaas dat die afstande tussen voorwerpe so goed moontlik bewaar word. Elke voorwerp kry dan koördinate in elk van die N dimensies.

Die aantal afmetings van die MDS-grafiek kan 2 oorskry en word vooraf gespesifiseer. Deur N=2 te kies, optimeer objekplasing vir die 2D-verspreidingsdiagram. U kan voorbeelde van multidimensionele skaal in die prente in die artikel sien. Voorbeelde met simbole in Russies is veral illustratief.

Multidimensionele skaal
Multidimensionele skaal

Essence

Metode van multidimensionele skaal (MMS,MDS) is 'n uitgebreide stel klassieke instrumente wat die optimaliseringsprosedure veralgemeen vir 'n stel verliesfunksies en invoermatrikse van bekende afstande met gewigte ensovoorts. In hierdie konteks word 'n nuttige verliesfunksie stres genoem, wat dikwels geminimaliseer word deur 'n prosedure genaamd stresmajorisering.

Handleiding

Daar is verskeie opsies vir multidimensionele skaal. MDS-programme minimaliseer outomaties die las om 'n oplossing te kry. Die kern van die niemetriese MDS-algoritme is 'n tweeledige optimaliseringsproses. Eerstens moet die optimale monotoniese nabyheidstransformasie gevind word. Tweedens moet konfigurasiepunte optimaal geposisioneer wees sodat hul afstande so na as moontlik ooreenstem met die geskaalde nabyheidswaardes.

Multidimensionele skaal voorbeeld
Multidimensionele skaal voorbeeld

Uitbreiding

'n Uitbreiding van metriese multidimensionele skalering in statistiek waar die teikenruimte 'n arbitrêre gladde nie-Euklidiese ruimte is. Waar die verskille afstande op 'n oppervlak is en die teikenspasie 'n ander oppervlak is. Tematiese programme laat jou toe om 'n aanhegsel te vind met minimale vervorming van een oppervlak na 'n ander.

Step

Daar is verskeie stappe in die uitvoer van 'n studie deur gebruik te maak van meerveranderlike skaal:

  1. Formulering van die probleem. Watter veranderlikes wil jy vergelyk? Hoeveel veranderlikes wil jy vergelyk? Vir watter doel sal die studie gebruik word?
  2. Kry tans invoerdata. Respondente word 'n reeks vrae gevra. Vir elke paar produkte word hulle gevra om die ooreenkoms te beoordeel (gewoonlik op 'n 7-punt Likert-skaal van baie soortgelyk tot baie verskillend). Die eerste vraag kan byvoorbeeld vir Coca-Cola/Pepsi wees, die volgende vir bier, die volgende vir Dr. Pepper, ens. Die aantal vrae hang af van die aantal handelsmerke.
Afstandskaal
Afstandskaal

Alternatiewe benaderings

Daar is twee ander benaderings. Daar is 'n tegniek genaamd "Perceptual Data: Derived Approach" waarin produkte in eienskappe ontbind word en die evaluering op 'n semantiese differensiële skaal gedoen word. Nog 'n metode is die "voorkeurdata-benadering," waarin respondente gevra word oor voorkeure eerder as ooreenkomste.

Dit bestaan uit die volgende stappe:

  1. Begin die MDS-statistiekprogram. Sagteware vir die uitvoering van die prosedure is beskikbaar in baie statistiese sagtewarepakkette. Daar is dikwels 'n keuse tussen metrieke MDS (wat handel oor interval- of verhoudingsvlakdata) en nie-metriese MDS (wat oor ordinale data handel).
  2. Bepaal die aantal metings. Die navorser moet bepaal hoeveel metings hy op die rekenaar wil skep. Hoe meer metings, hoe beter is die statistiese passing, maar hoe moeiliker is dit om die resultate te interpreteer.
  3. Vertoon resultate en definieer metings - die statistiese program (of verwante module) sal die resultate vertoon. Die kaart sal elke produk vertoon (gewoonlik in 2D).spasie). Die nabyheid van produkte aan mekaar dui op óf hul ooreenkoms óf voorkeur, afhangend van watter benadering gebruik is. Hoe metings eintlik ooreenstem met metings van stelselgedrag, is egter nie altyd duidelik nie. 'n Subjektiewe oordeel van ooreenstemming kan hier gemaak word.
  4. Gaan resultate na vir betroubaarheid en geldigheid - bereken R-kwadraat om die proporsie van geskaalde data-afwyking te bepaal wat deur die MDS-prosedure verantwoord kan word. Vierkant R 0.6 word as die minimum aanvaarbare vlak beskou. R kwadraat 0.8 word as goed vir metriese skaal beskou, terwyl 0.9 as goed vir nie-metriese skaal beskou word.
Meerveranderlike skaalresultate
Meerveranderlike skaalresultate

Verskeie toetse

Ander moontlike toetse is Kruskal-tipe strestoetse, gesplete datatoetse, datastabiliteitstoetse en hertoetsbetroubaarheidstoetse. Skryf in detail oor die resultate in die toets. Saam met die kartering moet ten minste 'n maatstaf van afstand (bv. Sorenson-indeks, Jaccard-indeks) en betroubaarheid (bv. spanningswaarde) gespesifiseer word.

Dit is ook hoogs wenslik om 'n algoritme te gee (bv. Kruskal, Mather) wat dikwels bepaal word deur die program wat gebruik word (soms vervang die algoritmeverslag), as jy 'n beginkonfigurasie gegee het of 'n ewekansige keuse gehad het, nommer van dimensielopies, Monte Carlo-resultate, aantal iterasies, stabiliteittelling en proporsionele variansie van elke as (r-vierkant).

Visuele inligting en data-analise metodemultidimensionele skaal

Inligtingsvisualisering is die studie van interaktiewe (visuele) voorstellings van abstrakte data om menslike kognisie te verbeter. Abstrakte data sluit beide numeriese en nie-numeriese data soos tekstuele en geografiese inligting in. Inligtingsvisualisering verskil egter van wetenskaplike visualisering: "dit is inligtingsvisualisering (inligtingsvisualisering) wanneer 'n ruimtelike voorstelling gekies word, en scivis (wetenskaplike visualisering) wanneer 'n ruimtelike voorstelling gegee word."

Die veld van inligtingvisualisering het ontstaan uit navorsing in mens-rekenaarinteraksie, rekenaarwetenskaptoepassings, grafika, visuele ontwerp, sielkunde en besigheidsmetodes. Dit word toenemend gebruik as 'n noodsaaklike komponent in wetenskaplike navorsing, digitale biblioteke, data-ontginning, finansiële data, marknavorsing, produksiebeheer, ensovoorts.

Metodes en beginsels

Inligtingsvisualisering dui daarop dat visualisering en interaksiemetodes voordeel trek uit die rykdom van menslike persepsie, wat gebruikers in staat stel om gelyktydig groot hoeveelhede inligting te sien, te verken en te verstaan. Inligtingsvisualisering het ten doel om benaderings te skep om abstrakte data, inligting op 'n intuïtiewe manier te kommunikeer.

Kleur multidimensionele skaal
Kleur multidimensionele skaal

Data-analise is 'n integrale deel van alle toegepaste navorsing en probleemoplossing in die industrie. Die meesteDie fundamentele benaderings tot data-analise is visualisering (histogramme, spreidingsdiagramme, oppervlakplotte, boomkaarte, parallelle koördinaatplotte, ens.), statistiek (hipotesetoetsing, regressie, PCA, ens.), data-analise (passing, ens.)..d.) en masjienleermetodes (groepering, klassifikasie, besluitnemingsbome, ens.).

Onder hierdie benaderings is inligtingvisualisering of visuele data-analise die meeste afhanklik van die kognitiewe vaardighede van die analitiese personeel en laat die ontdekking van ongestruktureerde uitvoerbare insigte toe wat slegs deur menslike verbeelding en kreatiwiteit beperk word. 'n Ontleder hoef nie enige komplekse tegnieke aan te leer om datavisualiserings te kan interpreteer nie. Inligtingsvisualisering is ook 'n hipotesegenereringskema wat gewoonlik gepaard kan gaan met meer analitiese of formele analise soos statistiese hipotesetoetsing.

Studie

Die moderne studie van visualisering het begin met rekenaargrafika, wat van die begin af gebruik is om wetenskaplike probleme te bestudeer. Maar in die vroeë jare het die gebrek aan grafiese krag dikwels die bruikbaarheid daarvan beperk. Die prioriteit op visualisering het begin om in 1987 te ontwikkel, met die vrystelling van spesiale sagteware vir Rekenaargrafika en Visualisering in Scientific Computing Sedertdien was daar verskeie konferensies en werkswinkels wat gesamentlik deur die IEEE Computer Society en ACM SIGGRAPH gereël is.

Hulle het die algemene onderwerpe van datavisualisering, inligtingvisualisering en wetenskaplike visualisering gedek,sowel as meer spesifieke areas soos volumeweergawe.

Multidimensionele handelsmerkskaal
Multidimensionele handelsmerkskaal

Opsomming

Generalized Multidimensional Scale (GMDS) is 'n uitbreiding van metriese multidimensionele skalering waarin die teikenruimte nie-Euklidies is. Wanneer die verskille afstande op 'n oppervlak is, en die teikenspasie 'n ander oppervlak is, stel GMDS jou in staat om die nes van een oppervlak in 'n ander te vind met minimale vervorming.

GMDS is 'n nuwe navorsingslyn. Tans is die hooftoepassings vervormbare voorwerpherkenning (byvoorbeeld vir 3D-gesigherkenning) en tekstuurkartering.

Die doel van multidimensionele skaal is om multidimensionele data voor te stel. Multidimensionele data, dit wil sê data wat meer as twee of drie dimensies vereis om voor te stel, kan moeilik wees om te interpreteer. Een benadering tot vereenvoudiging is om te aanvaar dat die data van belang op 'n ingebedde nie-lineêre spruitstuk in 'n hoë-dimensionele ruimte lê. As die versamelaar 'n laag genoeg afmeting het, kan die data in 'n lae-dimensionele ruimte gevisualiseer word.

Baie van die metodes om nie-lineêre dimensionaliteit te verminder, hou verband met lineêre metodes. Nie-lineêre metodes kan breedweg in twee groepe geklassifiseer word: dié wat kartering verskaf (óf van hoë-dimensionele ruimte tot lae-dimensionele inbedding, of andersom), en dié wat bloot visualisering verskaf. In die konteks van masjienleer kan karteringmetodes as beskou word'n voorlopige stadium van kenmerk-onttrekking, waarna patroonherkenningsalgoritmes toegepas word. Gewoonlik is dié wat net visualiserings gee, gebaseer op nabyheidsdata - dit wil sê afstandmetings. Multidimensionele skaal is ook redelik algemeen in sielkunde en ander geesteswetenskappe.

Diagonale multidimensionele skaal
Diagonale multidimensionele skaal

As die aantal eienskappe groot is, dan is die spasie van unieke moontlike stringe ook eksponensieel groot. Dus, hoe groter die dimensie, hoe moeiliker word dit om die ruimte uit te beeld. Dit veroorsaak baie probleme. Algoritmes wat op hoë-dimensionele data werk, is geneig om baie hoë tydskompleksiteit te hê. Die vermindering van data tot minder dimensies maak analise-algoritmes dikwels doeltreffender en kan masjienleeralgoritmes help om meer akkurate voorspellings te maak. Dit is hoekom multidimensionele dataskaal so gewild is.

Aanbeveel: