Bayesiaanse netwerke: definisie, voorbeelde en hoe hulle werk

2026 Outeur: Angel Austin | [email protected]. Laas verander: 2025-01-23 12:19:44

'n Geloof, besluitnetwerk, Bayesiaanse (iaanse) model of waarskynlik-gedrewe asikliese grafiekmodel is 'n variantskema ('n tipe statistiese model) wat 'n stel veranderlikes en hul voorwaardelike afhanklikhede verteenwoordig deur 'n gerigte asikliese grafiek (DAG)).

Byvoorbeeld, 'n Bayes-netwerk kan waarskynlike verwantskappe tussen siektes en simptome verteenwoordig. Gegewe laasgenoemde, kan die netwerk gebruik word om die moontlikheid van verskeie siektes te bereken. In die video hieronder kan jy 'n voorbeeld van 'n Bayesiaanse geloofsnetwerk met berekeninge sien.

Doeltreffendheid

Doeltreffende algoritmes kan afleidings en leer op Bayes-netwerke uitvoer. Netwerke wat veranderlikes modelleer (soos spraakseine of proteïenvolgordes) word dinamiese netwerke genoem. Veralgemenings van Bayesiaanse netwerke wat probleme onder onsekerheid kan voorstel en oplos, word invloeddiagramme genoem.

Essence

FormeelBayesiese netwerke is DAG's waarvan die nodusse veranderlikes in die Bayesiaanse sin verteenwoordig: hulle kan waargeneemde waardes, versteekte veranderlikes, onbekende parameters of hipoteses wees. Want dit is baie interessant.

Bayesiaanse netwerkvoorbeeld

Twee gebeurtenisse kan veroorsaak dat gras nat word: 'n aktiewe sproeier of reën. Reën het 'n direkte uitwerking op die gebruik van die sproeier (naamlik dat wanneer dit reën, die sproeier gewoonlik onaktief is). Hierdie situasie kan gemodelleer word deur 'n Bayes-netwerk te gebruik.

Simulasie

Omdat die Bayes-netwerk 'n volledige model vir sy veranderlikes en hul verwantskappe is, kan dit gebruik word om waarskynlike navrae daaroor te beantwoord. Dit kan byvoorbeeld gebruik word om kennis oor die toestand van 'n subset van veranderlikes op te dateer wanneer ander data (bewysveranderlikes) waargeneem word. Hierdie interessante proses word probabilistiese afleiding genoem.

A posteriori gee 'n universeel voldoende statistiek vir ontdekkingstoepassings wanneer waardes vir 'n subset van veranderlikes gekies word. Hierdie algoritme kan dus beskou word as 'n meganisme vir die outomatiese toepassing van Bayes se stelling op komplekse probleme. In die prente in die artikel kan jy voorbeelde van Bayesiaanse geloofsnetwerke sien.

Uitvoermetodes

Die mees algemene presiese afleidingsmetodes is: veranderlike eliminasie, wat (deur integrasie of opsomming) die onwaarneembare elimineernie-navraag parameters een vir een deur die bedrag aan die produk toe te ken.

Klikvoortplanting van 'n "boom" wat berekeninge in die kas kas sodat baie veranderlikes gelyktydig navraag gedoen kan word en nuwe bewyse vinnig gepropageer kan word; en rekursiewe passing en/of soek, wat afwegings tussen ruimte en tyd moontlik maak en ooreenstem met die doeltreffendheid van veranderlike eliminasie wanneer genoeg spasie gebruik word.

Al hierdie metodes het 'n spesiale kompleksiteit wat eksponensieel afhang van die lengte van die netwerk. Die mees algemene benaderde afleidingsalgoritmes is mini-segment eliminasie, sikliese geloof voortplanting, algemene geloof voortplanting en variasie metodes.

Netwerk

Om die Bayes-netwerk volledig te spesifiseer en dus die gesamentlike waarskynlikheidsverspreiding volledig voor te stel, is dit nodig om vir elke nodus X die waarskynlikheidsverdeling vir X te spesifiseer as gevolg van die ouers van X.

Die verspreiding van X voorwaardelik deur sy ouers kan enige vorm hê. Dit is algemeen om met diskrete of Gaussiese verdelings te werk aangesien dit berekeninge vereenvoudig. Soms is slegs verspreidingsbeperkings bekend. Jy kan dan entropie gebruik om die enkele verspreiding te bepaal wat die hoogste entropie het gegewe die beperkings.

Net so, in die spesifieke konteks van 'n dinamiese Bayesiaanse netwerk, die voorwaardelike verspreiding vir die tydelike evolusie van die latentetoestand word gewoonlik ingestel om die entropietempo van die geïmpliseerde ewekansige proses te maksimeer.

Direkte maksimalisering van waarskynlikheid (of posterior waarskynlikheid) is dikwels moeilik gegewe die teenwoordigheid van onwaargeneemde veranderlikes. Dit is veral waar vir 'n Bayesiaanse besluitnemingsnetwerk.

Klassieke benadering

Die klassieke benadering tot hierdie probleem is die verwagtingsmaksimeringsalgoritme, wat die berekening van die verwagte waardes van onwaargeneemde veranderlikes afhanklik van die waargenome data afwissel met die maksimalisering van die totale waarskynlikheid (of posterior waarde), met die veronderstelling dat die voorheen berekende verwagte waardes is korrek. Onder toestande van matige reëlmaat konvergeer hierdie proses in die maksimum (of maksimum a posteriori) waardes van die parameters.

'n Meer volledige Bayesiaanse benadering tot parameters is om hulle as bykomende onwaargeneemde veranderlikes te behandel en die volle posterior verspreiding oor alle nodusse te bereken, gegewe die waargenome data, en dan die parameters te integreer. Hierdie benadering kan duur wees en groot modelle tot gevolg hê, wat klassieke parameterinstellingsbenaderings meer toeganklik maak.

In die eenvoudigste geval word 'n Bayes-netwerk deur 'n deskundige gedefinieer en dan gebruik om afleidings uit te voer. In ander toepassings is die taak om te bepaal te moeilik vir 'n mens. In hierdie geval moet die struktuur van die Bayesiese neurale netwerk en die parameters van plaaslike verspreidings onder die data aangeleer word.

Alternatiewe metode

'n Alternatiewe metode van gestruktureerde leer gebruik optimaliseringsoektog. Dit vereis die toepassing van 'n evalueringsfunksie en 'n soekstrategie. 'n Algemene puntealgoritme is die posterior waarskynlikheid van 'n struktuur gegewe opleidingsdata soos BIC of BDeu.

Die tyd wat nodig is vir 'n volledige soektog wat 'n struktuur gee wat die telling maksimeer, is supereksponensieel in die aantal veranderlikes. Die plaaslike soekstrategie maak inkrementele veranderinge om struktuurskatting te verbeter. Friedman en sy kollegas het dit oorweeg om wedersydse inligting tussen veranderlikes te gebruik om die gewenste struktuur te vind. Hulle beperk die stel ouerkandidate tot k nodusse en deursoek hulle deeglik.

'n Besonder vinnige metode om BN presies te bestudeer, is om die probleem as 'n optimaliseringsprobleem voor te stel en dit op te los met behulp van heelgetalprogrammering. Asiklisiteitsbeperkings word by die heelgetalprogram (IP) gevoeg tydens oplossing in die vorm van snyvlakke. So 'n metode kan probleme tot 100 veranderlikes hanteer.

probleemoplossing

Om probleme met duisende veranderlikes op te los, is 'n ander benadering nodig. Een daarvan is om eers een orde te kies en dan die optimale BN-struktuur met betrekking tot daardie orde te vind. Dit impliseer om in die soekruimte van moontlike ordening te werk, wat gerieflik is omdat dit kleiner is as die ruimte van netwerkstrukture. Verskeie bestellings word dan gekies en geëvalueer. Hierdie metode het geblykbeste beskikbaar in die literatuur wanneer die aantal veranderlikes groot is.

'n Ander metode is om te fokus op 'n subklas van ontbindbare modelle waarvoor MLE's gesluit is. Dan kan jy 'n konsekwente struktuur vir honderde veranderlikes vind.

Die bestudering van Bayesiaanse netwerke met 'n beperkte breedte van drie lyne is nodig om akkurate, interpreteerbare afleiding te verskaf, aangesien die ergste-geval kompleksiteit van laasgenoemde eksponensieel in boomlengte k is (volgens die eksponensiële tydhipotese). As 'n globale eienskap van die grafiek verhoog dit egter die kompleksiteit van die leerproses aansienlik. In hierdie konteks kan K-tree gebruik word vir effektiewe leer.

Ontwikkeling

Ontwikkeling van 'n Bayesian Web of Trust begin dikwels met die skepping van 'n DAG G sodat X 'n plaaslike Markov-eiendom met betrekking tot G bevredig. Soms is dit 'n oorsaaklike DAG. Die voorwaardelike waarskynlikheidsverdelings van elke veranderlike oor sy ouers in G word beraam In baie gevalle, veral wanneer die veranderlikes diskreet is, as die gesamentlike verspreiding van X die produk van hierdie voorwaardelike verdelings is, dan word X 'n Bayesiese netwerk t.o.v. G.

Markov se "knoopkombers" is 'n stel knope. Die Markov-kwilt maak die nodus onafhanklik van die res van die spasie van die nodus met dieselfde naam en is voldoende kennis om die verspreiding daarvan te bereken. X is 'n Bayesiese netwerk met betrekking tot G as elke nodus voorwaardelik onafhanklik is van alle ander nodusse, gegewe sy Markoviankombers.