Modulárna sieť podľa schémy na Obr. 4.1 pozostáva z
expertných
modulov a jedného bránového modulu. Každý expertný modul obsahuje
jednu vrstvu pozostávajúcu z
lineárnych neurónov. Ich výstupné hodnoty
tvoria vektor výstupných hodnôt
-teho modulu
.
Hodnoty výstupného vektora určené podľa vzťahu (4.3) závisia od
matice vektorov hodnôt váh .
Prvok
tejto matice
predstavuje vektor váh prislúchajúci -temu neurónu -teho expertného
modulu. Nové hodnoty tohto vektora sa v
-tom kroku učiaceho procesu vypočítajú analogicky ako vo vzťahoch
(4.15) a (4.16).
(4.17)
(4.18)
Rozdiel oproti metóde najstrmšieho zostupu chybovej funkcie je v znamienku na
pravej strane výrazu (4.18). Cieľom pri metóde najstrmšieho vzostupu
pravdepodobnostnej funkcie je zväčšovanie jej hodnoty.
Deriváciu funkcie
podľa
možno podľa
pravidla zreťazenia prepísať do tvaru
(4.19)
Výpočet zložitej derivácie sa rozdelil na výpočet dvoch jednoduchších.
Derivácia
podľa
sa vypočíta nasledovne
(4.20)
- výstupná hodnota -teho neurónu -tej expertnej siete.
- požadovaná hodnota -teho prvku celkového výstupného
vektora
- aposteriórna pravdepodobnosť, že -ty expertný modul
generuje požadovaný výstupný vektor .
Jej hodnota je daná vzťahom
(4.21)
Zo vzťahu (4.21) vyplýva, že všetky
spĺňajú podmienky
(4.22)
Keďže aktivačné aj výstupné funkcie neurónov v expertných moduloch sú
lineárne, hodnota
sa podľa vzťahu (4.3) vypočíta nasledovne
(4.23)
Deriváciou výrazu (4.23) podľa
sa získa druhá časť
výrazu (4.19).
(4.24)
Dosadením (4.20) a (4.24) do (4.19) a dosadením do
(4.18) sa získa vzorec pre výpočet hodnoty
(4.25)
kde
predstavuje veľkosť učiaceho parametra.
Výsledný vzorec pre výpočet novej hodnoty vektora váh
,
ktorý prislúcha
-temu neurónu -teho expertného modulu má tvar