Bránový modul obsahuje
nelineárnych neurónov s výstupnou funkciu typu
softmax. Výpočet hodnôt
je definovaný vzťahom (4.5), ktorého
dosadením do (4.13) je určené vyjadrenie pravdepodobnostnej funkcie
pomocou vektora váh bránového modulu
(4.27)
Hodnoty
sú výstupnými hodnotami neurónov bránového modulu, ktoré
sa vypočítajú podľa vzťahu (4.4).
Ďalší postup odvodenia úpravy hodnôt vektora váh
je analogický
postupu odvodenia úpravy váh pre expertné moduly. Rozdiel je v počte a
type neurónov bránového modulu. Expertné moduly obsahovali
lineárnych
neurónov. Bránový modul obsahuje
nelineárnych neurónov. Nové hodnoty
vektora váh ,
ktorý prislúcha -temu neurónu sa určia nasledovne
(4.28)
(4.29)
Učiaci parameter
bránovej siete môže byť zhodný s učiacim
parametrom pre expertné siete. Parciálnu deriváciu pravdepodobnostnej
funkcie je možné znova rozpísať pomocou pravidla zreťazenia.
(4.30)
Derivácia pravdepodobnostnej funkcie podľa
vyjadrená pre -ty
neurón bránovej siete má tvar
(4.31)
Derivácia
podľa vektora váh prislúchajúceho -temu neurónu
bránovej siete má tvar
(4.32)
Dosadením (4.31) a (4.32) do (4.30) a následným dosadením do
(4.28) sa získa vzorec pre výpočet hodnoty
(4.33)
Výsledný vzorec pre výpočet novej hodnoty vektora váh prislúchajúceho
-temu neurónu bránového modulu má tvar
(4.34)
Zhrnutie učiaceho algoritmu pre regresiu:
1.
Inicializácia.
Hodnoty všetkých váh celej siete sa nastavia na náhodnú hodnotu z malého
intervalu, napr. .
2.
Úprava váh.
Úprava váh sa uskutočňuje v
cykloch. V každom cykle sa privedú na vstup
a výstup siete všetky vzorky trénovacej množiny. Každá vzorka je
reprezentovaná dvojicou
.
Pre jednotlivé indexy platí: