Odvodenie učiaceho algoritmu je založené na metóde najstrmšieho vzostupu
hodnoty logaritmickej pravdepodobnostnej funkcie
.
Cieľom učenia
je maximalizácia hodnoty tejto funkcie.
Postup je analogický metóde najstrmšieho zostupu hodnoty chybovej funkcie
doprednej siete. Jej veľkosť závisí od matice ,
ktorá predstavuje množinu voľných parametrov doprednej siete. V procese učenia
sa upravujú hodnoty prvkov matice
tak, aby sa hodnota chybovej funkcie
zmenšovala. Nové hodnoty prvkov matice
sa v
-tom kroku učiaceho procesu vypočítajú podľa vzťahu
(4.15)
Hodnota
sa v -tom kroku vypočíta podľa vzťahu
(4.16)
V modulárnej architektúre opísanej v predošlej časti predstavujú množinu
voľných parametrov vektory váh
expertných modulov a
bránového modulu. Od ich hodnôt závisí veľkosť logaritmickej
pravdepodobnostnej funkcie
.