Filozofia kotrolovaného učenia (teda spôsob zmeny SV) je ovplyvnený
prítomnosťou učiteľa v celom procese učenia. Prakticky to
znamená, že NN musíme ponúknuť v procese učenia
vstup do NN
k vstupu prislúchajúci výstup NN.
Teda prístupy ku zmene SV (učeniu) môžeme v prípade kontrolovaného učenia
koncepčne rozdeliť do 3 skupín:
učenie za základe opravy chyby (error correction learning)
stochastické učenie (stochastic learning)
učenie na základe hodnotenia činnosti3.1 (reinforcement learning)
Poznámky k jednotlivým typom :
1.
Učenie na základe korekcie chyby
Tento prístup predpokladá zmenu SV ako funciu premenej ,
kde
predstavuje rozdiel medzi očakávaným stavom neurónu "i" ()
a vypočítaným stavom neurónu "i" ()
v procese učenia. Teda
(3.1)
Potom môžeme napísať všeobecný vzorec pre výpočet zmeny SV pre spojenie
medzi výstupným neurónom "i" a do neho vstupujúcim neurónom "j" v tvare
(3.2)
kde
je parameter učenia, zvyčajne v intervale hodnôt
,
je stav neurónu "j". V prípade viacvrstvovej siete sa
pri výpočte jednotlivých zmien váh použije rekurentný vzorec pre zmenu
váh, ktorý sa odvíja od výstupu NN a smeruje späť do NN (viď BP-algoritmus).
2.
Stochastické učenie
Pri stochastickom type učenia ide o zmeny SV založené na
stochastických prístupoch. Globálna stratégia je založená na
nasledovných krokoch:
navrhne sa stochastická zmena SV a vypočíta sa energia
NN.
ak zmena priniesla zníženie energie NN, návrh zmeny sa
príjme
ak zmena nepriniesla spomínaný efekt návrh sa zamietne
Príkladom takýchto NN je Boltzmanov stroj a jeho modifikácie .
3.
Učenie na základe hodnotenia činnosti
Tento charakter učenia je podobný ako v prípade učenia podľa
korekcie chyby,ale základným rozdielom je, že sa zhodnocuje stav
výstupu celej výstupnej vrstvy pomocou nejakej skalárnej veličiny. Potom
môžeme napísať všeobecný tvar rovnice učenia:
(3.3)
kde
je skalárna hodnota úspešnosti celej NN odvodená z výstupnej
vrstvy NN,
je prahový koeficient úpravy pre neurón "i"
a
je koeficient rozhodnutia a predstavuje zmenu pravdepodobnosti
minimálnej chyby podľa synaptickej váhy, ktorý sa vo všeobecnosti vypočíta
(3.4)
kde teda
je pravdepodobnosť, že očakávaný výstup sa bude rovnať
vypočítavanému výstupu (teda minimálnej chybe), teda
(3.5)
kde
je očakávaná hodnota výstupného neurónu "i",
je výpočítaná hodnota neurónu,
je vektor SV, ktoré
vstupujú do neurónu "i" a
je vektor hodnôt aktivačných
stavov neurónov, ktorých SV vstupujú do neurónu "i".
Záverom ku kontrolovanému učeniu je nutné počiarknuť, že existujú
metódy učenia, ktoré predstavujú hybridný prístup zostavený z horeuvedených
prístupov.