Subsieť ACE je taktiež nazývaná ako hodnotiaca sieť. Vstupom do ACE je
stavový vektor riadenej sústavy a reinforcement signál "r". Výstupom
z ACE je tzv. predikcia "r" v tvare 5.4.
Hlavnou úlohou je teda vyprodukovať predikciu signálu v tvare
na základe doposiaľ získaných skúsenosti. V podstate
môžeme definovať hodnotiacu funkciu na základe reinforcement
signálov "r" v tvare strednej hodnoty:
(5.6)
kde
je tzv. pomerový parameter zľavy5.5
a je z intervalu .
Z toho môžeme odvodiť tvar
v prípade
korektného učenia ako
(5.7)
a potom v konečnom dôsledku môže byť predikčný signál definovaný ako
(5.8)
Ak budeme uvažovať pod hodnotiacou funkciou jednotlivé SV ,
tak potom
ich zmena bude mať prírastok Hebbovského typu
(5.9)
kde
je učiaci pomer a koeficient
má tvar
(5.10)
Teda samotný vzorec (5.9) predstavuje adaptačný mechanizmus SV pre
subsieť ACE.
Táto metóda učenia na NN so špecializovanými topológiami sa vo veľkej miere
využíva a má veľké ambície využitia pri riadení v reálnom čase. Najčastejším
demonštratívnym príkladom je riadenie vozíka so vspriamenou tyčou upevnenou
v otočnom kĺbe na pohybujúcom sa vozíku. Cieľom je riadiť vozík v reálnom čase
tak, aby tyč bola stále vzpriamená (viď Obr. 5.2).