Celá topológia sa skladá z dvoch subsietí (viď Obr. 5.1) a to
Associative search network ASE5.2 - táto časť stanovuje
vzťah medzi vstupom a výstupom do systému. Do subsiete ASE
vstupujú vstupy, ktoré predstavujú stavový vektor "s"
riadeného systému.
Adaptive Critic Element ACE5.3 - na základe výstupu zo systému, stanovuje tzv.
predikčnú hodnotu reinforcement parametra ()
v čase
na základe
parametrov
a .
Obrázok 5.1:
Topológia NN určená pre učenie podľa stavu riadeného
systému
Samotné bloky ASE a ACE môžu prestavovať buď subsieť ale aj samostný neurón.
Okrem topológie na Obr. 5.1 je možné, ešte použiť topológiu, kde máme
jednu subsieť, ktorá predstavuje model riadeného systému. Teda
v konečnom dôsledku pôjde o riadenie pomocou modelu [6].