Uèenie je základnou a podstatnou vlastnosťou neurónových
sietí. Toto ich odli¹uje od nám doposiaľ známeho pou¾ívania
poèítaèov, kde bolo potrebné vytvoriť algoritmus,
podľa ktorého prebehol výpoèet. Teda pri klasických
algoritmoch neexistujú fázy učenia a života.
Pri neurónových sieťach je navrhnutý všeobecný algoritmus učenia, ktorý
sieť používa vo fáze učenia. Vhodnosť tohto algoritmu determinuje kvalitu
a rýchlosť učenia na predkladaných reprezentatívnych dátach.
Pre presnosť vyjadrovania sa v tejto oblasti sú dôle¾ité
nasledujúce pojmy:
príznak je význaèná velièina popisujúca jednu
vlastnosť skúmaného objektu; objekt mô¾e byť
charakterizovaný viacerými príznakmi. Obyèajne príznak
vyjadrujeme pomocou èíselných hodnôt, tj. pomocou
reálnych, celých alebo binárnych èísel.
príkladom budeme nazývať popis objektu, ktorý
je predmetom ná¹ho záujmu, pomocou èíselných
hodnôt; teda príklad je vlastne n-rozmerný vektor, kde
n vyjadruje poèet príznakov daného objektu.
príkladový priestor Y
je mno¾ina príkladov
reprezentívna vzorka s
je prvkom mno¾iny
, kde m je počet príkladov
vo vzorke. Preto reprezentatívna vzorka predstavuje množinu
usporiadaných dvojíc
.
Samotné
a predstavuje adekvátne výstupy k
jednotlivým vstupom. V praxi výstupy
nemusia byť binárne
hodnoty. Je potrebné si uvedomiť, že reprezentívna vzorka nám
poskytuje empirické údaje chovania sa systému, ktorý nepoznáme.
Pomocou poznania vstupov a výstupov systému sa snažíme poznať
chovanie systému.
reprezentívna vzorka je bezosporná, ak ¾iadne dva
príklady vo vzorke nie sú sporné, tj.
ak ,
potom musí platiť .
reprezentatívnu vzorku zvykneme náhodne rozdeliť do
dvoch základných typov vzoriek:
1.
trénovacia vzorka - je to množina usporiadaných hodnôt, ktorá
sa používa pri fáze učenia. Dôležitosť reprezentatívnosti týchto dát je
mimoriadna, lebo znalosti sa pri učení z týchto dát extrahujú do synaptických
váh neurónovej siete. Ak táto množina nie je vhodne vybraná, potom
aj samotné učenie nebude kvalitné. Tieto dáta by mali popisovať
komplexné chovanie sa systému, ktorý dáta reprezentujú.
2.
testovacia vzorka -
je to množina usporiadaných hodnôt, ktorá sa používa vo
fáze života za účelom otestovania získaných znalostí počas
učenia.