Arhitektura neuronske mreže koja se koristi u ovom primjeru je neuronska mreža s napredovanjem s tri sloja: ulazni sloj, skriveni sloj i izlazni sloj. Ulazni sloj se sastoji od 784 jedinice, što odgovara broju piksela na ulaznoj slici. Svaka jedinica u ulaznom sloju predstavlja vrijednost intenziteta piksela na slici.
Skriveni sloj se sastoji od 128 jedinica, koje su u potpunosti povezane sa ulaznim slojem. Svaka jedinica u skrivenom sloju izračunava ponderisani zbir ulaza iz ulaznog sloja i primjenjuje aktivacijsku funkciju da proizvede izlaz. U ovom primjeru, aktivacijska funkcija koja se koristi u skrivenom sloju je funkcija rektificirane linearne jedinice (ReLU). ReLU funkcija je definirana kao f(x) = max(0, x), gdje je x ponderirani zbir ulaza u jedinicu. ReLU funkcija uvodi nelinearnost u mrežu, omogućavajući joj da nauči složene obrasce i odnose u podacima.
Izlazni sloj se sastoji od 10 jedinica, od kojih svaka predstavlja jednu od mogućih klasa u problemu klasifikacije. Jedinice u izlaznom sloju su također u potpunosti povezane s jedinicama u skrivenom sloju. Slično skrivenom sloju, svaka jedinica u izlaznom sloju izračunava ponderisani zbir ulaza iz skrivenog sloja i primjenjuje funkciju aktivacije. U ovom primjeru, aktivacijska funkcija koja se koristi u izlaznom sloju je softmax funkcija. Funkcija softmax pretvara ponderisani zbir ulaznih podataka u distribuciju verovatnoće po klasama, gde je zbir verovatnoća jednak 1. Jedinica sa najvećom verovatnoćom predstavlja predviđenu klasu ulazne slike.
Da rezimiramo, arhitektura neuronske mreže korištena u primjeru sastoji se od ulaznog sloja sa 784 jedinice, skrivenog sloja sa 128 jedinica pomoću funkcije ReLU aktivacije i izlaznog sloja sa 10 jedinica koristeći softmax aktivacijsku funkciju.
Ostala nedavna pitanja i odgovori u vezi Izgradnja neuronske mreže za obavljanje klasifikacije:
- Da li je potrebno koristiti funkciju asinhronog učenja za modele mašinskog učenja koji rade u TensorFlow.js?
- Kako se model kompajlira i obučava u TensorFlow.js i koja je uloga kategoričke funkcije gubitka unakrsne entropije?
- Koji je značaj brzine učenja i broja epoha u procesu mašinskog učenja?
- Kako se podaci obuke dijele na skupove za obuku i testove u TensorFlow.js?
- Koja je svrha TensorFlow.js u izgradnji neuronske mreže za zadatke klasifikacije?