facebook

Szczegółowa budowa systemu SET

W konstrukcji modeli sieci neuronowych warunkiem optymalnego opisu klasyfikowanej zmiennej wyjściowej (rozwiązania kalkulowane w oparciu o zmienne wejściowe) jest prawidłowy dobór zmiennych wejściowych (danych na podstawie, których będzie tworzona sieć). Optymalizacja w wyborze cech (zmiennych) wejściowych, przejawia się w poszukiwaniu kompromisu pomiędzy liczbą cech, a ich możliwością kalkulacyjną. Dlatego, przy wyborze cech poza ich wstępną selekcją, której dokonaliśmy w oparciu o nasze doświadczenie posłużyliśmy się algorytmem genetycznym, weryfikowanym metodą krokową wsteczną i postępującą, a także innymi typami sieci (probabilistyczne i regresyjne).

Przypadki do poszczególnych zbiorów wyznaczyliśmy w sposób losowy, z zachowaniem podobnych średnich i odchyleń standardowych. Po wyborze cech i przydzieleniu ich do konkretnych grup został skonstruowany model sieci. Konstrukcja modelu została oparta na obliczeniach perceptronu wielowarstwowego (MLP). Wykorzystaliśmy także inne modele sieci: PNN, GRNN, Kohonena i inne. W celu większej dokładności zastosowaliśmy podwójne modele dla tej samej zmiennej wyjściowej tzw. „sieci łączone” ( sieci łączone są nowatorskim pomysłem stworzonym na potrzeby projektu przez nikogo dotychczas niestosowane) polegające na zastosowaniu dwóch rodzajów sieci kalkulacyjnej mało obszarowej (np. typu MLP) oraz sieci ściśle dopasowującej się (np. typu GRNN) mającej zastosowanie w przypadku bardzo dużej bazy danych. A następnie zastosowanie algorytmu ważonego dane z 2 rodzajów sieci.

W trakcie konstrukcji modelu, zwracaliśmy uwagę na liczbę warstw i neuronów w kolejnych warstwach. Dzięki temu udało się stworzyć najprostszy model o największej sile kalkulacyjnej. Perceptrony wielowarstwowe wykorzystują liniową funkcję aktywacji PSP (tzn. wyznaczają ważoną sumę swoich wartości wejściowych) oraz zwykle nieliniową funkcję aktywacji. Określenie funkcji aktywacji zależy od twórcy modelu, który przewiduje jego kształt. My wybraliśmy funkcję logistyczną (sigmoidę) o wartościach wyjściowych z przedziału (0,1). Proces uczenia się sieci, został oparty na algorytmie wstecznej propagacji błędów.

Ze względu na znaczenie poznawcze, do wstępnej interpretacji modelu sieci, wykorzystaliśmy analizę wrażliwości oraz statystyki regresyjne. Właściwością funkcjonalną sieci neuronowej jest nabywanie na drodze uczenia się umiejętności odwzorowywania różnych danych wejściowych w ciągłą wartość wyjściową. Wyniki tego procesu zostały przedstawione w formie liczbowej, w tabeli statystyk regresyjnych (wyznaczanych niezależnie dla zbioru uczącego, walidacyjnego i testowego).