W wyniku prac badawczych prowadzonych w ramach zadania nr 2 powstał artykuł opublikowany w czasopiśmie Information Sciences (IF: 6.795, 200 pkt MEiN).
Kluska J., Madera M.: Extremely simple classifier based on fuzzy logic and gene expression programming. Information Sciences, Volume 571, September 2021, Pages 560-579. https://doi.org/10.1016/j.ins.2021.05.041
Abstrakt
W tym artykule proponujemy nowy projekt bardzo prostego klasyfikatora binarnego opartego na danych i przeprowadzamy badanie empiryczne jego wydajności. Dane zawierają zmienne ciągłe i kategoryczne. System klasyfikacji składa się z wysoce interpretowalnych rozmytych metareguł. Opracowano nowe twierdzenie, które gwarantuje, że te metareguły są równoważne wyrażeniom algebraicznym. Wyrażenia algebraiczne uzyskano przy użyciu techniki programowania ekspresji genów. Liczba cech w modelowanym zestawie danych nie wpływa na złożoność metareguł. Wydajność wynikowych metareguł jest porównywalna z wydajnością reguł tworzonych przez większość popularnych metod uczenia maszynowego. Nowo wprowadzony klasyfikator (GPR) wydaje się być najprostszym spośród klasyfikatorów opartych na rozmytych regułach. Jego skuteczność została przetestowana na 16 zestawach danych i porównana z 22 innymi algorytmami klasyfikacji. GPR okazał się zaskakująco dobry; tj. należy do grupy najlepszych klasyfikatorów, gdy kryterium jakości jest obszar pod krzywą ROC i dokładność klasyfikacji. Analiza Scotta-Knotta wskazuje, że pod względem wydajności GPR jest współmierny z wiodącą grupą 3 algorytmów, a test Wilcoxona potwierdził statystyczną wiarygodność uzyskanych wyników. Wysoka interpretowalność jest udowodniona przykładami modeli klasyfikacyjnych.