Otkrivanje znanja

Sa pojavom neparametaskih modela mašinskog učenja i rastućom popularnošću dubokih neuronskih mreža, većina klasifikatora i regresora koji se danas koriste su “crne kutije”. Tačnost ovih modela često je neuporedivo bolja nego kod konvencionalih modela, a iako znamo matematiku koja se krije iza njih, ipak ne možemo direktno da zaključimo kompleksnu vezu izmeću ulaznih i izlaznih podataka. Velika tačnost modela je od izuzetnog praktičkog značaja, ali kako bismo imali bolje razumevanje problema i kako bismo pomerili granice nauke moramo da zagrebemo dublje u način njihovog funkcionisanja.

 

 

 

Oslanjamo se na nekoliko tehnika otkrivanja znanja, koje se baziraju na indirektnim posmatranjima modela mašinskog učenja. Jedan od njih je test slučajne permutacije. Pomoću njega procenjujemo važnost obeležja na osnovu smanjenja tačnosti modela nakon slučajne permutacije obeležja u skupu podataka. Morisonova i Soboljeova analiza neizvesnosti i osetljivosti nam sa druge strane govore o mogućim izlazima sistema i interakcijama između ulaznih parametara. Analiza objašnjivosti modela ide korak dalje. Za svako obeležje koje se koristi u prediktivnom modelu, kroz aproksimaciju zasnovanu na uzorkovanju , možemo da procenimo pozitivan ili negativan uticaj na izlaznu promenljivu, što nam omogućava da domensko istraživanje usmerimo tamo gde je najefikasnije. Ovi i drugi modeli nam omogućavaju da odredimo uticaj različitih parametara zemljišta i vremena na prinos useva i da utvrdimo koji hibridi kukuruza su otporni na sušu, a koje sorte soje imaju stabilan prinos.