П:
Зашто је одабир функција толико важан у машинском учењу?
А:Одабир функција је изузетно важан у машинском учењу, првенствено зато што служи као основна техника усмеравања употребе променљивих на оно што је најефикасније и најефикасније у датом систему машинског учења.
Стручњаци разговарају о томе како одабир функција и екстракција значајки делују на минимализацију клетве димензија или помажу у превазилажењу прекомерног намештања - то су различити начини за решавање идеје о прекомерно сложеном моделирању.
Бесплатно преузимање: Машинско учење и зашто је то важно |
Други начин да то кажемо је да избор функција помаже програмерима да дају алате да користе само најрелевантније и најкорисније податке у сетовима за машинско учење, што драматично смањује трошкове и обим података.
Један пример је идеја о мерењу сложеног облика у скали. Како се програм скалира, он идентификује већи број тачака података и систем постаје много сложенији. Али сложен облик није типичан скуп података који користи систем машинског учења. Ови системи могу користити скупове података који имају јако различите разлике у различитим варијаблама. На пример, при класификовању врста, инжењери могу да користе избор функција само да проуче променљиве које ће им дати највише циљане резултате. Ако свака животиња у графикону има исти број очију или ногу, ти се подаци могу уклонити или се могу издвојити друге релевантније тачке података.
Избор могућности је дискриминирајући процес којим инжењери усмјеравају системе машинског учења ка циљу. Поред идеје о уклањању сложености са система на скали, избор функција такође може бити користан у оптимизацији аспеката онога што стручњаци називају „компликација варијанције пристраности“ у машинском учењу.
Разлози због којих избор функција помаже при пристраности и анализи варијанце су сложенији. Студија са Универзитета Цорнелл о избору карактеристика, варијанци пристраности и паковању служи да илуструје како селекција значајки помаже пројекту.
Према ауторима, рад „испитује механизам помоћу којег избор могућности побољшава тачност учења под надзором“.
Студија даље каже:
Емпиријска анализа пристраности / варијанце у току селекције карактеристика показује да најтачнији скуп карактеристика одговара најбољој тачки замене варијанце за алгоритам учења.
У дискусији о употреби јаке или слабе важности, писци говоре о одабиру карактеристика као о "методи за смањење варијанце" - ово има смисла када о варијанци размишљате као о суштини варијације у датој варијабли. Ако нема варијанце, тачка података или низ могу бити у суштини бескорисни. Ако је изузетно велика варијанца, то се може претворити у оно што инжењери могу сматрати "буком" или ирелевантним, произвољним резултатима које је тешко да систем машинског учења управља.
У светлу тога, избор функција је основни део дизајна у машинском учењу.