Кућа Аудио Како инжењери могу да процене скупове тренинга и тест тестове како би уочили могуће прекомерно уклапање у машинском учењу?

Како инжењери могу да процене скупове тренинга и тест тестове како би уочили могуће прекомерно уклапање у машинском учењу?

Anonim

П:

Како инжењери могу да процене скупове тренинга и тест тестове како би уочили могуће прекомерно уклапање у машинском учењу?

А:

Да бисте разумели како се то ради, потребно је да стекнете основно разумевање улога различитих скупова података у типичном пројекту машинског учења. Тренинг сет је осмишљен тако да технологији даје референтни оквир - базу података коју програм користи за доношење предиктивних и веродостојних одлука. У тестном сету налази се тест уређаја на подацима.

Оверфиттинг је синдром у машинском учењу где модел не у потпуности одговара подацима или циљу.

Бесплатно преузимање: Машинско учење и зашто је то важно

Једна од свеобухватних заповести машинског учења је да подаци о тренингу и тестни подаци треба да буду одвојени скупови података. Постоји прилично широк консензус о томе, бар у многим апликацијама, због одређених проблема са коришћењем истог сета који сте користили за обуку за тестирање програма машинског учења.

Када програм машинског учења користи сет за обуку, који би у основи могао бити назван скуп улаза, он подучава тај скуп тренинга за доношење одлука о предиктивним резултатима. Један врло основни начин размишљања је да је сет за обуку „храна“ за процес интелектуалног рачунања.

Сада када се исти скуп користи за тестирање, машина често може вратити одличне резултате. То је зато што смо већ видели те податке. Али цео циљ машинског учења у многим случајевима јесте постизање резултата о подацима који раније нису виђени. Програми машинског учења за општу намену раде се на различитим низовима података. Другим речима, принцип машинског учења је откриће, а обично не постигнете толико тога користећи иницијални сет тренинга за потребе теста.

Процјењујући скупове тренинга и тестне сетове за могуће прекомјерно опремање, инжењери могу процијенити резултате и схватити зашто програм може то учинити другачије на компаративним резултатима ова два скупа, или у неким случајевима како машина може превише добро радити на самим подацима о обуци .

Описујући неке од ових проблема у машинском учењу у делу из 2014, Јасон Бровнлее из Мастери Леарнинг Мастери описује пренамерност на овај начин:

"Модел који је изабран због своје тачности на скупу података за обуку, а не због његове тачности на невидљивом скупу података за тест, врло је вероватно да има нижу тачност на невидљивом скупу података за тест", пише Бровнлее. "Разлог је тај што модел није тако генерализован. Спецализирао се на структуру у скупу података за обуку (курзив је додан). То се назива прекомерно опремање и подмукло је него што мислите."

Лаички речено, могли бисте рећи да програм специјализације за програм обуке постаје превише ригидан. То је још један метафорични начин да се утврди зашто програм машинског учења не служи оптимално коришћењем тренинг-сета за тест скуп. Такође је добар начин да приступите оцењивању ова два различита скупа, јер ће резултати показати инжењерима пуно о томе како програм ради. Желите мањи размак између тачности за оба модела. Желите да се уверите да систем није препун или прецизно спојен са одређеним скупом података, али то је опћенитије и може да расте и да се развија командом.

Како инжењери могу да процене скупове тренинга и тест тестове како би уочили могуће прекомерно уклапање у машинском учењу?