П:
Зашто је обавештавање података важно у неким пројектима машинског учења?
А:Биљешке о подацима битне су за машинско учење јер у многим случајевима знатно олакшава рад програма машинског учења.
Ово има везе са разликом између надзираног и ненадзираног машинског учења. Са надзираним машинским учењем подаци о обуци су већ означени тако да машина може више разумети жељене резултате. На пример, ако је сврха програма препознавање мачака на сликама, систем већ има велики број фотографија означених као мачка или не. Затим користи те примере да би успоредио нове податке да би дао своје резултате.
Бесплатно преузимање: Машинско учење и зашто је то важно |
Ако се не контролише машинско учење, нема ознака и систем мора да користи атрибуте и друге технике за идентификацију мачака. Инжињери могу обучити програм у препознавању визуелних карактеристика мачака попут оштрица или репова, али тај поступак тешко да је икада једноставан као што би био у надгледаном машинском учењу где те налепнице играју врло важну улогу.
Биљежење података је поступак постављања наљепница на скупове података о обуци. Оне се могу применити на много различитих начина - горе смо говорили о напоменивању бинарних података - мачке или не мачке - али су такође важне и друге врсте напомена. На пример, у медицинском пољу, обавештење о подацима може укључивати означавање специфичних биолошких слика ознакама које идентификују патологију или маркере других медицинских својстава.
Биљежење података подразумијева посао - а то често раде тимови људи - али то је основни дио онога што чини да многи пројекти машинског учења тачно функционишу. Омогућава почетну поставку за подучавање програма ономе што треба да научи и како да дискриминише разне инпуте да би се дошло до тачних резултата.