П:
Зашто пакирање у машинском учењу смањује варијансу?
А:Агрегирање почетног покретања или "пакирање" у машинском учењу смањује варијансу изградњом напреднијих модела сложених скупова података. Конкретно, приступ пакирању ствара подскупове који се често преклапају како би се модели моделирали на што укљученији начин.
Једна занимљива и јасна идеја о начину примене врећа за узимање врећа је узимање скупа случајних узорака и вађење једноставне средње вредности. Затим, користећи исти скуп узорака, створите десетине подскупова изграђених као стабла одлука да манипулирате евентуалним резултатима. Друга средина требала би показати истинитију слику односа тих појединачних узорака један према другом. Иста идеја може се примијенити на било које својство било којег скупа података.
Бесплатно преузимање: Машинско учење и зашто је то важно |
Будући да овај приступ обједињује открића у више дефинисаних граница, смањује варијансу и помаже при прекомерном уградњи. Помислите на расипање воде с помало расподељеним подацима Коришћењем методе пакирања, инжењери "смањују" сложеност и усмеравају линије откривања на глатке параметре.
Неки говоре о вредности врећа као „подели и освоји“ или врсти „потпомогнуте хеуристике“. Идеја је да помоћу ансамбловског моделирања, попут употребе случајних шума, они који користе вреће као технику могу добити резултате који су нижи у варијанти. У погледу смањења сложености, пакирање такође може помоћи у прекомерном опремању. Размислите о моделу са превише података: рецимо, повежите тачке са 100 неусклађених тачака. Резултујућа линија визуелних података биће назубљена, динамична, променљива. Затим варијанту „изгладимо“ састављањем скупа процена. Код учења у ансамблу ово се често мисли као спајање неколико "слабих ученика" како би се постигао заједнички резултат „снажног учења“. Резултат је глатка, обрисанија линија података и мање дивља варијанца у моделу.
Лако је видети како се идеја пакирања може применити на ИТ системе предузећа. Пословни лидери често желе „поглед из птичје перспективе“ шта се дешава са производима, купцима итд. Пренапонски модел може вратити мање пробављиве податке и више „разбацаних“ резултата, при чему смећа може „стабилизовати“ модел и учинити га кориснијим крајњим корисницима.