П:
Који је једноставан начин да се опише пристраност и одступање у машинском учењу?
О:Постоји велики број компликованих начина за описивање пристрасности и варијанци у машинском учењу. Многи од њих користе значајно сложене математичке једнаџбе и графичким приказом приказују како конкретни примери представљају различите количине пристраности и варијанце.
Ево једноставног начина за описивање пристрасности, варијансе и компромиса / одступања у машинском учењу.
У основи је пристраност превелика поједностављења. Може бити важно додати дефиницији пристраности неку претпоставку или претпостављену грешку.
Ако високо пристрани резултат није био у заблуди - ако је на новцу - био би врло тачан. Проблем је у томе што поједностављени модел садржи одређену грешку, па није на оку - значајна грешка се стално понавља или чак појачава како програм машинског учења.
Једноставна дефиниција варијансе је да су резултати превише распршени. То често доводи до прекомплексности програма и проблема између сета тестирања и тренинга.
Велика варијанца значи да мале промене стварају велике промене у резултатима или резултатима.
Други начин да се једноставно опише варијанца је да има превише шума у моделу, те да је због програма машинског учења теже изоловати и идентификовати прави сигнал.
Дакле, један од најједноставнијих начина упоређивања пристраности и варијансе је сугерисање да инжењери машинског учења морају прећи танку линију између превелике пристраности или превелике поједностављености и превелике варијанце или прекомплексности.
Други начин представљања овог бунара је са четверокутним дијаграмом који приказује све комбинације високе и мале варијанце. У квадранту мале пристраности / ниске варијанце, сви резултати се сакупљају у тачном групи. У резултатима високе пристраности / мале варијанце, сви се резултати сакупљају у нетачни скуп. У резултатима са ниском пристраности / великом варијанцом, резултати су раштркани око централне тачке која би представљала тачан кластер, док су у резултатима велике пристраности / велике варијанце, тачке података распршене и колективно нетачне.