Кућа Трендови Који је једноставан начин да се опише пристраност и одступање у машинском учењу?

Који је једноставан начин да се опише пристраност и одступање у машинском учењу?

Anonim

П:

Који је једноставан начин да се опише пристраност и одступање у машинском учењу?

О:

Постоји велики број компликованих начина за описивање пристрасности и варијанци у машинском учењу. Многи од њих користе значајно сложене математичке једнаџбе и графичким приказом приказују како конкретни примери представљају различите количине пристраности и варијанце.

Ево једноставног начина за описивање пристрасности, варијансе и компромиса / одступања у машинском учењу.

У основи је пристраност превелика поједностављења. Може бити важно додати дефиницији пристраности неку претпоставку или претпостављену грешку.

Ако високо пристрани резултат није био у заблуди - ако је на новцу - био би врло тачан. Проблем је у томе што поједностављени модел садржи одређену грешку, па није на оку - значајна грешка се стално понавља или чак појачава како програм машинског учења.

Једноставна дефиниција варијансе је да су резултати превише распршени. То често доводи до прекомплексности програма и проблема између сета тестирања и тренинга.

Велика варијанца значи да мале промене стварају велике промене у резултатима или резултатима.

Други начин да се једноставно опише варијанца је да има превише шума у ​​моделу, те да је због програма машинског учења теже изоловати и идентификовати прави сигнал.

Дакле, један од најједноставнијих начина упоређивања пристраности и варијансе је сугерисање да инжењери машинског учења морају прећи танку линију између превелике пристраности или превелике поједностављености и превелике варијанце или прекомплексности.

Други начин представљања овог бунара је са четверокутним дијаграмом који приказује све комбинације високе и мале варијанце. У квадранту мале пристраности / ниске варијанце, сви резултати се сакупљају у тачном групи. У резултатима високе пристраности / мале варијанце, сви се резултати сакупљају у нетачни скуп. У резултатима са ниском пристраности / великом варијанцом, резултати су раштркани око централне тачке која би представљала тачан кластер, док су у резултатима велике пристраности / велике варијанце, тачке података распршене и колективно нетачне.

Који је једноставан начин да се опише пристраност и одступање у машинском учењу?