Кућа Развој Шта је учење ојачања? - дефиниција из техопедије

Шта је учење ојачања? - дефиниција из техопедије

Преглед садржаја:

Anonim

Дефиниција - Шта значи ојачавање учења?

Ојачавање учења, у контексту вештачке интелигенције, је врста динамичког програмирања која тренира алгоритме користећи систем награде и казне.

Алгоритам учења или агента за појачавање учи интеракцијом са окружењем. Агент прима награде ако правилно обавља и казне за погрешно обављање. Агент учи без интервенције од стране човека тако што максимизира своју награду и минимизира казну.

Техопедиа објашњава ојачавање учења

Ојачавање учења је приступ машинском учењу који је инспирисан бихевиористичком психологијом. То је слично начину на који дете учи да обавља нови задатак. Ојачавање учења је у супротности са другим приступима машинског учења по томе што алгоритму није изричито речено како да извршава задатак, већ делује кроз проблем сам.

Као агент, који би могао бити ауто који се вози или програм који игра шах, комуницира са окружењем, добија наградно стање у зависности од начина извођења, попут сигурне вожње до одредишта или побједе у игри. Супротно томе, агент добија казну за погрешно обављање послова, као што је излазак са пута или потврђивање.

Агент с временом доноси одлуке како би повећао своју награду и смањио казну користећи динамичко програмирање. Предност овог приступа вештачкој интелигенцији је у томе што омогућава АИ програму да учи без да програмер прецизира како агент треба да обавља задатак.

Шта је учење ојачања? - дефиниција из техопедије