Преглед садржаја:
- Дефиниција - Шта значи делимично уочљив процес одлучивања Марков (ПОМДП)?
- Техопедија објашњава делимично посматран процес одлучивања Марков (ПОМДП)
Дефиниција - Шта значи делимично уочљив процес одлучивања Марков (ПОМДП)?
Дјеломично уочен Марков процес одлучивања (ПОМПД) је Марков процес одлучивања у којем агент не може директно посматрати темељна стања у моделу. Процес одлучивања Марков (МДП) је математички оквир за моделирање одлука који приказује систем са низом стања и који пружа доносиоцу одлука на основу тих држава.
ПОМПД гради на том концепту како би показао како систем може да се носи са изазовима ограниченог посматрања.
Техопедија објашњава делимично посматран процес одлучивања Марков (ПОМДП)
У делимично проматраном Марковом процесу одлучивања, будући да темељне државе нису транспарентне за агента, од помоћи је концепт који се зове „држава веровања“. Стање веровања пружа начин да се позабави двосмисленошћу својственом моделу.
ПОМПД је користан у учењу појачања где систем може прећи модел МПД или ПОМПД користећи оно што је познато за стварање јасније слике исхода вероватноће.