П:
Како концепт равнотеже може информисати пројекте машинског учења?
О:Уопште речено, равнотежа ће информисати машинско учење настојећи да стабилизује окружење машинског учења и створи исходе компатибилним мешавином детерминистичких и вероватних компоненти.
Стручњаци описују „равнотежу“ као ситуацију у којој рационални актери у систему машинског учења постижу консензус о стратешким акцијама - нарочито, Насх-ова равнотежа у теорији игара укључује два или више ових рационалних актера који консолидују стратегије препознајући да ниједан играч нема користи од промена одређене стратегије ако остали играчи не мењају своју.
Бесплатно преузимање: Машинско учење и зашто је то важно |
Посебно популарна и једноставна демонстрација Насх-ове равнотеже укључује једноставну матрицу у којој два играча бирају бинарни исход.
Наведено је прилично технички начин описивања равнотеже и њеног рада. Много неформалнији начин илустрације концепта равнотеже, посебно горњег примера двојице рационалних актера од којих сваки има бинарни избор, јесте размишљање о томе што бисте могли назвати сценаријем „ходања једни према другима у ходнику средње школе“.
Претпоставимо да двоје људи хода у различитим правцима низ ходник средње школе (или било које друге врсте подручја) у којем има простора за само две особе у ширини. Два отворена пута су бинарни исходи. Ако два рационална актера изаберу различите бинарне исходе који се не сукобљавају један с другим, проћи ће један поред другог и поздравити се. Ако одаберу два конфликтна бинарна исхода - ходају истим простором и један од њих ће морати да попушта.
У горњем примеру, ако два рационална актера изаберу два компатибилна и неконфликтна исхода, општи консензус је да ни један не постиже променом своје стратегије - у овом случају својих смерница - ако друга особа не промени своје.
Наведено представља равнотежу која се може моделирати у било којој конструкцији машинског учења. Имајући овај једноставан пример, исход ће увек бити два рационална актера који сарађују, или другим речима, двоје људи који пролазе један поред другог.
Супротно би се могло назвати „неравнотежом“ - ако два рационална актера изаберу сукобљене исходе, као што је већ поменуто, један од њих ће морати да донесе. Међутим, МЛ програм који ово моделира могао би бити бачен у бесконачну петљу ако се обоје одлуче да попуштају - слично као да се двоје људи крећу да би се покушали прилагодити једни другима и даље наставити да иду према судару.
Равнотеже попут оне изнад обично ће се користити у машинском учењу за стварање консензуса и стабилизацију модела. Инжињери и програмери ће тражити оне сценарије и ситуације које имају користи од равнотеже и радити на промени или решавању оних који то не чине. Гледајући примере из стварног света који одговарају МЛ равнотежама, лако је видети како је ова врста анализе у систему машинског учења јединствено поучна за проналажење модела људског понашања стварањем рационалних актера и агената. То је само један одличан пример како се равнотежа може користити за напредак у примени система машинског учења.