П:
Зашто неки пројекти машинског учења требају огроман број актера?
А:Када размишљате о машинском учењу, обично размишљате о квалификованим научницима података који раде на тастатурама у рачунарским собама. Екстремно је наглашен квантитативни анализа и алгоритми. Многи од ових програма не постоје мноштво непосредног контекста у стварном свету - барем би то многи помислили.
Међутим, неки данашњи најнепопуларнији програми машинског учења користе истинске армије људских глумаца на улици, у продавницама и било где где могу да моделирају основне људске активности попут шетње, рада или куповине.
Бесплатно преузимање: Машинско учење и зашто је то важно |
Жичани чланак Тома Симоните-а то врло добро илуструје погодним насловом „Да би АИ био паметнији, људи обављају чудне ниско плаћене задатке“.
Користећи пример кратких видеа снимљених у трговини прехрамбених производа Вхоле Фоодс, Симоните истиче врсте послова који ће помоћи у изградњи неке од наредних фаза машинског учења.
То доводи до питања зашто су сви ти људи ангажовани на снимању филмова у кратким и једноставним видео записима који документују радње као рудиментарне попут померања руке или ноге.
Одговор баца мало светла на то где је машинско учење и где иде.
„Истраживачи и предузетници желе да виде АИ да разуме и делује у физичком свету“, пише Симоните објашњавајући зашто он и остали веслају камерама. „Отуда потреба радника да глуме сцене у супермаркетима и кућама. Они генеришу поучни материјал за подучавање алгоритама о свету и људима у њему. "
Као што ће многи стручњаци истакнути, неке од највећих граница машинског учења укључују обраду слика и обраду природног језика. Ово су изузетно квантитативни поступци - другим речима, не постоји широк спектар улаза као што је то у „перформансним“ окружењима у стварном свету. Уместо тога, програми машинског учења користе визуелне и аудио податке на врло специфичне начине за прављење модела. Код обраде слике бира се карактеристике из (коначног) видног поља. За НЛП то је састављање фонема.
Прекорачење ових специфичних категорија уноса укључује нешто што бисте могли назвати „јаз између слике и говора“ - надилазећи ствари попут обраде слике и препознавања говора прелазите у подручја где рачунари морају бити аналитични на различите начине. Сетови за обуку бит ће у основи другачији.
Уђите у војску видео сниматеља. У неким од ових нових пројеката машинског учења најмања идеја људских активности су скупови за обуку. Уместо да буду обучени да траже функције и ивице и пикселе који се састављају у задатке за класификацију, рачунари уместо тога користе видео тренинге да процене како изгледају различите врсте акције.
Кључно је шта инжињери могу радити са овим подацима када се они сакупљају и учитавају и када је рачунар обучен на њима. Ускоро ћете видети резултате у разним областима - на пример, то ће надзор учинити изузетно ефикасним. Рачунари ће у визуелном пољу моћи да „виде“ шта људи раде и да га примене на пољима попут маркетинга и продаје или, можда, у неким случајевима, владиних послова или кривичног правосуђа.
Последице такође бацају мало светла у расправу између питања максималне користи и приватности. Велики део употребе ових видеа ће изградити моделе машинског учења који раде за надзор - али шта је са људима који не желе да буду под надзором? Када се ови нови програми машинског учења примењују у јавном простору, која су права појединца и где је та црта повучена?
У сваком случају, компаније користе ове врсте људских и видео ресурса да би се заиста укопале у наредне кругове напретка машинског учења који ће рачунарима заправо омогућити да препознају шта се дешава око њих, а не само да класификују слике или раде са фонемима говор. Ово је изузетно занимљив и контроверзан развој вештачке интелигенције и заслужује свој део пажње у технолошким медијима и шире.