П:
Зашто је за научнике података важно да траже транспарентност?
А:Транспарентност је у суштини важна у пројектима науке о подацима и програмима машинског учења, делом и због сложености и софистицираности која их покреће - зато што ти програми „уче“ (генеришу вероватноће резултате) уместо да прате унапред одређена линеарна упутства за програмирање и зато што може бити тешко схватити на који начин технологија доноси закључке. Проблем „црне кутије“ алгоритама машинског учења који нису до краја објаснити људима који доносе одлуке је велики у овој области.
Имајући то у виду, могућност да овладају објашњеним машинским учењем или „објашњивим АИ“ вероватно ће бити главни фокус у начину на који компаније настоје да прибаве талент за научника података. Већ ДАРПА, институција која нам је донијела интернет, финансира вишемилионску студију у објашњавању АИ, покушавајући промовисати вјештине и ресурсе потребне за стварање машинског учења и технологија умјетне интелигенције, транспарентне за људе.
Један од начина да се размисли је да често постоји „фаза писмености“ развоја талената и „фаза хиперписмености“. За научника података, традиционална фаза писмености би била знање о томе како саставити програме машинског учења и како изградити алгоритми са језицима као што је Питхон; како конструисати неуронске мреже и радити са њима. Стадиј хиперлитерације ће бити способност савладавања АИ који се може објаснити, пружања транспарентности у кориштењу алгоритама машинског учења и очувања транспарентности јер ови програми раде према својим циљевима и циљевима својих корисника.
Други начин да се објасни важност транспарентности у науци о подацима је да скупови података који се користе постају све софистициранији, а самим тим и више упадљиви у живот људи. Још један главни покретач објасњавања машинског учења и науке о подацима је Европска општа уредба о заштити података која је недавно примењена како би се покушао сузбити неетично коришћење личних података. Користећи ГДПР као тест случај, стручњаци могу уочити како се потреба за објашњењем пројеката науке о подацима уклапа у питања приватности и сигурности, као и пословну етику.