П:
Која су четири темеља да постанем добар научник података?
О:Као што многи стручњаци истичу, да би постао сјајан научник за податке захтева комбинацију вештина и искуства које се изграђује посвећеним учењем и анализом сложеног поља. Научници података као администратори и кустоси вредних података данас су веома тражени. Погледајмо шта неке од ових темељних вештина укључују.
Прва од четири основне компоненте рада научника је математика и статистика. Добри научници требало би да науче да буду упознати са различитим математичким концептима који се односе на надгледано и ненадзирано машинско учење, укључујући врсте алгоритама као што су стабла одлука, случајна шума, логистичка регресија, групирање и употреба димензија у машинском учењу (МЛ). Уопштено, требало би да се добро сналазе у раду с математичким једначинама и статистикама користећи ресурсе статистичке анализе.
Друга главна основна компонента рада на науци о подацима укључује програмирање и управљање базама података. Појединци би требало да буду јаки у скриптним језицима као што су Питхон и статистички језици попут Р, заједно са искуством и вештинама са семантиком базе података и СКЛ и оперативним техникама. Познавање софтверских компоненти попут Хадооп, МапРедуце, Хиве и Пиг такође је привлачно послодавцима.
Трећа основна компонента постајања добрим научником података је теоријска и филозофска компонента разумевања науке о подацима и машинском учењу. Те би особе требале самоиницијативно рјешавати проблеме знатижељним умовима - уосталом, комбинују сирову квантитативну анализу с креативним разумијевањем машинског учења и процеса науке о подацима. Уместо да буду људи техничког броја, они би требало да имају дубоко утемељење у томе шта значи стварати пројекте машинског учења и радити на иницијативама за науку о подацима у смислу крајњих циљева и крајњих резултата.
Четврти главни стуб учења науке бити добри научници укључује рад са људима и могућност употребе података на начине који имају смисла за друге људе.
Добри научници могу бити приповедачи - могу превести квантитативне податке у наративе и увиде. Као такви, они би требало да имају добре комуникацијске вештине да би могли да свој рад изнесу за сто и да га ефикасно дистрибуирају међу више заинтересованих страна или одређену публику. Ово су неке од главних врста вештина које граде добар научник за податке који је спреман да учествује у данашњој брзи и брзо напредујућој ИТ индустрији.