Међу технолошким стартапима, научник података све је чешћи назив који се користи за означавање геекова података који су у стању да премосте традиционално одвојена функционална подручја података. Научник података је неко ко пријатно обавља неколико (ако не и свих) аспеката пројеката података:
- Набавка података: Ово може подразумијевати писање прилагођених анализатора и веб претраживача или скрипти које циљају одређене веб услуге или АПИ-је за нетрадиционалне изворе података.
- Управљање подацима: ЕТЛ, манипулирање, испитивање и одржавање података у базама података, продавницама кључева и вредности или Хадооп-у.
- Визуализација информација: Откривање образаца употребом статичких алата и / или интерактивних платформа заснованих на Фласх-у, ЈаваСцрипт-у или обради.
- Аналитика: Ово се може кретати од једноставних до сложених техника у мултиваријантној статистици, машинском учењу и НЛП-у.
- Увид: Издвојите, резимирајте и представите кључна открића широкој публици.
Постоји много алата, вештина и техничких детаља, а човек може провести годинама савладавајући сваку од горе наведених ставки. Иако научник података можда не поседује истинско стручно знање ни у једном од подручја, он / она угодно прескаче напред и назад и извршава основне задатке у свим њима. Резултат је избирљивост података довољна за брзу истрагу података и давање одговора на (висок ниво) питања од стране менаџмента. (о научницима података у часопису Дата Сциентист: Нове рок звезде света технологије.)
Да би неговале научнике података, компаније се морају више фокусирати на културу и организациону структуру. Многи податковни радници имају довољно вештина и обуке да брзо постану продуктивни у различитим областима података. Проблем је што већина не ради у окружењима која их подстичу да постану научници. Заглављени су у силосу и ограничени на једну или две области података. Често су ограничени да користе алате "које су одобрили" њихови менаџери.