Преглед садржаја:
- Дефиниција - Шта значи опен-соурце аналитика великих података?
- Тецхопедиа објашњава опен-соурце аналитику великих података
Дефиниција - Шта значи опен-соурце аналитика великих података?
Аналитика великих података отвореног кода односи се на употребу софтвера и алата отвореног кода за анализу огромних количина података у циљу прикупљања релевантних и делотворних информација које организација може да користи у сврху даљег постизања својих пословних циљева. Највећи играч у опен-соурце аналитици великих података је Апацхеов Хадооп - то је најчешће коришћена софтверска библиотека за обраду огромних скупова података на групи компјутера користећи дистрибуирани процес за паралелизам.
Тецхопедиа објашњава опен-соурце аналитику великих података
Опен-соурце аналитика великих података користи софтвер и алате отвореног кода како би се извршавала аналитика великих података коришћењем целе софтверске платформе или различитих алата отвореног кода за различите задатке у процесу анализе података. Апацхе Хадооп је најпознатији систем за анализу великих података, али су потребне и друге компоненте да би се могао успоставити прави аналитички систем.
Хадооп је имплементација алгоритма МапРедуце отвореног кода који су покренули Гоогле и Иахоо, тако да је основа већине аналитичких система данас. Многи алати за анализу великих података користе опен соурце, укључујући робусне системе база података попут отвореног кода МонгоДБ, софистицирану и скалабилну НоСКЛ базу података која је веома погодна за велике апликације података, као и друге.
Услуге аналитике великих података отвореног кода обухватају:
- Систем прикупљања података
- Контролни центар за администрацију и праћење кластера
- Библиотека машинског учења и вађења података
- Услуга координације апликација
- Цомпуте енгине
- Извршни оквир
