Преглед садржаја:
Дефиниција - Шта значи неструктурирани подаци?
Неструктурирани подаци представљају све податке који немају препознатљиву структуру. Она је неорганизована и сирова и може бити нетекстуална или текстуална. На пример, е-пошта је лепа илустрација неструктурираних текстуалних података. Укључује време, датум, податке о примаоцу и пошиљаоцу и тему итд., Али тело е-поште остаје неструктурирано. Неструктурирани подаци се такође могу идентификовати као слабо структурирани подаци, при чему извори података укључују структуру, али не прате сви подаци у скупу података исту структуру.
У предузећима која су усредсређена на купца, подаци пронађени у неструктурираном облику могу се испитати да би се побољшао маркетинг односа и управљање односима са клијентима (ЦРМ). Како апликације друштвених медија, попут Фацебоока и Твиттера, иду у ток, неструктурирани развој података вероватно ће надмашити напредак структурираних података.
Техопедиа објашњава неструктуриране податке
Неструктурирани подаци односе се на податке који слиједе на облик који је мање поредан од предмета као што су странице с прорачунским таблицама, таблице базе података или други линеарни или наручени скупови података. Заправо, термин "скуп података" је користан јер је повезан са подацима који су у уредним, доступним низовима, без икаквог додатног садржаја, а који су повезани или означени у одређеној структури.
Остали случајеви неструктурираних текстуалних података укључују Ворд документе, ПоверПоинт презентације, тренутне поруке, софтвер за колаборацију, документе, књиге, постове на друштвеним медијима и медицинске податке. Нетекстуални неструктурирани подаци се обично стварају у медијима, као што су МП3 аудио датотеке, ЈПЕГ слике и Фласх видео датотеке итд.
Неструктурирани подаци обично не садрже унапред дефинисани модел података и можда се не подударају добро са релацијским табелама. Неструктурирани подаци су обично тешки. Међутим, може да садржи бројеве и датуме, као и чињенице. То доводи до нејасноћа које је тешко препознати користећи конвенционалне софтверске програме.
Складиштење огромне количине неструктурираних података генерисаних у предузећу, ако се лоше управља, може довести до већих трошкова. Подаци у папирнатим документима или у електронском формату морају бити скенирани како би апликација за претрагу рашчланила идеје, зависно од речи коришћених у одређеним контекстима. То је познато као предузеће или семантичка претрага.
