Кућа Ит-Бусинесс Шта је неструктурирано вађење података? - дефиниција из техопедије

Шта је неструктурирано вађење података? - дефиниција из техопедије

Преглед садржаја:

Anonim

Дефиниција - Шта значи неструктурирани рударјење података?

Неструктурирано вађење података је пракса да се размотре релативно неструктурирани подаци и покушају извући из њих још рафиниранијих података. Често се састоји од вађења података из извора који се традиционално не користе у активностима вађења података.


Техопедија објашњава неструктурирано вађење података

Генерално, рударство података је пракса чешљања кроз скупове података и покушаја да се у највиши облик информација унесу у одређени формат. То је обично теже са релативно неструктурираним подацима. ИТ стручњаци дефинишу неструктуриране податке као податке који нису у одређеном формату, податке који су „тешки у тексту“ или податке који су „скривени“ у непрецизним документима за које формално није наређено да дају техничке информације.


Примјер неструктурираног документа би било писмо или преписка између двије или више страна. При неструктурираном ископавању података, технологије би сломиле то писмо, тражећи специфичне идентификаторе и битове информација, попут имена повезаних страна, датума слања писама, имена укључених предузећа, износа валуте или других количинских података битова података или кодова додијељених одређеним производима, услугама или понудама. Те се врсте података минирају и затим стављају у формат који компаније или друге странке могу користити за брзу референцу или за развијене апликације за пословну интелигенцију.

Шта је неструктурирано вађење података? - дефиниција из техопедије