Кућа Базе података Шта су прљави подаци? - дефиниција из техопедије

Шта су прљави подаци? - дефиниција из техопедије

Преглед садржаја:

Anonim

Дефиниција - Шта значе прљави подаци?

Прљави подаци односе се на податке који садрже погрешне информације. Може се користити и када се односи на податке који су у меморији и још нису учитани у базу података. Потпуно уклањање прљавих података из неког извора је непрактично или практично немогуће.

Следећи подаци се могу сматрати прљавим подацима:

  • Погрешни подаци
  • Дупликат података
  • Нетачни подаци
  • Нетачни подаци
  • Неинтегрирани подаци
  • Подаци који крше правила пословања
  • Подаци без генерализованог форматирања
  • Нетачно означени или написани подаци

Тецхопедиа објашњава прљаве податке

Поред нетачног уноса података, прљави подаци се могу генерирати и због неправилних метода у управљању и складиштењу података. Неке прљаве врсте података су објашњене у наставку:

  • Нетачни подаци - Да би се осигурало да су подаци валидни или тачни, унесена вредност треба да буде у складу са важећим вредностима поља. На примјер, вриједност унесена у поље мјесеца треба бити у распону од 1 до 12, или старост појединца мора бити мања од 130. Исправност вриједности података може се програмско наметнути помоћу претраживачких таблица или помоћу провјере уређивања.
  • Нетачни подаци - Могуће је да вредност података може бити тачна, али не тачна. Понекад је практично испитати друге датотеке или поља како бисте утврдили да ли је вредност података тачна на основу контекста који се користи. Ипак, тачност се често може потврдити само ручном верификацијом.
  • Кршење пословних правила - Подаци који крше пословна правила су друга врста прљавих података. На примјер, ефективни датум мора увијек наступити прије истека рока ваљаности. Други пример кршења пословних правила може бити захтев пацијента за Медицаре осигурање у случају када пацијент још увек није старији од пензије и нема право на Медицаре.
  • Недоследни подаци - Непрекидно сувишање података доводи до недоследности података. Свака организација има утицај на недоследне и понављајуће податке. Ово је посебно типично за податке о клијентима.
  • Непотпуни подаци - Подаци са недостајућим вредностима су главна врста непотпуних података.
  • Дупликатни подаци - Дупликатни подаци могу се појавити због опетованих предаја, неправилног придруживања података или због грешке корисника.

У циљу повећања квалитета података и спречавања прљавих података, организације би требале да садрже методологије за осигурање потпуности, валидности, доследности и тачности података.

Шта су прљави подаци? - дефиниција из техопедије