П:
Зашто би се менаџери требали чувати од прекомерне залихе базе података?
А:Менаџери база података и други ИТ професионалци требало би да се штите од „редундантности базе података“ или „сувишности података“ због свих негативних утицаја које вишак може имати у систему базе података или окружењу. Где год да се дуплира одређени део података, било у два поља у бази података, или у два различита окружења базе података, то може имати последице за преузимање података.
Један од првих разлога за избегавање сувишних података је тај што може бити расипан или претеран.
Важно је напоменути да се планирају неке врсте залиха података како би се заштитили и направили сигурносне копије података. Међутим, други потичу из лошег или неефикасног кодирања или недостатка пажње најбољим праксама. У многим случајевима велика количина сувишних података узрокује да база података брзо нарасте изван разумне величине. Имајући то у виду, улажу се многи напори у борби против сувишности података ради уштеде простора у бази података, а самим тим и за смањење трошкова и напора за одржавање. Међутим, то се мора учинити с обзиром на практичност - инжењери могу практицирати нешто што се назива дедукција података, али то се мора учинити на ефикасан начин.
На пример, менаџери базе података могу да истраже нешто попут одузимања низа из поновљеног поља, попут дељеног клијента или имена компаније, и замене га једноставном променљивом референцом где се стринг држи негде другде. Ово може уштедети простор у бази података, али може захтевати и више активности сервера за обављање датог упита, тако да можда неће бити ефикасно колико се чини.
Други велики разлог за дуплицирање података или за избјегавање сувишних података је због збрке која може резултирати. Сувишни подаци у бази података могу проузроковати разне врсте аномалија. Једна од њих назива се аномалија ажурирања - аномалије ажурирања се дешавају када се рекорд поново унесе са ажурираним информацијама, али ажурирање не враћа у првобитни запис. У таквој ситуацији могу постојати три различита записа за одређеног запосленог у компанији, са три различита наслова посла и три различите адресе, јер се подаци о особи не ажурирају у целој бази података, већ само у задњем уписаном запису.
Као што предлажу стручњаци, администратори базе података могу да избегну сувишност података дизајном. Такође се могу укључити у праксе нормализације података које могу поправити аномалије ажурирања и друге врсте аномалија стандардизујући начине на који се воде евиденције табела база података. Администратори базе података такође могу да предузму напоре на издвајању података који чисте и стандардизују податке на друге начине. Све ово служи за сврху стварања чистијих табела база података, чинећи записе база података доследнијим и спречавајући све главобоље и сложене проблеме повезане са непланираним вишком података.