П:
Која су кључна питања која треба узети у обзир у великој стратегији за похрану података?
О:Једно од највећих проблема које се игнорише код великог складиштења података је приступачност тимова којима је то потребно. Подаци се редовно чувају без икакве документације, на местима где је тешко приступити или где релевантни тимови заборављају чињеницу да уопште постоје. На крају, велико складиштење података требало би да преузме прву отворену стратегију где се тимови упознају са његовим постојањем, од чега се састоје подаци и како да им приступе, тако да тимови могу да га користе у софтверу ако им затреба.
Још једно критично питање које сматрам је квалитета података који се чувају. Подаци се требају чувати у облику најквалитетнијег облика у којем могу постојати на свом крајњем мјесту складиштења. Чување података ниског квалитета у језеру података обично је у реду, али како се наставља низ низ података, свака фаза би требала повећати квалитету података тако да се они похране у облику најквалитетнијег система у систему попут складишта података или базе података аналитике. То ће повећати квалитет система који троше почивалиште података.