Veritasov indeks podatkovne genomike prvi put daje uvid u sastav podataka na poslu Istaknuto
Istraživanje pokazuje da je nevjerojatnih 41 posto podataka u tvrtkama zastarjelo i više se ne koristi. Veritas pokreće novi projekt, Genomiku podataka (Data Genomics) čiji je cilj istraživati globalne trendove u području poslovnih podataka.
U svojem prvom istraživanju Indeksa genomike podataka, Veritas Tehnologies je objavila prvi točan pregled sastava podataka koji se kriju po tvrtkama i korporacijama. Ovo istraživanje u realnom vremenu pokazuje da više od 40% podataka nije na bilo koji način taknuto minimalno tri godine, što znači da su pred tvrtkama velike prilike da značajno utječu na svoje operativne troškove. Indeks genomike podataka prvi je korak prema uvidu u podatke kojima tvrtke raspolažu.
Radi se o prvom izvještaju koji daje točan uvid u stanje podataka u današnjem poslovnom okruženju te stoga može poslužiti kao standard za usporedbu.
Glavni zaključci istraživanja podatkovnih genoma navode kako prevladavaju softverski inženjeri, da se najveća zaposlenost primjećuje na jesen i kako 41 posto podataka nikad ne bude taknuto.
Indeks otkriva da slike, datoteke vezane uz razvoj softvera i sažete (komprimirane) datoteke čine gotovo jednu trećinu svih datoteka u okruženju. Datoteke vezane uz razvoj softvera čine velikih 20% u ukupnoj količini datoteka. Kada se pogledaju trendovi u posljednjih 10 godina, u odnosu na ostale vrste datoteka, količina prezentacijskih datoteka pala je za čak 500%.
Najviša zaposlenost bilježi se na jesen. Najdramatičnije povećanje vidi se u vidu 91% više tekstualnih datoteka, 48% više proračunskih tablica te čak 89% više podataka vezanih uz geografske informacijske sustave. Tijekom jeseni očito se najviše bavimo i snimanjem videa, odnosno snimke napravljene tijekom ljeta stavljamo na diskove tvrtke. Količina videozapisa raste 68% tijekom jeseni.
41% podataka u poslovnom okruženju nikad ne bude taknuto. Uz izuzetak zahtjeva vezanih uz usklađenost sa zakonodavnim okvirom i drugim standardima poslovanja kojih se tvrtke moraju pridržavati, granica od tri godine smatra se općim standardom koji definira trenutak u kojem podaci više nisu relevantni već zastarjeli. Uzme li se u obzir ovaj standard, čak 41% podataka u tvrtkama može se proglasiti takvima jer nisu promijenjeni, na bilo koji način, tijekom protekle tri godine.
U istraživanju je pokazano kako napušteni podaci nepotrebno opterećuju sustave. Podaci kojima se ne zna vlasnik smatraju se napuštenima. Napušteni podaci često nisu primarna briga tvrtki jer ih ne vide i o njima ne razmišljaju; no, ti ih podaci zbog toga koštaju. Temeljem rezultata koje pokazuje ovaj indeks, u slučaju napuštenih podataka u pravilu se radi o vrstama datoteka s bogatim sadržajem – poput videozapisa, slika ili prezentacija, a sve je ove vrste datoteka rizično ostaviti bez nadzora. Ove vrste podataka također zauzimaju više prostora na disku u odnosu na broj samih datoteka – razlika je više od 200%.
U velikoj tvrtki koja posjeduje 10 petabajta (PB) podataka, što je bio prosjek u ovom istraživanju, projekt kojim bi se arhivirale zastarjele i nepotrebne prezentacije, dokumenti, proračunske tablice i tekstualne datoteke na godišnjoj bi razini rezultirao s uštedom od 2 milijuna dolara.
"Naši nam korisnici s vremena na vrijeme kažu da se susreću s dva suprotna i međusobno sukobljena procesa: s jedne strane, količina podataka eksponencijalno raste, ali s druge strane postoje vrlo realna ograničenja resursa i budžeta koji je na raspolaganju za nove servere i aplikacije", kaže Drago Gajski, regionalni menadžer Veritasa za područje jugoistočne Europe.
"Oslanjajući se na Veritasovo razumijevanje glavnih karakteristika metapodataka, vrlo jednostavno možemo saznati kakvi se podaci nalaze u prosječnom podatkovnom okruženju. Ovaj uvid svakako će biti dobrodošao svim tvrtkama koje se susreću s gomilajućim podacima na dnevnoj bazi", naglašava Gajski.
Indeks genomike podataka prvo je istraživanje koje mjeri točne podatke i detalje o stvarnim poslovnim okruženjima – od vrsti datoteka koje su spremljene pa do prosječne starosti datoteka i njihovog proporcionalnog udjela u ukupnoj količini.
Veritas također objavljuje svoj projekt Data Genomics, prvu inicijativu ove vrste koja omogućava organizacijama da bolje razumiju pravu narav nestrukturiranih podataka koje stvaraju, pohranjuju i kojima se koriste svakoga dana. Cijeli će projekt uključivati rad podatkovnih znanstvenika, vodećih stručnjaka u ovom industrijskom sektoru i drugih stručnjaka koji će pomoći definirati genomiku upravljanja podacima te koji će svoje rezultate podijeliti s organizacijama što se susreću s ovim problemima rasta.
Iako je Veritas jedan od osnivača i glavnih sudionika u projektu, ovaj će projekt, s komercijalne strane, ostati neovisan od Veritasovog glavnog poslovanja.
Vezani članci
- Novi ugovori Ericssona Nikole Tesle vrijedni više od 7 milijuna eura
- X planira prikupljati biometrijske podatke, povijest poslova i školovanja
- Dell Technologies stvara novu vrijednost podataka
- Veritas predstavio NetBackup 9 koji podržava svaki oblak, izvor podataka, računalno opterećenje i arhitekturu
- Traže se stručnjaci za kvantno računalstvo i digitalne valute