Problémy kvality dát
Dlhodobejšie skúsenosti s využívaním data warehousových platforiem ukázali že firmy a používatelia nie sú schopní dosiahnuť očakávané výhody a prínosy s týchto systémov. Tieto problémy majú spoločného menovateľa: reportovacie systémy sú v skutočnosti iba front-end grafické užívateľské prostredie (graphical user interfaces -GUI) a zapuzdrené business procesy, ktoré sa spoliehajú na poskytované dáta. Podobné skúsenosti sa dajú nájsť aj v prevádzke iných IT systémov, od CRM platforiem cez rôzne monitorovacie a reportovacie dashboardy a nakoniec aj desktop a mobilné aplikácie. Tieto aplikácie nedokážu zabezpečiť požadovanú kvalitu dát. A kvalita vstupných dát určuje čo je možné očakávať ako výstup.
Pojmom “Kvalita dát” sa označuje viac ako iba základné firemné údaje ako názov firmy a firemná adresa. Zahŕňa atribúty ako výrobné čísla produktov, obsahy číselníkov, súvisiace popisy položiek a rôzne vlastnosti ktoré sa vzťahujú k jednotlivým položkám. Niekoľko ďalších príkladov z tejto oblasti sú správne priradené jednotky k položkám, číselníky a kódové označenia výkonov v zdravotníctve a poisťovníctve, telefónne čísla v medzinárodnom formáte, rozdielne čísla výrobkov používané v jednotlivých systémoch – interných aj externých, formáty poštových smerových čísel v rôznych krajinách, rodné čísla a ich ekvivalenty, niekoľko rôznych unikátnych čísel ktoré identifikujú osoby (rodné číslo, číslo občianskeho a vodičského preukazu, číslo pasu a podobne), emailové adresy. Verím že tento stručný prehľad dostatočne ilustruje rozsah problému.
Zabezpečenie kvality dát zahŕňa:
- správne pochopenie pôvodu dát and úroveň dôveryhodnosti zdroja dát
- pochopenie zamýšľaného spôsobu ich využitia
- identifikovanie faktorov ktoré určujú a súčasne majú vplyv na zamýšľaný spôsob využitia
- určenie pravidiel, osôb, procesov a technológií ktoré budú zodpovedné za quality data manažment
- ak zoberieme do úvahy že súčasné trendy sú poskytnúť 360-stupnový pohľad na zákazníka, termín “data quality” zahŕňa nutnosť prepojiť všetky súvisiace záznamy; túto úlohu je možné splniť s využitím identifikátorov súvisiacich s každým zákazníkom. Toto je NEVYHNUTNOSŤ.
Nízka kvalita dát môže ochromiť schopnosť firmy udržaťprijateľnú úroveň loyality zákazníkov, obmedziť zraniteľnosť a zvýšiť efektívnosť prevádzky. Napríklad, neschopnosť eliminovať duplicitné záznamy v databáze adries vedie k vyšším nákladom na neefektívne kampane, nespokojnosť zákazníkov, dokonca môže viesť k právnym komplikáciám. Nepresné dáta v súvislosti s obratmi podľa zákazníkov alebo regiónov môžu viesť k “nevyužitiu obchodných príležitostí”.
Niektoré zo zaužívaných štandardov a platnej legislatívy (napr. GDPR, PCI) môžu veľmi rýchlo prinútiť rôzne spoločnosti venovať väčšiu pozornosť tejto problematike.
Kroky ktoré je možné aplikovať.
Zvýšiť oblasť “data quality” a definovať stratégiu v oblasti kvality dát je možné dosiahnuť:
- Adaptáciou špecifického “data governance” plánu, ktorý zahŕňa určenie kto je vlastníkom dát, osoby ktoré majú mať k dátam prístup a identifikáciu štandardov, ktoré je potrebné dodržiavať,
- Pripraviť dokument o štandardoch práce s dátami, ktorý bude akceptovaný všetkými oddeleniami. Dokument by mal tiež popisovať najčastejšie "entity" s ktorými firma prichádza do kontaktu, ako produkty, zákazníci alebo dodávatelia.
- Vybrať technológiu, ktorá definuje postupy pri príprave relevantných zákazníckych dát, ktoré zahŕňajú meno, adresu, postupy pri zmene adresy, identifikácia daňovej príslušnosti, prispôsobenie komunikácie zo zákazníkom, rúzne súvisiace dáta a tabuľky, postupy pri sdávkovom spracovaní dát a spracovaní dát v reálnom čase a ďalšie súvisiace činnosti