Skrevet d. 27. august 2009 kl. 20.30
Fødevarebranchen har længe haft hygiejne, egenkontrol og smiley's inde på livet.
I forhold til IT dukker ordet datakvalitet op i ny og næ - traditionelt i forbindelse med at noget er gået grueligt galt, og det skal der gøres noget ved.
Der er dog tegn i sol og måne på at datakvalitet bliver taget mere og mere alvorligt.
Som jeg ser det går det sådan at virksomhederne bevæger sig frem i forskellig takt langs en vej med følgende milepæle for datakvalitet (Data Quality):
• Data Quality 0.0 er stadet, hvor der aldrig gøres rent. Data hældes fortrinsvis ukritisk ind i systemerne og udtræk og analyser bliver herefter.
• Data Quality 1.0 er stadet hvor der foretages datavask. Det sker ofte i form af batch kørsler, hvor lagrede data tilrettes, struktureres og beriges med henblik på at kunne anvendes til et givet formål.
• Data Quality 2.0 er stadet med vedholdende god datahygiejne. Data kontrolleres så tæt på kilden som muligt og vedligeholdes i en stand, som opfylder alle givne formål i virksomheden.
I min blog (på engelsk) har jeg skrevet mere om emnet:
http://liliendahl.wordpress.com/ (...)I en nylig offentliggjort undersøgelse fra Gartner siges det:
• Pengene fosser stadig ud af virksomhederne som følge af utilstrækkelig datahygiejne
• Det er svært for virksomhederne at udnytte værktøjer til forbedret datahygiejne
Undersøgelsen er gengivet mere uddybende (på engelsk) her:
http://searchdatamanagement.techtarget.com/ (...),289142,sid91_gci1365965,00.html
Hvad er dine erfaringer med værktøjer til forbedret datahygiejne? Har du brugt nogle overhovedet? I givet fald, var de brugervenlige / anvendelige?