Dátový audit

Dáta skrývajú informáciu, ktorú sa štatistická analýza snaží nájsť a previesť do zrozumiteľnej a uchopiteľnej podoby. Dáta bohužiaľ často obsahujú aj javy, ktoré informáciu skresľujú alebo zatieňujú a znemožňujú ju z dát získať. Navyše použitie každej štatistické metódy predpokladá určité vlastnosti dát a ak tie nie sú splnené, metóda poskytuje zlé výsledky.

Nevyhnutnou súčasťou štatistickej analýzy je preto dátový audit, dôkladný prieskum dátového súboru. V jeho rámci sa vytvorí komplexný tabuľkový a grafický prehľad dátového súboru, ten je vhodnou pomôckou aj pri interpretácii výsledkov analýzy, ale hlavne slúži na overenie použiteľnosti zvolených štatistických metód. Audit bude obsahovať základné informácie o premenných, ich popisné štatistiky, grafy rozloženia, ale aj informácie o chýbajúcich hodnotách, paralelných pokusoch a prípadoch s odlišným správaním od ostatných tzv. odľahlých alebo extrémnych prípadov. Celkovo bude overená použiteľnosť plánovaných štatistických metód. Audit navrhne spôsoby opravy dátového súboru.

Na vytvorenie dátového auditu môže nadväzovať odstránenie chýb identifikovaných v dátach. Výsledkom činnosti potom bude matica, ktorú ďalej spracovávame pomocou zvolenej štatistickej metódy. Čistenie dát je časovo pomerne náročná činnosť a treba s ňou už od začiatku projektu počítať.

Dostupné služby

Zpráva o datovém zdroji
 • práva o dátovom zdroji
 • opis typu a významu premenných a ich dostupnosti
 • popisné štatistiky premenných, grafický záznam hodnôt
 • chýbajúce hodnoty
 • duplicitné prípady
 • odľahlé a extrémne prípady
 • použiteľnosť dát pre plánované štatistické metódy
 • návrh a oprava dátového zdroja
 • vynechanie nevhodných premenných
 • odstránenie odľahlých a extrémnych pozorovaní
 • prípadné doplnenie chýbajúcich hodnôt
 • transformácie premenných

Čo potrebujeme vedieť

 • veľkosť dátového súboru
 • počet premenných v dátovom súbore
 • počet prípadov
 • dostupné informácie o dátach (opis premenných, spôsob vzniku dát, známe problémy s dátami)
 • účel a špecifikácie úlohy
 • formát výstupnej správy (napr. .docx, .pptx, alebo .xlxs)
 • formát výstupového súboru
 • zoznam uvažovaných štatistických metód

Nemáte dostatok času venovať sa príprave dát a chcete sa čo najrýchlejšie sústrediť na samotnú analýzu? Kontaktujte nás.