Späť

Daňové riaditeľstvo Slovenskej republiky

Data mining v daňovej správe Slovenské republiky

Data mining v daňovej správe Slovenské republiky

Výber daní je najdôležitejším zdrojom financií štátu. Z tohoto dôvodu je skvalitňovanie procesu výberu daní jedným z hlavných cieľov Ministerstva financií Slovenskej republiky, rovnako jako Daňového riaditeľstva Slovenské republiky (DR SR). Výber daní môže byť negatívne ovplyvnený daňovými únikmi a daňovými podvodmi. 

V spolupráci so spoločnosťou Asseco Slovakia bol dodaný a implementovaný dataminingový nástroj IBM SPSS Modeler, ktorý umožňuje efektívne modelovanie vzťahov a závislostí nad databázou Dátového skladu dodávaného spoločnosťou Asseco Slovakia. 

Práve v oblasti eliminovania daňových únikov sa DR SR rozhodlo využiť moderné IT technológie, medzi ktoré patria aj nástroje pre data mining. Cieľom ich implementácie bolo: 

  • operatívne identifikovať rizikové daňové subjekty,
  • zisťovať pravdepodobnosť rizika a rizikového správania u daňových subjektov na základe stanovených atribútov, pričom štandardným postupom to nebolo možné zistiť, 
  • pomocou hľadania skrytých závislostí v dátach odhaľovať súvislosti medzi správaním daňového subjektu v minulosti a jeho tendenciou vykonať daňový podvod, 
  • zlepšiť efektívnosť výkonu daňovej kontroly, 
  • kontrolórom poskytnúť také podklady, ktoré sú nezávislé a zbavené subjektívnych vplyvov,
  • lepšie využiť personálne zdroje pri kontrolnej činnosti a výkone správy daní, 
  • získanie a využitie informácií o správaní daňového subjektu, ktoré sú uložené v informačných systémoch. 

Riešenie

Požadované vlastnosti najlepšie spĺňal SW produkt IBM SPSS – dataminingový nástroj IBM SPSS Modeler. Má výborné prostriedky pre spracovanie rozsiahlych a rôznorodých zdrojov dát od relačných databáz až po súbory rôznych formátov. Nástroj IBM SPSS Modeler ponúka širokú škálu modelovacích techník a silných algoritmov. Jeho nespornou výhodou je intuitívne ovládanie. 

Odhaľovanie rizikového správania daňových subjektov 

Pre odhaľovanie rizikového správania daňových subjektov (DS) boli predovšetkým využité historické dáta z Dátového skladu, dodávaného spoločnosťou Asseco Slovakia, o daňových priznaniach, platobnej disciplíne a vykonaných kontrolách. Veľmi dôležitá bola identifikácia tých subjektov, ktoré už v minulosti vykonali daňový podvod. Tieto údaje slúžili na odhalenie súvislostí medzi správaním daňového subjektu a vykonaným daňovým podvodom. Na základe skúseností analytických a metodických pracovníkov daňovej správy a v spolupráci so spoločnosťou Asseco Slovakia boli vytipované desiatky atribútov, ktoré identifikujú rizikové správanie daňového subjektu. 

Pre vytvorenie dataminingového modelu Odhaľovanie rizikového správania daňových subjektov bola zvolená metóda rozhodovacieho stromu aj s ohľadom na robustnosť modelu. Po zohľadnení regionálnych špecifík správania daňových subjektov bola ďalej využitá metóda Neurónových sietí.

Dataminingový nástroj IBM SPSS Modeler efektívne spracoval historické dáta z dátového skladu spolu s vytipovanými atribútmi rizikového správania daňového subjektu a s použitím vybraných modelov identifikoval charakteristické rizikové správanie u daňových subjektov. Definované postupy boli implementované v rozhraní IBM SPSS Collaboration & Deployment Services Real Time Scoring (predtým IBM SPSS Modeler Publisher) a výsledky boli taktiež zapracované do ďalších aplikácií dátového skladu. 

„Za úspechom celého projektu stojí profesionalita a skúsenosti celého projektového tímu – pracovníkov DR SR a analytikov spoločnosti Asseco Slovakia a v neposlednom rade aj nesporné kvality SW balíka IBM SPSS Modeler, ktorý bol na naplnenie cieľov použitý.“ - Ing. Dana Badínová, riaditeľka odboru riadenia rizík.

Kategorizácia daňových subjektov 

Vytvorenie modelu rizikového správania daňových subjektov bolo len prvým krokom pre aktívne využívanie nástroja IBM SPSS Modeler na DR SR. Ďalším krokom pre bližšie pochopenie správania daňových subjektov bola tvorba modelu Kategorizácia daňových subjektov. Model slúži na rozdelenie daňových subjektov do skupín, čím je správanie daňových subjektov lepšie  identifikovateľné pre kontrolóra a vznikajú tak vzorové modely správania. Určenie skupín – klastrov daňových subjektov prebiehalo v dvoch krokoch. V prvom kroku boli vytvorené skupiny na základe prirodzeného delenia – na skupiny fyzických a právnických subjektov. V druhom kroku bola na vlastné určenie skupín daňových subjektov využitá metóda TwoStep, hlavne s ohľadom na jej schopnosť samostatne určiť počet nových skupín. 

Úspešný výsledok implementácie nástroja IBM SPSS Modeler v prostredí daňovej správy SR je kombináciou:

  • silných analytických techník nástroja IBM SPSS Modeler,
  • profesionálnych znalostí a skúseností pracovníkov DR SR a analytikov spoločnosti Asseco Slovakia, 
  • informácií uložených v historických dátach Dátového skladu dodávaného spoločnosťou Asseco Slovakia. 

Hlavným prínosom je operatívna identifikácia rizikových daňových subjektov, objektívny výber daňových subjektov pre kontrolu a odhaľovanie rizikového správania daňových subjektov spolu s ich lepšou kategorizáciou. Výsledkom je vyššia efektívnosť daňovej kontroly, a tým aj očakávané zvýšenie príjmov do štátneho rozpočtu.