Späť

ČMSS

Tvorba skórovacích karet

Rovnako ako väčšina európskych bánk, tak aj Českomoravská stavební spořitelna a.s., sa pripravuje na splnenie požiadaviek metodológie Basel II (a príslušných európskych direktív) stanovujúcich nové princípy riadenia bankových rizík a minimálnej kapitálovej požiadavky. 

ČMSS ako najväčšia stavebná sporiteľňa v Českej republike poskytuje značné množstvo úverov retailovým klientom (fyzickým osobám). Jedným z najdôležitejších krokov pri plnení metodológie Basel II preto bola kvantifikácia úverového rizika banky modelovaním rizikových charakteristík retailového portfólia – predovšetkým tvorba behaviorálnych skórovacích kariet pre pravdepodobnosť zlyhania klienta. 

Problém 

Banka hľadala vhodný dataminingový nástroj, ktorý by nielen ponúkal širokú škálu modelovacích techník, ale taktiež bol v rámci prípravy dát schopný manipulovať s rozsiahlymi dátovými maticami (milióny prípadov a až stovka premenných). V rámci výberového konania, ktorého sa zúčastnili hlavní dodávatelia dataminingových softwarov na českom trhu, bol vybraný nástroj IBM SPSS Modeler od firmy SPSS CR. 

Riešenie

Prvým krokom projektu bolo vytvorenie databázy úverového rizika, teda robustného dátového skladu, ktorý zachytí nielen kompletnú históriu každého úverového účtu a informácie o vymáhaní delikventných klientov, ale napríklad aj charakteristiky niekoľkých miliónov klientov v sporiacej fáze. Dátový sklad sme vytvorili (spoločne s analytikmi firmy SPSS CR, ktorý aj v tomto odbore majú značné skúsenosti) na platforme MS SQL server a už pri jeho prvotnom plnení sa IBM SPSS Modeler ukázal ako neoceniteľný pomocník, napríklad k identifikácii a vyradení duplicitných informácií z primárneho systému. 

Hlavným účelom novo vytvorenej databázy bolo modelovať behaviorálne charakteristiky retailových klientov, teda zistenie toho, ako správanie klienta počas sporenia a následného splácania úveru dokáže predikovať pravdepodobnosť jeho zlyhania (nesplatenie úveru) za 12 mesiacov. Pre tento zámer bolo treba v IBM SPSS Modeler zostrojiť veľké množstvo odvodených premenných. Celý programovací proces prípravy dát veľmi zjednodušuje a sprehľadňuje schopnosť softwaru zapísať, či vlastne zakresliť zložité dátovo-transformační výrazy na dvojrozmernú plochu (vybavenú možnosťou hlbšieho ponárania do supernodov). 

Veľmi dôležitou vlastnosťou IBM SPSS Modeler je jeho schopnosť delegovať k určitým dátovým operáciám samotný server, na ktorom databázy bežia. Pri operáciách s veľkým množstvom dát dochádza k mnohonásobnému skráteniu doby výpočtu a k podstatnej úspore diskových kapacít. Interaktívne vizualizačné techniky (prekryvové histogramy a distribučné grafy, multiploty) boli neoceniteľnými pomocníkmi pri analýze jednej premennej, či odhaľovaní závislostí na modelovanej premennej. 

Pri vlastnom modelovaní sme používali tri modelovacie techniky: neurónové siete a rozhodovacie stromy pre selekciu najsilnejších premenných na stanovenie vlastnej skórovacej funkcie a následne logistickú regresiu. (Vďaka schopnosti softwaru jednoducho kategorizovať spojité premenné, sme zvolili subtilnejšiu multinomickú logistickú regresiu). 

Celková tvorba troch behaviorálnych skórovacích kariet, teda od fázy prípravy behaviorálnych premenných až po výsledné testovanie stability skórovacích kariet trvala odhadom tri mesiace, z toho asi 80% výpočtov prebiehalo v softwari IBM SPSS Modeler . Bez možnosti využiť tento všestranný dataminingový nástroj si tvorbu kvalitnej skórovacej karty v ČMSS dokážu ťažko predstaviť.