Departament ryzyka mBanku SA w Warszawie ocenia 12 000 wnioskow kredytowych MSP miesiecznie. Klasyczny model scoringowy oparty na regresji logistycznej osiaga AUC 0,72 i generuje 18% falszywie negatywnych decyzji — bank traci klientow zdolnych kredytowo lub bierze nadmierne ryzyko. Analityk Marek Kowalski proponuje wdrozenie modelu gradientowego wzmocnienia (XGBoost) trenowanego na 48 zmiennych rachunkowych z polskich sprawozdan finansowych UoR: wskazniki plynnosci, rotacje naleznosci, przeplywy operacyjne, score Altmana Z. Po walidacji krzyzbowej: AUC 0,89, falszywi negatywni -38%. KNF wymaga jednak interpretowalnosci modelu zgodnej z wytycznymi EBA/GL/2020/06. Zanim zaczniesz czytac: czy model AI moze zastapic ocenianie zdolnosci kredytowej przez doswiadczonego analityka bankowego w Polsce?
Nadzorowane uczenie maszynowe (supervised ML) w credit scoringu
Rodzina algorytmow uczacych sie na oznakowanych przykladach historycznych (przyklady pozytywne: kredyt splecony, negatywne: defaulty). W credit scoringu polskich instytucji finansowych najczesciej stosowane modele to: regresja logistyczna (interpretowalna, preferowana przez KNF), drzewa decyzyjne, lasy losowe i gradient boosting (XGBoost, LightGBM). Wybor modelu determinuje balans miedzy dokladnoscia predykcji a interpretowalnoscia — kluczowa dla zgodnosci z wytycznymi EBA/GL/2020/06 dotyczacymi udzielania kredytow i monitorowania.
NLP (przetwarzanie jezyka naturalnego) na sprawozdaniach finansowych
Techniki NLP umozliwiaja automatyczna analize treesci sprawozdan finansowych, informacji biezacych i raportow zarzadu opublikowanych na GPW przez emitentow. Metody: ekstrakcja informacji (pobieranie kluczowych wskaznikow liczbowych z PDF/HTML), analiza sentymentu (przewidywanie kierunku korekty wynikow z tonu komentarza zarzadu), Named Entity Recognition (identyfikacja podmiotow, transakcji, wydarzen). W Polsce baza danych ESPI/EBI GPW stanowi glowne zrodlo surowych dokumentow do przetwarzania NLP.
Zgodnie z Rekomendacja S KNF (2023) oraz wytycznymi EBA/GL/2020/06, polskie instytucje finansowe stosujace modele ML do oceny zdolnosci kredytowej musza zapewnic interpretowalnosc decyzji (ang. explainability). Metody SHAP (SHapley Additive exPlanations) pozwalaja rozlozyc predykcje modelu na wklad poszczegolnych zmiennych — kazda decyzja kredytowa uzyskuje uzasadnienie oparte na konkretnych wskaznikach finansowych, co umozliwia kontrole regulacyjna i dialog z wnioskodawca.
| Metoda ML | Zastosowanie w analizie finansowej PL | Wymaganie interpretowalnosci KNF/EBA |
|---|---|---|
| Regresja logistyczna | Credit scoring MSP: ocena PD (prawdopodobienstwo defaultu) | Wysoka — koeficjenty bezposrednio interpretowalne |
| Gradient boosting (XGBoost) | Wykrywanie anomalii transakcyjnych, wczesne ostrzeganie defaultu | Srednia — wymaga SHAP do interpretowalnosci |
| Klasteryzacja (k-srednie) | Segmentacja portfela kredytowego, wykrywanie podobnych profili ryzyka | Niska — model nienadzorowany, wyniki opisowe |
| NLP (transformer BERT-PL) | Analiza sentymentu sprawozdan ESPI/EBI, ekstrakcja KPI z PDF UoR | Srednia — wyniki wspierajace, nie decydujace |
Analityk Marek Kowalski z departamentu ryzyka mBanku trenuje model XGBoost na danych 36 000 historycznych wnioskow MSP (2020-2023), uzywajac 48 zmiennych: wskazniki plynnosci biezacej i szybkiej, rotacja naleznosci i zobowiazan (w dniach), score Altmana Z, EBITDA/dług, przeplywy operacyjne/aktywa ogolne. Po walidacji krzyzowej (k=10) model uzyskuje AUC 0,89. Dla wniosku spoki transportowej Malinowski Trans Sp. z o.o. (Lodz, 22 mln PLN przychodow) model przypisuje PD 4,2% — analiza SHAP wskazuje, ze glownym czynnikiem ryzyka jest wysoka rotacja zobowiazan (84 dni vs. srednia sektorowa 48 dni) i niska plynnosc szybka (0,65 vs. prog 1,0). Decyzja kredytowa jest zrozumiala i mozliwa do obronienia przed KNF.
⚠️Stosowac modele ML bez weryfikacji interpretowalnosci wymaganej przez KNF i EBA
→ Wytyczne EBA/GL/2020/06 nakazuja instytucjom finansowym dokumentowanie logiki modeli kredytowych. Model black-box (np. siec neuronalna bez SHAP) nie spelnia tego wymogu. Kazda decyzja kredytowa musi byc wytlumaczalna: nalezy raportowac wklad poszczegolnych zmiennych i przechowywac audit trail przez co najmniej 5 lat.
⚠️Trenowac model na calym zbiorze danych bez podzialu na zbior uczacy i testowy
→ Overfit (nadmierne dopasowanie) jest najczestszym bledem w credit scoringu ML. Dane musza byc podzielone chronologicznie (np. trening 2018-2022, test 2023) — nigdy losowo — aby uniknac wycieku przyszlych danych (data leakage). Walidacja krzyzowa czasowa (time-series split) jest standardem w polskich instytucjach finansowych.
⚠️Ignorowac dryft modelu i nie monitorowac jakosci predykcji po wdrozeniu
→ Zmiana warunow makroekonomicznych (np. wzrost WIBOR o 500 pb w 2022-2023) zmienia rozkad zmiennych modelu. Model musi byc monitorowany miesiecznie pod katem PSI (Population Stability Index) i AUC na nowych danych. KNF oczekuje udokumentowanego procesu monitorowania i przegladu modeli zgodnie z wytycznymi EBA/GL/2021/07.
Ktora metoda pozwala zapewnic interpretowalnosc predykcji modelu gradient boosting w credit scoringu zgodnym z wymaganiami KNF/EBA?
Răspuns corect : Metoda SHAP (SHapley Additive exPlanations) dekompozycji wkladu zmiennych
SHAP rozklada predykcje modelu na wklad poszczegolnych zmiennych, umozliwiajac uzasadnienie kazdej decyzji kredytowej. Jest to standard wymagany przez EBA/GL/2020/06 i akceptowany przez KNF w procesach audytu modeli ryzyka.
Dlaczego nalezy dzielic zbior danych do treningu modelu credit scoring chronologicznie, a nie losowo?
Răspuns corect : Aby uniknac wycieku przyszlych danych (data leakage) i overfit modelu na niereprezentywnych warunkach makroekonomicznych
Podzial chronologiczny odzwierciedla rzeczywiste warunki wdrozenia: model jest trenowany na danych przeszlych i testowany na danych przyszlych. Podzial losowy prowadzi do wycieku danych z przyszlosci (data leakage) i zawyzonego AUC, ktory nie odzwierciedla rzeczywistej jakosci modelu.
Oblicz wskazniki ryzyka kredytowego MSP i porownaj wyniki modelu klasycznego z podejsciem ML — zidentyfikuj zmienne, ktore najsilniej wplywaja na ocene zdolnosci kredytowej.
Deschide calculatorul →Oblicz score Altmana Z dla polskiej spolki przemyslowej — kluczowa zmienna w modelach ML credit scoring. Porownaj z progami defaultu w kontekscie sektora polskiego.
Deschide calculatorul →ilosciowy analityk finansowy (Polska)
Intrebari sugerate