Module 11h204 min de citit

AI i uczenie maszynowe w analizie finansowej: credit scoring ML, NLP na sprawozdaniach i modele predykcyjne ryzyka

Module 1/30%

🔮 Anticipe

Scenariu de deschidere

Departament ryzyka mBanku SA w Warszawie ocenia 12 000 wnioskow kredytowych MSP miesiecznie. Klasyczny model scoringowy oparty na regresji logistycznej osiaga AUC 0,72 i generuje 18% falszywie negatywnych decyzji — bank traci klientow zdolnych kredytowo lub bierze nadmierne ryzyko. Analityk Marek Kowalski proponuje wdrozenie modelu gradientowego wzmocnienia (XGBoost) trenowanego na 48 zmiennych rachunkowych z polskich sprawozdan finansowych UoR: wskazniki plynnosci, rotacje naleznosci, przeplywy operacyjne, score Altmana Z. Po walidacji krzyzbowej: AUC 0,89, falszywi negatywni -38%. KNF wymaga jednak interpretowalnosci modelu zgodnej z wytycznymi EBA/GL/2020/06. Zanim zaczniesz czytac: czy model AI moze zastapic ocenianie zdolnosci kredytowej przez doswiadczonego analityka bankowego w Polsce?

Obiective de invatare

✓Rozroznic miedzy nadzorowanymi i nienadzorowanymi metodami uczenia maszynowego stosowanymi w analizie finansowej
✓Zbudowac pipeline credit scoring ML na danych finansowych polskich MSP z walidacja zgodna z wytycznymi EBA i KNF
✓Zastosowac NLP do automatycznej ekstrakcji wskaznikow finansowych z polskich sprawozdan rocznych i raportow okresowych GPW
✓Ocenic ograniczenia i ryzyka regulacyjne modeli AI w instytucjach finansowych objemanych nadzorem KNF

Nadzorowane vs. nienadzorowane uczenie maszynowe w finansach polskich

Definitie

Nadzorowane uczenie maszynowe (supervised ML) w credit scoringu

Rodzina algorytmow uczacych sie na oznakowanych przykladach historycznych (przyklady pozytywne: kredyt splecony, negatywne: defaulty). W credit scoringu polskich instytucji finansowych najczesciej stosowane modele to: regresja logistyczna (interpretowalna, preferowana przez KNF), drzewa decyzyjne, lasy losowe i gradient boosting (XGBoost, LightGBM). Wybor modelu determinuje balans miedzy dokladnoscia predykcji a interpretowalnoscia — kluczowa dla zgodnosci z wytycznymi EBA/GL/2020/06 dotyczacymi udzielania kredytow i monitorowania.

Definitie

NLP (przetwarzanie jezyka naturalnego) na sprawozdaniach finansowych

Techniki NLP umozliwiaja automatyczna analize treesci sprawozdan finansowych, informacji biezacych i raportow zarzadu opublikowanych na GPW przez emitentow. Metody: ekstrakcja informacji (pobieranie kluczowych wskaznikow liczbowych z PDF/HTML), analiza sentymentu (przewidywanie kierunku korekty wynikow z tonu komentarza zarzadu), Named Entity Recognition (identyfikacja podmiotow, transakcji, wydarzen). W Polsce baza danych ESPI/EBI GPW stanowi glowne zrodlo surowych dokumentow do przetwarzania NLP.

📖 Apprends

Zgodnie z Rekomendacja S KNF (2023) oraz wytycznymi EBA/GL/2020/06, polskie instytucje finansowe stosujace modele ML do oceny zdolnosci kredytowej musza zapewnic interpretowalnosc decyzji (ang. explainability). Metody SHAP (SHapley Additive exPlanations) pozwalaja rozlozyc predykcje modelu na wklad poszczegolnych zmiennych — kazda decyzja kredytowa uzyskuje uzasadnienie oparte na konkretnych wskaznikach finansowych, co umozliwia kontrole regulacyjna i dialog z wnioskodawca.

Metoda ML	Zastosowanie w analizie finansowej PL	Wymaganie interpretowalnosci KNF/EBA
Regresja logistyczna	Credit scoring MSP: ocena PD (prawdopodobienstwo defaultu)	Wysoka — koeficjenty bezposrednio interpretowalne
Gradient boosting (XGBoost)	Wykrywanie anomalii transakcyjnych, wczesne ostrzeganie defaultu	Srednia — wymaga SHAP do interpretowalnosci
Klasteryzacja (k-srednie)	Segmentacja portfela kredytowego, wykrywanie podobnych profili ryzyka	Niska — model nienadzorowany, wyniki opisowe
NLP (transformer BERT-PL)	Analiza sentymentu sprawozdan ESPI/EBI, ekstrakcja KPI z PDF UoR	Srednia — wyniki wspierajace, nie decydujace

📖 Apprends

Pipeline credit scoring ML zgodny z EBA/KNF w polskim banku

1. Dane wejsciowe
Sprawozdania finansowe UoR (RZiS, bilans, RZP), dane BIK, ESPI/EBI GPW — 48 zmiennych rachunkowych
2. Preprocesing i inzynieria cech
Normalizacja wskaznikow sektorowych (KNF Raport o stanie sektora), obsluga brakujacych danych, transformacje log
3. Trening modelu (XGBoost / regresja logistyczna)
Walidacja krzyzowa k=10, kalibracja prawdopodobienstw Platta, threshold optymalizowany pod F-beta
4. Interpretowalnosc SHAP + audyt KNF
Wklad SHAP per decyzja, dokumentacja modelu wg EBA/GL/2020/06 art. 57-82, audit trail

Diagram przeplywu pipeline credit scoring ML w polskim banku: dane wejsciowe ze sprawozdan UoR i baz BIK, preprocesing sektorowy, trening modelu XGBoost z walidacja krzyzowa, na koncu interpretowalnosc SHAP i audyt regulacyjny KNF zgodny z EBA.

0,89

AUC modelu XGBoost (vs 0,72 regresja logistyczna)

-38%

Redukcja falszywie negatywnych decyzji kredytowych

Zmiennych rachunkowych z polskich sprawozdan UoR

EBA/GL/2020/06

Wytyczne KNF/EBA dotyczace interpretowalnosci modeli AI

🛠️ Applique

📍

Caz practic numit

mBank SA (Warszawa) — wdrozenie ML w ocenie zdolnosci kredytowej MSP

Analityk Marek Kowalski z departamentu ryzyka mBanku trenuje model XGBoost na danych 36 000 historycznych wnioskow MSP (2020-2023), uzywajac 48 zmiennych: wskazniki plynnosci biezacej i szybkiej, rotacja naleznosci i zobowiazan (w dniach), score Altmana Z, EBITDA/dług, przeplywy operacyjne/aktywa ogolne. Po walidacji krzyzowej (k=10) model uzyskuje AUC 0,89. Dla wniosku spoki transportowej Malinowski Trans Sp. z o.o. (Lodz, 22 mln PLN przychodow) model przypisuje PD 4,2% — analiza SHAP wskazuje, ze glownym czynnikiem ryzyka jest wysoka rotacja zobowiazan (84 dni vs. srednia sektorowa 48 dni) i niska plynnosc szybka (0,65 vs. prog 1,0). Decyzja kredytowa jest zrozumiala i mozliwa do obronienia przed KNF.

Greseli frecvente

⚠️Stosowac modele ML bez weryfikacji interpretowalnosci wymaganej przez KNF i EBA
→ Wytyczne EBA/GL/2020/06 nakazuja instytucjom finansowym dokumentowanie logiki modeli kredytowych. Model black-box (np. siec neuronalna bez SHAP) nie spelnia tego wymogu. Kazda decyzja kredytowa musi byc wytlumaczalna: nalezy raportowac wklad poszczegolnych zmiennych i przechowywac audit trail przez co najmniej 5 lat.
⚠️Trenowac model na calym zbiorze danych bez podzialu na zbior uczacy i testowy
→ Overfit (nadmierne dopasowanie) jest najczestszym bledem w credit scoringu ML. Dane musza byc podzielone chronologicznie (np. trening 2018-2022, test 2023) — nigdy losowo — aby uniknac wycieku przyszlych danych (data leakage). Walidacja krzyzowa czasowa (time-series split) jest standardem w polskich instytucjach finansowych.
⚠️Ignorowac dryft modelu i nie monitorowac jakosci predykcji po wdrozeniu
→ Zmiana warunow makroekonomicznych (np. wzrost WIBOR o 500 pb w 2022-2023) zmienia rozkad zmiennych modelu. Model musi byc monitorowany miesiecznie pod katem PSI (Population Stability Index) i AUC na nowych danych. KNF oczekuje udokumentowanego procesu monitorowania i przegladu modeli zgodnie z wytycznymi EBA/GL/2021/07.

✓ Vérifie

Verifică-ți cunoștințele

Ktora metoda pozwala zapewnic interpretowalnosc predykcji modelu gradient boosting w credit scoringu zgodnym z wymaganiami KNF/EBA?
- A.Regresja wielomianowa
- B.Analiza skladowych glownych (PCA)
- C.Metoda SHAP (SHapley Additive exPlanations) dekompozycji wkladu zmiennych
- D.Metoda Monte Carlo
Arată răspunsul
Răspuns corect : Metoda SHAP (SHapley Additive exPlanations) dekompozycji wkladu zmiennych
SHAP rozklada predykcje modelu na wklad poszczegolnych zmiennych, umozliwiajac uzasadnienie kazdej decyzji kredytowej. Jest to standard wymagany przez EBA/GL/2020/06 i akceptowany przez KNF w procesach audytu modeli ryzyka.
Dlaczego nalezy dzielic zbior danych do treningu modelu credit scoring chronologicznie, a nie losowo?
- A.Aby ulatwic walidacje przez audytora zewnetrznego
- B.Aby uniknac wycieku przyszlych danych (data leakage) i overfit modelu na niereprezentywnych warunkach makroekonomicznych
- C.Wymaga tego standard ISO 31000
- D.Podzial losowy daje wyzszy AUC i jest preferowany przez regulatorow
Arată răspunsul
Răspuns corect : Aby uniknac wycieku przyszlych danych (data leakage) i overfit modelu na niereprezentywnych warunkach makroekonomicznych
Podzial chronologiczny odzwierciedla rzeczywiste warunki wdrozenia: model jest trenowany na danych przeszlych i testowany na danych przyszlych. Podzial losowy prowadzi do wycieku danych z przyszlosci (data leakage) i zawyzonego AUC, ktory nie odzwierciedla rzeczywistej jakosci modelu.

Co dalej?

🛠️ Applique

🧮

Calculator integrat

Scoring kredytowy

Oblicz wskazniki ryzyka kredytowego MSP i porownaj wyniki modelu klasycznego z podejsciem ML — zidentyfikuj zmienne, ktore najsilniej wplywaja na ocene zdolnosci kredytowej.

Deschide calculatorul →

🛠️ Applique

🧮

Calculator integrat

Score Altmana Z

Oblicz score Altmana Z dla polskiej spolki przemyslowej — kluczowa zmienna w modelach ML credit scoring. Porownaj z progami defaultu w kontekscie sektora polskiego.

Deschide calculatorul →

🤖

ActioFin Advisor (contextual)

ilosciowy analityk finansowy (Polska)

Intrebari sugerate

Jak wdrozyc model credit scoring ML zgodny z wytycznymi EBA/GL/2020/06 i oczekiwaniami KNF w polskim banku korporacyjnym?
Jakie zmienne z polskich sprawozdan UoR sa najbardziej predyktywne w modelach defaultu MSP?
Jak zastosowac NLP do automatycznej ekstrakcji wskaznikow finansowych z raportow ESPI/EBI emitentow GPW?

Intreaba Advisorul →

Surse oficiale