Mediobanca ha annunciato nel 2024 di aver integrato modelli NLP (Natural Language Processing) nell'analisi dei bilanci delle PMI italiane per automatizzare parte del processo di credit scoring. Il risultato? Una riduzione del 30 % dei tempi di istruttoria e una migliore capacita' predittiva sugli NPL. Per un analista finanziario di alto livello, ignorare l'impatto del machine learning sull'analisi finanziaria non e' piu' un'opzione.
Credit scoring con ML (vs modelli tradizionali)
I modelli di credit scoring tradizionali (logistic regression, Z-score) usano un numero limitato di variabili lineari. I modelli ML (random forest, gradient boosting, neural network) processano centinaia di variabili — bilanci, dati comportamentali, testo — e catturano relazioni non lineari. In Italia, la BCE (Supervisory Expectations 2024) richiede che i modelli interni IRB usati dalle banche siano spiegabili (explainability) e validati secondo standard EBA.
NLP applicato ai bilanci (Natural Language Processing)
Tecnica di IA che estrae informazioni strutturate da testi non strutturati: note integrative, relazioni sulla gestione, earnings call transcript. In analisi finanziaria, gli indicatori NLP piu' usati sono il sentiment score della relazione sulla gestione, la complessita' lessicale della nota integrativa (proxy di oscurita' informativa) e la frequenza di parole-segnale di rischio.
Per l'analista finanziario italiano, l'approccio pratico piu' accessibile e' l'uso di modelli pre-addestrati (es. FinBERT o modelli BERT multilingua) su testi in italiano per estrarre sentiment da earnings call e comunicati Borsa Italiana. Librerie open source come HuggingFace Transformers abbassano la barriera all'ingresso a titolo di esempio a poche giornate di lavoro di un analista con basi di Python.
| Applicazione ML/IA | Tecnica usata | Vantaggio vs analisi tradizionale |
|---|---|---|
| Credit scoring PMI | Random forest su variabili bilancio + CR | Predizione NPL +25 % accuracy (a titolo illustrativo) |
| Analisi sentiment earnings call | NLP (FinBERT fine-tuned) | Segnali precoci di deterioramento management |
| Anomaly detection bilanci | Isolation Forest / autoencoder | Rileva manipolazioni contabili (Benford's Law esteso) |
| Factor investing automatizzato | Regressione multivariata + backtesting | Costruzione portafoglio quality factor IT/EU |
A titolo di esempio, una banca regionale del Nord-Est che adotta un modello random forest addestrato su 10 anni di bilanci OIC di PMI italiane ottiene una separazione netta tra esposizioni performing e NPL significativamente superiore al modello logistico tradizionale. La chiave: l'aggiunta di variabili testuali (sentiment della nota integrativa) e di dati comportamentali (variazioni circolante infra-annuali da CR) come feature aggiuntive rispetto ai soli 5 indici del modello precedente.
L'art. 22 GDPR vieta le decisioni automatizzate su persone fisiche senza spiegazione. Le EBA Guidelines on loan origination and monitoring estendono questo obbligo di explainability ai modelli IRB interni delle banche, richiedendo SHAP values o modelli interpretabili.
Isolation Forest e autoencoder sono algoritmi non supervisionati adatti al rilevamento di anomalie. Benford's Law (distribuzione delle cifre significative) e' un metodo statistico classico usato in forensic accounting, esteso come feature nei modelli ML moderni. La regressione logistica classica non e' un metodo di anomaly detection.
⚠️Usare modelli ML black-box senza explainability
→ L'art. 22 GDPR e le EBA Guidelines on ML vietano decisioni automatizzate su credito senza spiegazione: usare SHAP values o modelli intrinsecamente interpretabili (alberi decisionali) per le decisioni regolamentari.
⚠️Addestrare modelli su dati storici senza verificare il regime change
→ Modelli addestrati sul pre-Covid non catturano la volatilita' 2020-2022: il backtesting deve includere periodi di stress e il modello deve essere ricalibrato almeno annualmente.
⚠️Trattare il ML come sostituto del giudizio dell'analista
→ Il ML automatizza l'analisi quantitativa e segnala anomalie, ma il giudizio finale su governance, strategia e fattori qualitativi richiede ancora l'intelligenza umana dell'analista esperto.
analista finanziario quantitativo (Italia)
Sugerowane pytania