Futures negativi sul petrolio: analisi del fallimento predittivo dei modelli tradizionali

967

Il 20 aprile 2020, i futures sul WTI sono scesi a -37.63 dollari al barile. Nessun modello di machine learning standard aveva previsto questa possibilità perché nessun dataset storico conteneva prezzi negativi. L'analisi post-evento rivela cosa avrebbe funzionato.

Perché i modelli hanno fallito

I modelli LSTM e Random Forest addestrati su dati dal 1983 al 2020 assumevano implicitamente che il prezzo minimo fosse zero. Quando gli storage capacity dati mostravano saturazione al 95% di Cushing Oklahoma, i modelli suggerivano prezzo minimo di 8 dollari. Mancava completamente la comprensione della meccanica dei contratti futures in scadenza con impossibilità fisica di delivery.

Feature rilevanti ignorate

Tre variabili critiche non erano incluse nei modelli standard: capacità di stoccaggio disponibile in barili, open interest sui contratti in scadenza e spread tra contratti mensili consecutivi. Il 17 aprile, tre giorni prima del crollo, lo spread May-June era a 10 dollari, valore 5 volte superiore alla norma. L'open interest sul contratto May mostrava 108.000 contratti ancora aperti a 48 ore dalla scadenza, contro una media storica di 12.000.

Approccio ensemble che avrebbe performato meglio

Un sistema combinato con tre componenti avrebbe catturato il rischio: un modello LSTM per il trend di prezzo, un Random Forest per anomalie nelle variabili di mercato e un rule-based system per condizioni estreme di storage. Quando storage supera 90% E open interest rimane alto E spread esplode, il sistema passa a modalità estrema che considera scenari fuori distribuzione storica.

Test retrospettivo del modello ensemble

Simulando il sistema sui dati precedenti, avrebbe generato alert di rischio estremo il 17 aprile con confidence del 78%. Non avrebbe predetto -37 dollari specificamente, ma avrebbe classificato la situazione come fuori dai parametri normali con raccomandazione di liquidare posizioni long.

Lezioni per modelli futuri

L'evento dimostra che modelli puramente data-driven falliscono in condizioni mai viste. Servono constraint fisici hard-coded: lo storage ha limite fisico, i futures hanno meccanica specifica. L'implementazione richiede expertise di dominio oltre che competenza ML, con costo di sviluppo stimato in 80 ore di lavoro specializzato.

Hai domande su questo argomento?

Il nostro team è pronto ad aiutarti con approfondimenti e consulenze personalizzate sull'analisi della volatilità del mercato.

Contattaci su WhatsApp

Tharvex Calo