"Che ramo scegliere?" di Marco Corazza - corazza@unive.it Dipartimento di Economia – Università Ca’ Foscari Venezia, Sestiere Cannaregio 873 – Venezia
In molte attività, al fine di prendere buone decisioni è necessario riuscire a fare buone classificazioni.
Ad esempio, gli istituti bancari vorrebbero valutare se un cliente che chiede un mutuo sarà in grado di restituirlo puntualmente oppure se avrà difficoltà a farlo. Gli amministratori pubblici che devono decidere l’utilizzo di aree del territorio, vorrebbero capire se destinare queste aree a parchi gioco oppure a parcheggi. Gli analisti finanziari si sforzano di distinguere le attività il cui valore futuro potrebbe aumentare da quelle per le quali invece potrebbe diminuire.
Naturalmente, per produrre buone classificazioni, il professionista o l’amministratore di turno deve avere una profonda conoscenza dell’ambito in cui opera e deve saper utilizzare efficacemente le informazioni a sua disposizione. Entrambe queste caratteristiche si possono ottenere attraverso impegnativi percorsi formativi e professionali.
In altri termini, classificare è un’attività complessa.
Ma viviamo nell’era dei cosiddetti Big Data.
Semplificando, con l’espressione “Big Data” si intende un enorme insieme di dati relativi ad un determinato , generalmente disomogenei fra di loro, la cui dimensione aumenta costantemente.
In quest’ambito, anche il più preparato dei decisori potrebbe avere serie, serissime difficoltà nell’analizzare queste raccolte di informazioni. Pertanto, ben vengano gli strumenti che possano aiutare il decisore nelle attività di classificazione. (Attenzione: aiutare, non sostituire!)
Al riguardo, nella letteratura scientifica sono state proposte e continuano a essere proposte molte tipologie di tali strumenti. In particolare, recentemente si sono messi in evidenza per la loro efficacia strumenti per la classificazione basati sul cosiddetto Apprendimento Automatico, anche noto come Machine Learning.
In termini qualitativi, e sempre semplificando un po’, con “Apprendimento Automatico” si intende un’ampia famiglia di metodi quantitativi che si ispirano a come gli esseri viventi superiori e la Natura “producono” processi intelligenti.
Uno di questi metodi intelligenti per la classificazione sono gli Alberi Decisionali, pure noti come Decision Trees.
Ancora in termini qualitativi, un Albero Decisionale è uno strumento che, applicando opportune tecniche di Apprendimento Automatico ad un insieme iniziale di dati provenienti dagli oggetti che si vogliono classificare (ad esempio, attività azionarie il cui valore futuro potrebbe aumentare e attività azionarie il cui valore futuro potrebbe diminuire), è in grado di effettuare autonomamente una classificazione di questi stessi oggetti.
In particolare, un Albero Decisionale è capace di estrarre dai dati regole del tipo:
- SE le variabili considerate assumono certi valori
- ALLORA si deve intraprendere una data azione
- ALTRIMENTI se ne deve intraprendere un’altra.
Questi metodi vengono indicati con il termine “Albero” perché la loro rappresentazione grafica ricorda quello di un albero che si dirama dall’alto verso il basso, cioè a chioma in giù, come ad esempio avviene per gli alberi genealogici.
Si parte da una “radice”, che rappresenta la regola di partenza estratta dai dati.
Da questa radice generalmente dipartono verso il basso due rami, a seconda che si sia intrapresa la via dell’ALLORA oppure quella dell’ALTRIMENTI.
Al termine di ognuno di questi due rami “fiorisce” una nuova regola, sempre estratta dai dati, dalla quale possono dipartire altri due rami e via proseguendo.
Ciascuno dei sotto-alberi che si sviluppano sotto la radice termina, prima o poi, in una “foglia”, cioè in un’affermazione che specifica come classificare l’oggetto che, partendo proprio dalla radice e seguendo tutte le vie incontrate dell’ALLORA oppure dell’ALTRIMENTI, è giunto fino a lì.
Nella figura che segue si presenta un’esemplificazione di quanto ora descritto.
La “radice”, cioè la regola di partenza, è rappresentata dal primo triangolino che si vede nella parte alta dell’immagine, più o meno al suo centro. In particolare, questa regola si legge come segue:
- SE la variabile x5 è maggiore o uguale a 0.0608208
- ALLORA si deve seguire il ramo di destra
- ALTRIMENTI si deve seguire il ramo di sinistra.
Considerando ora il solo ramo di destra, da questo “fiorisce” la seguente nuova regola (altro triangolino):
- SE la variabile x11 è maggiore o uguale a 0.250641
- ALLORA si deve seguire il ramo di destra
- ALTRIMENTI si deve seguire il ramo di sinistra.
Considerando infine quest’ultimo ramo di sinistra, esso termina in una “foglia”, cioè in un’affermazione che specifica che l’oggetto considerato va classificato nell’insieme indicato con “0”.
Come si può rilevare dalla figura, questo non è l’unico “percorso” che porti a classificare l’oggetto considerato nell’insieme indicato con “0”.
Un discorso del tutto analogo vale per la classificazione nell’insieme indicato con “1”.
Recentemente, nella letteratura scientifica sono stati pubblicati più studi in cui sono stati proposti ed applicati sistemi automatici basati sugli Alberi Decisionali per la classificazione di titoli azionari e di indici finanziari tra quelli il cui prezzo futuro potrebbe aumentare (rialzo) e quelli per i quali potrebbe diminuire (ribasso).
In calce a questa nota si riportano un paio di riferimenti bibliografici.
L’insieme iniziale dei dati utilizzati in questi studi è relativamente semplice: prezzi (di chiusura, di apertura e via dicendo), volumi delle quantità scambiate ed alcuni indici di Analisi Tecnica.
Nonostante tale semplicità, le capacità di questi metodi di classificare correttamente i rialzi/ribassi futuri dei corsi azionari, e quindi di prevederne le direzioni, paiono decisamente buone. Ovviamente, trattandosi di applicazioni recenti, esse necessitano di ulteriori conferme ed approfondimenti.
Riferimenti bibliografici
- Basak S., Kar S., Saha S., Khaidem L., Roy Dey S. (2019): Predicting the direction of stock market prices using tree-based classifiers. North American Journal of Economics and Finance, 47, 552–567.
- Fiévet L., Sornette D. (2018): Decision trees unearth return sign predictability in the S&P 500, Quantitative Finance, 18, 1797-1814.
- Lohrmann C., Luukka P. (2019): Classification of intraday S&P500 returns with a Random Forest. International Journal of Forecasting, 35, 390-407.
Resta sempre aggiornato sul mondo della finanza e degli investimenti!
Scarica la nostra App Podcast:
Oppure
👉 Iscriviti alla nostra Newsletter
Seguici su