La conoscenza si forma attraverso le parole. Con il glossario di Prossima inGenere vuole comporre un lessico minimo del mondo digitale. Molte espressioni ormai entrate nell'uso infatti restano spesso opache nel significato, il nostro obiettivo è quello di renderle più trasparenti. Oggi parliamo di machine learning
Machine
learning
Prestito integrale dall'inglese, composto dai sostantivi machine, usato con funzione di aggettivo, traducibile in italiano con "automatico", e learning, "apprendimento", definisce quella branca dell'intelligenza artificiale e dell'informatica che, grazie alla statistica computazionale e all'ottimizzazione matematica, si occupa dello sviluppo di algoritmi e tecniche che rendono i computer in grado di apprendere in maniera automatica, senza bisogno che vengano loro impartite istruzioni da esseri umani sotto forma di un codice di programmazione.
L'espressione è stata coniata nel 1959 dall'informatico statunitense Arthur Samuel nell'ambito della sua ricerca per il gioco della dama poi sviluppato dalla IBM, della quale era dipendente, e in italiano è stata registrata come neologismo dalla Treccani solo nel 2019.
Tecnicamente, il machine learning imita l'apprendimento umano, e si affida alla capacità dei sistemi informatici di accedere a grandi quantità di dati sempre nuovi – i cosiddetti big data – e di apprendere a partire da questi ultimi, migliorando progressivamente il livello di accuratezza. In base alla tipologia dei compiti da svolgere, come fare classifiche o previsioni o estrarre informazioni utili a partire da dataset molto estesi, esistono diversi metodi di apprendimento automatico che possono essere utilizzati, solitamente classificati in tre categorie principali: apprendimento supervisionato (supervised learning), apprendimento non supervisionato (unsupervised learning), e apprendimento con rinforzo (reinforcement learning).
L'apprendimento supervisionato si basa sull'utilizzo di dataset etichettati per addestrare gli algoritmi a classificare dati o prevedere risultati in modo accurato; un esempio di applicazione di questo tipo di apprendimento è la classificazione della posta indesiderata in una cartella separata rispetto alla posta in arrivo.
Nell'apprendimento non supervisionato, invece, gli algoritmi di machine learning vengono utilizzati per analizzare e organizzare dataset privi di etichette. In questo caso, l'individuazione, da parte degli algoritmi, di raggruppamenti di dati o di pattern nascosti avviene senza la necessità di un intervento umano. Essendo particolarmente efficace a scoprire similitudini e differenze nelle informazioni, questo metodo è molto usato, ad esempio, per l'analisi esplorativa dei dati e il riconoscimento di immagini e pattern.
Il reinforcement learning, infine, è, fra i tre tipi di apprendimento automatico, quello più simile alle modalità di apprendimento umano: è progettato, infatti, per replicare l'abilità umana di imparare dall'esperienza. In questo caso, gli algoritmi vengono addestrati in modo tale da apprendere le informazioni durante l'utilizzo, tramite prove ed errori, con l'obiettivo di sviluppare strategie per prendere decisioni sequenziali, all'interno di contesti che non sono dati a priori, ma in continua evoluzione. Questo tipo di apprendimento automatico viene utilizzato con successo in ambiti come il gaming, la finanza, la robotica, applicazioni dove è richiesta l’abilità di prendere decisioni adattandosi ai cambiamenti dell'ambiente circostante.
Per la sua efficacia e versatilità, una metodologia molto utilizzata nel machine learning è quella delle reti neurali, così chiamate perché imitano il modo in cui i neuroni del cervello umano comunicano tra loro inviandosi segnali a vicenda. Le reti neurali sono formate da strati di nodi, in cui ogni nodo è un neurone artificiale che si connette al successivo. Essendo costituite da unità interconnesse, come i neuroni, le reti neurali sono sistemi di calcolo che elaborano le informazioni rispondendo a input esterni, trasmettendole poi alle diverse unità.
Attraverso algoritmi di addestramento, le reti neurali apprendono e migliorano, nel tempo, la loro accuratezza senza bisogno che venga fornito feedback da parte di un essere umano. Una volta perfezionati, questi algoritmi diventano potenti strumenti di informatica e di intelligenza artificiale che permettono di classificare e raggruppare dati molto rapidamente. Un noto esempio di rete neurale è l'algoritmo di ricerca di Google.
Dalle reti neurali deriva il cosiddetto deep learning (apprendimento profondo), che si riferisce alla profondità dei livelli in una rete neurale. Può essere considerata un algoritmo di deep learning una rete neurale che abbia più di tre strati, o livelli. La differenza rispetto al machine learning classico, o "non profondo", risiede nel fatto che quest'ultimo richiede un maggior coinvolgimento umano nel processo di apprendimento, che non è necessario nel deep learning, che per verificare l'accuratezza dei suoi risultati, e quindi imparare da essi, utilizza la propria rete neurale.
A partire da deep learning e reti neurali si sono sviluppati tutti quei campi dell'intelligenza artificiale che simulano il comportamento umano e che hanno avuto una grande accelerazione negli ultimi anni, come la visione artificiale, l'NLP (Natural Language Processing) e il riconoscimento vocale.
Per approfondire
AI vs. machine learning vs. deep learning vs. neural networks, IBM
Il machine learning secondo il Cambridge English Dictionary
What is machine learning? A definition, Expert.ai