Una guida semplice al machine learning

Machine learning

L’apprendimento è una capacità comune a tutti gli organismi viventi su questo pianeta. Funziona con l’acquisizione di conoscenze o abilità attraverso l’esperienza, lo studio o l’insegnamento.

Il principio è lo stesso, che sia una pianta che impara a rispondere alla luce e alla temperatura, una scimmia che impara a sbucciare una banana, o noi umani che impariamo come andare in bicicletta.

Ma anche le macchine possono imparare? Certamente sì.

La risposta completa a questa domanda sarebbe che alcune macchine possono essere istruite su cosa devono imparare mentre altre macchine possono addirittura imparare da sole. Quest’ultimo fenomeno, quasi magico, viene chiamato Machine Learning.

Non ci avventuriamo nei dettagli del cosa sia l’apprendimento automatico, ma piuttosto vediamo una panoramica generale. Sperando di poterne trarre utili spunti di riflessione.

Le macchine possono prevedere il futuro, purché il futuro non sia troppo diverso dal passato.

Applicazioni di Machine Learning

Prima di iniziare, ecco un breve elenco dei campi principali dove l’apprendimento automatico ha avuto applicazioni di successo. Per una volta abbiamo scelto di risparmiare il media monitoring.

  • Assistenza sanitaria: previsione della diagnostica del paziente da sottoporre a revisione da parte dei medici
  • Social Network: Prevedere determinate preferenze di corrispondenza su un sito di incontri per una migliore compatibilità
  • Finanza: prevedere attività fraudolente su una carta di credito
  • E-commerce: previsione del tasso di abbandono dei clienti
  • Biologia: individuazione di modelli nelle mutazioni geniche che potrebbero rappresentare il cancro

“La maggior parte della conoscenza del mondo in futuro verrà estratta dalle macchine e risiederà nelle macchine”

Come imparano le macchine?

Sostanzialmente, basta sapere che le macchine “imparano” comparando gruppi di dati simili. Un po’ come i dati e le informazioni che ognuno di noi acquisisce dal mondo intorno a se. Più dati vengono dati a una macchina, più questa diventa “intelligente”.

Ma non tutti i dati sono uguali.

Come un pirata che cerca il tesoro sepolto nell’isola, avremo bisogno di una quantità sufficiente di informazioni. Queste informazioni possono portarci nella direzione giusta o sbagliata. Migliore è l’informazione, minore è l’incertezza sulla strada da prendere. Quindi è importante individuare il miglior tipo di dati che siamo in grado di fornire alla nostra macchina.

Dopo aver fornito una quantità sufficiente di dati, la macchina può effettuare delle previsioni. Le macchine possono prevedere il futuro, purché il futuro non appaia troppo diverso dal passato.

La macchina “impara” realmente usando i vecchi dati per ottenere informazioni su ciò che è più probabile che accada. Se i vecchi dati assomigliano molto ai nuovi dati, allora le cose che potremo dire sui vecchi dati saranno probabilmente rilevanti anche per i nuovi dati.

Tipi di apprendimento automatico

Esistono tre categorie principali di machine learning:

  • Apprendimento supervisionato: la macchina apprende grazie all’etichettatura dei dati. Per fare un esempio, in un set di dati sull’alloggio, le caratteristiche potrebbero includere il numero di camere da letto, il numero di bagni e l’età della casa, mentre l’etichetta potrebbe essere il prezzo della casa. Normalmente, i dati sono etichettati dagli umani.
  • Apprendimento non supervisionato: la macchina apprende dai dati non etichettati. Significa che non esiste una risposta “giusta” data alla macchina da apprendere, ma la macchina deve cercare di trovare una soluzione dai dati per trovare una risposta.
  • Apprendimento rinforzato: la macchina impara attraverso un sistema basato sulla ricompensa.

Apprendimento automatico supervisionato

L’apprendimento supervisionato è il tipo di apprendimento più comune e studiato perché è più facile addestrare una macchina ad apprendere con dati etichettati piuttosto che con dati non etichettati. A seconda di ciò che si desidera prevedere, l’apprendimento supervisionato può essere utilizzato per risolvere due tipi di problemi: regressione o classificazione.

Problema di regressione:

Se si desidera prevedere valori continui, ad esempio cercando di prevedere il costo di una casa o il tempo esterno in gradi, si utilizzerà la regressione. Questo tipo di problema non ha un vincolo di valore specifico perché il valore può essere qualsiasi numero senza limiti.

Problema di classificazione:

Se siamo interessati a risolvere un problema del tipo: “Sono brutto?”, Questo è un problema di classificazione perché stiamo cercando di classificare la risposta in due categorie specifiche: sì o no. Questo viene anche chiamato un “problema di classificazione binaria”.

Apprendimento automatico non supervisionato

Poiché non vi sono dati etichettati per le macchine da cui imparare, l’obiettivo per l’apprendimento automatico non supervisionato è quello di rilevare i modelli nei dati e raggrupparli. L’apprendimento senza sorveglianza consiste in macchine che cercano di imparare “da sole”, senza aiuto. Come se qualcuno ci consegnasse un bel filone excel dicendo: “Ecco qui, trovami alcuni schemi e raggruppali per me. Grazie e buon divertimento. ”

A seconda di ciò che si desidera raggruppare, l’apprendimento senza supervisione può raggruppare i dati per risolvere due tipi di problemi: clustering o l’associazione.

Problema di clustering:

L’apprendimento senza supervisione cerca delle risposte rintracciando somiglianze nei dati. Se esiste un cluster o un gruppo comune, l’algoritmo li classificherà in una determinata forma. Un esempio di questo potrebbe essere il tentativo di raggruppare i clienti in base al comportamento di acquisto precedente.

Problema di associazione:

L’apprendimento senza supervisione tenta di capire le regole e il significato dietro i diversi gruppi. Trovare una relazione tra gli acquisti dei clienti è un esempio comune di un problema di associazione. I negozi potrebbero voler sapere quale tipo di prodotti sono stati acquistati insieme e potrebbero utilizzare queste informazioni per organizzare il posizionamento di questi prodotti per un migliore risultato di vendita.

Apprendimento automatico forzato

Questo tipo di apprendimento automatico richiede l’uso di un sistema di ricompense e penalità. L’obiettivo è premiare la macchina quando impara correttamente e penalizzare la macchina quando impara in modo errato.

L’apprendimento automatico forzato è un sottoinsieme dell’intelligenza artificiale. Con l’ampia gamma di possibili risposte dai dati, un processo di questo tipo di apprendimento è un passo iterativo. Impara continuamente.

Ecco alcuni esempi di apprendimento di rinforzo:

  • Allenare una macchina per imparare a giocare (ad esempio a scacchi)
  • Allenare una macchina come imparare e giocare da solo a Super Mario
  • Auto a guida autonoma

 

aianalisi datiautomaticoautomationesperienzainsegnamentomachine learning