Utilizzare l’apprendimento automatico per l’ottimizzazione dei costi

Maggio 17, 2023

L-importanza dell’l’apprendimento automatico.

Come analista dei dati che opera nell’industria della mobilità tecnologica, lavoro principalmente su attività incentrate sulle esigenze e i requisiti del Dipartimento Marketing.

Tuttavia, ho anche l’opportunità di collaborare con diverse squadre e lavorare su progetti che richiedono la mia competenza tecnica e scientifica.

Di recente sono stata contattata da Ruslan Golomovzy, responsabile dello sviluppo commerciale internazionale, nell’ambito di un progetto su larga scala.

L’obiettivo: pianificare una soluzione di mobilità permanente per trasportare centinaia di persone in varie destinazioni da una posizione centrale iniziale. E poi riportarle alle loro destinazioni originali.

Lo scopo: assistere il cliente in un esercizio di riduzione dei costi, riducendo il tempo di viaggio (del 50%) per garantire la soddisfazione dei dipendenti.

Si trattava di un compito impegnativo che presentava una serie unica di sfide. Proprio il tipo di sfida che mi piace affrontare.

Non potevamo semplicemente fornire un numero infinito di corse agli utenti. Poiché ciò avrebbe sforato le risorse di bilancio e interferito con le restrizioni imposte dal nostro cliente.

Quindi, cosa potevamo fare al suo posto? Alla fine, la discussione si è concentrata sul l’apprendimento automatico (machine learning).

Utilizzando il modello predittivo che ho creato, sono stata in grado di approssimare il volume degli utenti durante la finestra temporale del progetto. Puoi trovare una spiegazione di questo modello predittivo nel mio blog precedente.

Pertanto, avevo una stima approssimativa di quante vetture avremmo potuto utilizzare per questo progetto.

Indicherò questo numero di vetture disponibili (e massime) con la lettera K.

Algoritmo di ‘K-means clustering’

A una prima occhiata, sembrerebbe un esercizio relativamente semplice, giusto? Raggruppare le posizioni entro una certa distanza radiale e fornire un trasporto sufficiente a contenere ciascun cluster.

L’ottimizzazione del numero di veicoli garantisce costi minimi delle risorse e un’esperienza massima per il cliente.

Su piccola scala, ciò può essere fatto manualmente o visualmente. Ma questo esercizio in particolare coinvolgeva centinaia di passeggeri, provenienti da diverse destinazioni sparse in tutta Malta.

Così, ho esaminato il mio set di strumenti scientifici. E ho deciso di utilizzare una tecnica di apprendimento non supervisionato chiamata algoritmo di clustering K-means.

Questo algoritmo basato su centroidi è ampiamente utilizzato nell’Apprendimento Automatico. È utilizzato per raggruppare insiemi di dati non etichettati sulla base della minimizzazione della somma delle distanze tra i dati e i loro corrispondenti K cluster.

Identificare i percorsi di viaggio più efficienti

Raggruppando le posizioni di prelievo e riconsegna dei nostri clienti, siamo in grado di identificare i percorsi di viaggio più efficienti insieme al numero ottimale di vetture per questo evento particolare, garantendo anche un tempo di attesa minimo.

Machine learning Julia Vella eCabs Technologies Marketing Data Analyst
Nell’immagine di sopra è presente una schermata con una piccola parte delle posizioni geografiche per il prelievo, mostrando come non sia semplice come raggruppare punti visualmente.

Per iniziare, ho raccolto le posizioni geografiche dei punti di prelievo e riconsegna in coordinate di latitudine e longitudine al fine di elaborare preliminarmente i dati.

Li ho posizionati su una mappa per visualizzare la distribuzione in tutta Malta. In modo da poter fare una prima ipotesi sul numero di cluster che ritenevo sufficienti. Garantendo così che fosse inferiore (o uguale) al valore K che avevo determinato in precedenza.

Tuttavia, è importante notare che nella maggior parte dei casi sarebbe necessario utilizzare il metodo ‘Elbow per trovare il numero ottimale di cluster.

Dove avviene la ‘magia’

Ho scritto uno script Python per addestrare l’algoritmo di clustering K-means sul mio set di dati. E ha raggruppato queste posizioni in K cluster in base alla loro vicinanza reciproca.

L’addestramento è dove avviene la magia. In questo caso, l’addestramento è stato eseguito assegnando ciascun punto dati al cluster con il centroide più vicino. E la varianza è quindi calcolata per ciascun punto in modo tale da posizionare un nuovo centroide all’interno di ciascun cluster.

Si tratta di una procedura interattiva che si ripete fino a quando si verifica una riassegnazione. In tal caso, il modello si interrompe e i K cluster vengono definitivamente stabiliti.

Sono arrivata a un numero inferiore di cluster rispetto a quanto avevo precedentemente stimato, il che è stato soddisfacente.

I risultati finali del clustering sono stati rappresentati sulla mappa per visualizzare la proposta dell’algoritmo.

È stato interessante notare che alcuni cluster contenevano molte persone e richiedevano quindi un veicolo più grande. Mentre alcuni cluster contenevano solo due persone, quindi un veicolo più piccolo era sufficiente.

A prima vista, volevamo raggruppare questi piccoli cluster in altri più grandi per ridurre la quantità di vetture necessarie. Ma ispezionandoli attentamente, aveva più senso lasciarli isolati a causa della loro distanza dalla posizione centrale di prelievo e quindi di un tempo di guida molto più lungo, che è stata una suggerimento molto apprezzato dal metodo.

Risparmiare di tempo, denaro e risorse attraverso l’apprendimento automatico

È importante notare che alla fine della giornata, questi modelli sono suggerimenti oggettivi. Tali che se vengono fatti determinati richieste dagli utenti o se un cliente B2B ha ulteriori restrizioni, limitazioni o requisiti, possono facilmente sovrascrivere questi risultati nella fase di pianificazione finale.

In conclusione, l’algoritmo di clustering K-means si è dimostrato uno strumento prezioso per ottimizzare i percorsi di viaggio e il numero di risorse necessarie per il nostro progetto collaborativo su larga scala.

Utilizzando questa tecnica di apprendimento automatico, sono stata in grado di offrire al team B2B una soluzione per risparmiare tempo, denaro e risorse. Continuando comunque a fornire un servizio eccellente ai nostri clienti, riducendo il tempo di attesa del 50%.

Riferimenti:

Julia è Senior Data Analyst presso eCabs Technologies. Ha una laurea in Matematica e Fisica e una laurea magistrale in Apprendimento Automatico, Riconoscimento dei Pattern e Elaborazione di Immagini/Segnali. I suoi studi l’hanno portata all’Organizzazione Europea per la Ricerca Nucleare, più comunemente nota come CERN. Qui ha lavorato nell’analisi dei dati grezzi ottenuti dalle collisioni protone-piombo nel più grande e potente collider di particelle del mondo. Ha lavorato come analista di pagamenti e frodi e ha iniziato la sua carriera di analista dei dati presso una delle ‘Big Four’. Ha anche ricoperto il ruolo di analista di ricerca e supporto per l’Università di Oxford. Quando non sta facendo calcoli, la puoi trovare ad arrampicare su pareti rocciose, in palestra o a giocare ai videogiochi.

Utilizzare l’apprendimento automatico per l’ottimizzazione dei costi

Julia Vella, Senior Data Analyst presso eCabs Technologies, è stata in grado di proporre una soluzione per risparmiare tempo, denaro e risorse.

L-importanza dell’l’apprendimento automatico.

Come analista dei dati che opera nell’industria della mobilità tecnologica, lavoro principalmente su attività incentrate sulle esigenze e i requisiti del Dipartimento Marketing.

Tuttavia, ho anche l’opportunità di collaborare con diverse squadre e lavorare su progetti che richiedono la mia competenza tecnica e scientifica.

Di recente sono stata contattata da Ruslan Golomovzy, responsabile dello sviluppo commerciale internazionale, nell’ambito di un progetto su larga scala.

L’obiettivo: pianificare una soluzione di mobilità permanente per trasportare centinaia di persone in varie destinazioni da una posizione centrale iniziale. E poi riportarle alle loro destinazioni originali.

Lo scopo: assistere il cliente in un esercizio di riduzione dei costi, riducendo il tempo di viaggio (del 50%) per garantire la soddisfazione dei dipendenti.

Si trattava di un compito impegnativo che presentava una serie unica di sfide. Proprio il tipo di sfida che mi piace affrontare.

Non potevamo semplicemente fornire un numero infinito di corse agli utenti. Poiché ciò avrebbe sforato le risorse di bilancio e interferito con le restrizioni imposte dal nostro cliente.

Quindi, cosa potevamo fare al suo posto? Alla fine, la discussione si è concentrata sul l’apprendimento automatico (machine learning).

Utilizzando il modello predittivo che ho creato, sono stata in grado di approssimare il volume degli utenti durante la finestra temporale del progetto. Puoi trovare una spiegazione di questo modello predittivo nel mio blog precedente.

Pertanto, avevo una stima approssimativa di quante vetture avremmo potuto utilizzare per questo progetto.

Indicherò questo numero di vetture disponibili (e massime) con la lettera K.

Algoritmo di ‘K-means clustering’

A una prima occhiata, sembrerebbe un esercizio relativamente semplice, giusto? Raggruppare le posizioni entro una certa distanza radiale e fornire un trasporto sufficiente a contenere ciascun cluster.

L’ottimizzazione del numero di veicoli garantisce costi minimi delle risorse e un’esperienza massima per il cliente.

Su piccola scala, ciò può essere fatto manualmente o visualmente. Ma questo esercizio in particolare coinvolgeva centinaia di passeggeri, provenienti da diverse destinazioni sparse in tutta Malta.

Così, ho esaminato il mio set di strumenti scientifici. E ho deciso di utilizzare una tecnica di apprendimento non supervisionato chiamata algoritmo di clustering K-means.

Questo algoritmo basato su centroidi è ampiamente utilizzato nell’Apprendimento Automatico. È utilizzato per raggruppare insiemi di dati non etichettati sulla base della minimizzazione della somma delle distanze tra i dati e i loro corrispondenti K cluster.

Identificare i percorsi di viaggio più efficienti

Raggruppando le posizioni di prelievo e riconsegna dei nostri clienti, siamo in grado di identificare i percorsi di viaggio più efficienti insieme al numero ottimale di vetture per questo evento particolare, garantendo anche un tempo di attesa minimo.

Machine learning Julia Vella eCabs Technologies Marketing Data Analyst
Nell’immagine di sopra è presente una schermata con una piccola parte delle posizioni geografiche per il prelievo, mostrando come non sia semplice come raggruppare punti visualmente.

Per iniziare, ho raccolto le posizioni geografiche dei punti di prelievo e riconsegna in coordinate di latitudine e longitudine al fine di elaborare preliminarmente i dati.

Li ho posizionati su una mappa per visualizzare la distribuzione in tutta Malta. In modo da poter fare una prima ipotesi sul numero di cluster che ritenevo sufficienti. Garantendo così che fosse inferiore (o uguale) al valore K che avevo determinato in precedenza.

Tuttavia, è importante notare che nella maggior parte dei casi sarebbe necessario utilizzare il metodo ‘Elbow per trovare il numero ottimale di cluster.

Dove avviene la ‘magia’

Ho scritto uno script Python per addestrare l’algoritmo di clustering K-means sul mio set di dati. E ha raggruppato queste posizioni in K cluster in base alla loro vicinanza reciproca.

L’addestramento è dove avviene la magia. In questo caso, l’addestramento è stato eseguito assegnando ciascun punto dati al cluster con il centroide più vicino. E la varianza è quindi calcolata per ciascun punto in modo tale da posizionare un nuovo centroide all’interno di ciascun cluster.

Si tratta di una procedura interattiva che si ripete fino a quando si verifica una riassegnazione. In tal caso, il modello si interrompe e i K cluster vengono definitivamente stabiliti.

Sono arrivata a un numero inferiore di cluster rispetto a quanto avevo precedentemente stimato, il che è stato soddisfacente.

I risultati finali del clustering sono stati rappresentati sulla mappa per visualizzare la proposta dell’algoritmo.

È stato interessante notare che alcuni cluster contenevano molte persone e richiedevano quindi un veicolo più grande. Mentre alcuni cluster contenevano solo due persone, quindi un veicolo più piccolo era sufficiente.

A prima vista, volevamo raggruppare questi piccoli cluster in altri più grandi per ridurre la quantità di vetture necessarie. Ma ispezionandoli attentamente, aveva più senso lasciarli isolati a causa della loro distanza dalla posizione centrale di prelievo e quindi di un tempo di guida molto più lungo, che è stata una suggerimento molto apprezzato dal metodo.

Risparmiare di tempo, denaro e risorse attraverso l’apprendimento automatico

È importante notare che alla fine della giornata, questi modelli sono suggerimenti oggettivi. Tali che se vengono fatti determinati richieste dagli utenti o se un cliente B2B ha ulteriori restrizioni, limitazioni o requisiti, possono facilmente sovrascrivere questi risultati nella fase di pianificazione finale.

In conclusione, l’algoritmo di clustering K-means si è dimostrato uno strumento prezioso per ottimizzare i percorsi di viaggio e il numero di risorse necessarie per il nostro progetto collaborativo su larga scala.

Utilizzando questa tecnica di apprendimento automatico, sono stata in grado di offrire al team B2B una soluzione per risparmiare tempo, denaro e risorse. Continuando comunque a fornire un servizio eccellente ai nostri clienti, riducendo il tempo di attesa del 50%.

Riferimenti:

Julia è Senior Data Analyst presso eCabs Technologies. Ha una laurea in Matematica e Fisica e una laurea magistrale in Apprendimento Automatico, Riconoscimento dei Pattern e Elaborazione di Immagini/Segnali. I suoi studi l’hanno portata all’Organizzazione Europea per la Ricerca Nucleare, più comunemente nota come CERN. Qui ha lavorato nell’analisi dei dati grezzi ottenuti dalle collisioni protone-piombo nel più grande e potente collider di particelle del mondo. Ha lavorato come analista di pagamenti e frodi e ha iniziato la sua carriera di analista dei dati presso una delle ‘Big Four’. Ha anche ricoperto il ruolo di analista di ricerca e supporto per l’Università di Oxford. Quando non sta facendo calcoli, la puoi trovare ad arrampicare su pareti rocciose, in palestra o a giocare ai videogiochi.