Sei sicuro di conoscere tutti i tipi di grafici ed il loro utilizzo ?
Secondo noi con questa guida sulle tecniche avanzate di visualizzazione dati espanderai di molto il tuo bagaglio di strumenti per l'analisi dei dati descrittiva o predittiva.
Mentre tutti glorificano i modelli di apprendimento automatico e le intricate reti neurali, molti dimenticano l'immenso valore che si può ottenere dalla creazione di una potente visualizzazione dei dati.
E non sto parlando di visualizzazioni di base come grafici a linee e grafici a barre, ma di tecniche di Visualizzazione Dati!
Che cos'è la visualizzazione dei dati?
La visualizzazione dei dati è la rappresentazione grafica dei dati per aiutare le persone a comprendere il contesto e il significato. La visualizzazione interattiva dei dati consente alle aziende di approfondire per esplorare i dettagli, identificare modelli e valori anomali e modificare i dati elaborati e/o esclusi.
Fortunatamente o sfortunatamente esistono tantissimi tipi di tecniche per visualizzare i dati, ti cito quelle che conosco io :
Tipi di visualizzazioni di dati generali:
Grafici
Tabelle
Mappe
Infografica
Dashboard
Report
Tipi di visualizzazione dei dati specifici:
Grafico ad area
Grafico a bolle
Grafico a candele
Grafico a colonne
Grafico di combinazione
Grafico a ciambella
Grafico a imbuto
Diagramma di Gantt
Grafico del calibro
Carta geografica
Istogramma
Grafico Kagi
Grafico a linee
Grafico logaritmico
Grafico Marimekko
Diagramma di Pareto
Grafico a torta
Grafico a piramide
Grafico radar
Grafico a dispersione
Grafico a spline
Grafico in pila
Grafico ad albero
Grafico a cascata
e molti altri
In questo articolo, condividerò con te cinque potenti tecniche di visualizzazioni di dati che sono estremamente potenti e ben accolte dai dirigenti. Detto questo, iniziamo!
Tecniche di Visualizzazione Dati avanzate :
1. Grafico di coorte
Che cos'è un grafico di coorte?
Un grafico di coorte è uno strumento che consente di misurare le prestazioni dei diversi gruppi di utenti nel tempo. Mi riferirò in particolare ai grafici di coorte basati sul tempo, che raggruppano gli utenti per intervalli di tempo.
Di seguito è riportato un esempio di grafico di coorte:
Terminologia ( Da Wikipedia ) :
Uno studio di coorte (talvolta erroneamente chiamato studio di pannello mal traducendo l'inglese panel study) è una forma di studio longitudinale (un tipo di studio osservazionale) usato nella medicina, nelle scienze sociali, scienze attuariali , ecologia e molte altri campi..
Una coorte è un gruppo di persone che condividono una caratteristica o un'esperienza in comune all'interno di un periodo definito (per esempio dalla nascita, o durante l'esposizione ad un farmaco o ad un inquinante, o in seguito alla somministrazione di un vaccino, o mentre vengono sottoposti a determinate procedure mediche).
Perciò un gruppo di persone nate in un giorno o periodo particolare, per esempio nel 1948, formano una coorte di nascita. Il gruppo di paragone può essere la popolazione generale dalla quale la coorte è tratta, oppure può essere un'altra coorte di persone ritenute avere minima o nulla esposizione alla sostanza sotto investigazione, ma per il resto simile. Alternativamente, dei sottogruppi nella coorte possono essere paragonati fra di loro.
Leggere un grafico di coorte è semplice:
Ogni riga rappresenta una coorte . In questo caso, la coorte di utenti si basa sul mese di registrazione degli utenti. Ad esempio, la prima riga rappresenta gli utenti che si sono registrati a dicembre 2009 e la seconda riga rappresenta gli utenti che si sono registrati a gennaio 2010.
Ogni colonna rappresenta un periodo. In questo caso, ogni periodo rappresenta un numero di mese. Ad esempio, la prima colonna rappresenta il primo mese di ogni coorte (mese 0) e la seconda colonna rappresenta il secondo mese di ogni coorte (mese 1).
Ogni cella rappresenta il valore di interesse . In questo particolare grafico di coorte, stiamo confrontando la percentuale di entrate in ciascun periodo per ciascuna coorte di entrate del mese 0. Ad esempio, le entrate del secondo mese della prima coorte erano il 58% di quelle del primo mese e le entrate del terzo mese della prima coorte erano il 44% di quelle del primo mese.
Perché i grafici di coorte sono così utili
I grafici di coorte sono estremamente utili quando si valutano metriche che richiedono tempo per maturare . Ad esempio, se volessi guardare la percentuale di utenti che hanno sfornato nel 2021 rispetto al 2022, non sarebbe un confronto equo perché gli utenti nel 2021 hanno avuto più tempo per sfornare rispetto agli utenti nel 2022. Tuttavia, utilizzando un grafico di coorte, puoi confrontare lo stesso periodo per diverse coorti.
Riportando il mio esempio, se dovessimo confrontare la prima coorte (2009–12) e la penultima coorte (2010–11), possiamo vedere che la percentuale di entrate è diminuita significativamente dai periodi da 0 a 1. Per la prima coorte la percentuale era del 58%, ma in quest'ultima coorte la percentuale è scesa all'8%. Ciò che questo ci dice è che i nuovi clienti spendono molto meno dopo il mese iniziale di acquisto. Possibili ragioni di ciò sono perché ci sono meno clienti abituali nelle coorti più recenti o la qualità del prodotto è diminuita nel tempo.
Un altro motivo per cui i grafici di coorte sono così potenti è che sono di natura olistica . Orizzontalmente, puoi comprendere l'intero ciclo di vita dei tuoi utenti e in quale punto del ciclo di vita il comportamento degli utenti cambia drasticamente. In verticale, puoi confrontare e valutare le prestazioni delle coorti di utenti più recenti con quelle di utenti più anziani.
Applicazioni dei grafici di coorte
Le applicazioni più comuni dei grafici di coorte sono:
Valutare l'abbandono nel tempo .
Valutare le entrate o la redditività.
Valutare le conversioni della canalizzazione.
Tecniche di Visualizzazione Dati avanzate :
2. Matrice di correlazione
Ma prima, cos'è la correlazione?
La correlazione è una misura statistica da -1 a 1 che ci dice quanto sia forte la relazione lineare tra due variabili.
Se la correlazione è -1, allora c'è una perfetta correlazione negativa tra le due variabili, il che significa che un aumento di una variabile predice in modo affidabile una diminuzione dell'altra.
Se la correlazione è 1, allora c'è una perfetta correlazione positiva tra le due variabili, il che significa che un aumento di una variabile predice in modo affidabile un aumento dell'altra.
Se la correlazione è 0, allora non c'è correlazione tra le due variabili. Di seguito sono riportati alcuni esempi di diversi tipi di modelli di correlazione:
Che cos'è una matrice di correlazione
Una matrice di correlazione è una tabella n per n che mostra i coefficienti di correlazione tra ciascuna variabile di riga e variabile di colonna.
Usando il grafico sottostante come esempio, possiamo vedere che se guardiamo la prima riga (acidità fissa) e la seconda colonna (acidità volatile), il coefficiente di correlazione è -0,26.
Quando è utile una matrice di correlazione?
Una matrice di correlazione è utile quando si desidera ottenere una rapida comprensione delle relazioni lineari tra tutte le variabili. Ciò è particolarmente utile quando si creano modelli in diversi casi:
Quando si creano modelli di regressione, è possibile utilizzare una matrice di correlazione per identificare la collinearità tra le variabili.
Quando si creano modelli di machine learning, è possibile utilizzare una matrice di correlazione per identificare potenziali funzionalità avanzate che è possibile utilizzare per il modello.
Quando si esegue l'importanza delle funzionalità, è possibile utilizzare una matrice di correlazione per rimuovere le variabili correlate.
Tecniche di Visualizzazione Dati avanzate :
3. Displot
Che cos'è un distplot e perché sono utili?
Un distplot, abbreviazione di plot di distribuzione, è una combinazione di più rappresentazioni statistiche di dati numerici per rappresentare la variazione nella distribuzione dei dati. Un distplot può essere una combinazione di diversi grafici come istogrammi, stimatori di densità del kernel (KDE) e grafici del tappeto.
L'obiettivo principale di un distplot è comprendere e confrontare le distribuzioni dei dati per comprendere meglio le misure delle tendenze centrali, l'asimmetria dei dati e la diffusione dei dati.
Tecniche di Visualizzazione Dati avanzate :
4. Grafici a cascata
Che cos'è un grafico a cascata e perché sono utili?
Un grafico a cascata è un tipo unico di grafico a barre che mostra la variazione netta di un valore attraverso una serie di valori positivi e negativi. Invece di mostrare solo il valore iniziale e finale di una metrica, un grafico a cascata mostra come una metrica è passata da un valore iniziale a un valore finale.
L'obiettivo principale di un grafico a cascata è raccontare una storia di come una particolare metrica è cresciuta o diminuita attraverso una serie di sottocomponenti.
È particolarmente utile quando si scompongono le metriche di redditività: ad esempio, è possibile esaminare tutte le fonti di reddito per una determinata azienda, abbattere tutti i costi e concludere con il profitto dell'azienda (comunemente noto come conto economico) . Di seguito è riportato un esempio di grafico a cascata semplificato:
Tecniche di Visualizzazione Dati avanzate :
5. Grafici a imbuto [ FUNNEL ]
Che cos'è un diagramma a imbuto e perché sono utili?
I grafici a imbuto sono un tipo di visualizzazione utilizzato per mostrare i valori nelle fasi di un processo. Ad esempio, puoi utilizzare un grafico a imbuto come quello di seguito per mostrare quanti clienti arrivano a ciascuna fase, dalla visita del proprio sito Web alla ricezione di una fattura.
I grafici a imbuto sono utili per capire in che modo le unità efficienti scorrono da una fase all'altra. Con l'obiettivo di avere il maggior numero di unità dall'inizio alla fine, è importante capire dove ci sono cali significativi in modo da poter identificare le aree per migliorare la canalizzazione.
Nell'esempio sopra, solo la metà degli utenti dei potenziali clienti ha richiesto un prezzo. Comprendendo questo, puoi quindi indagare sul motivo per cui il drop off è negativo. È perché non è chiaro dove richiedere il prezzo? È perché questi potenziali clienti sono ancora privi di informazioni e vogliono parlare con qualcuno prima di richiedere il prezzo? Questi sono alcuni esempi di come un grafico a imbuto o funnel può essere utilizzato in un ambiente aziendale.
Ti piacerebbe se approfondissimo ogni tecnica di Visualizzazione dati con il relativo codice python ?
Certo
No
Vuoi mettere in pratica quello che hai letto ?
Oppure segui i tutorial correlati :
Tutorial di Regressione Logistica per l'apprendimento automatico
Riconoscimento facciale con Python, in meno di 25 righe di codice
Tutorial di Regressione Logistica per l'apprendimento automatico
Scikit Learn e Python Tutorial Per Creare Modelli di Intelligenza Artificiale
Feature Engineering e Feature Selection per Principianti e non
Spiegazione della più semplice rete neurale per principianti
Il tuo Primo Programma di Machine Learning con Python e Google Colab
Il tuo primo Programma di Deep Learning in Python con Keras Step-By-Step
Come costruire modelli predittivi sanitari utilizzando PyHealth?
Implementare le reti neurali ricorrenti (RNN) con Python e Keras
Deep learnign e python : Object Recognition e Object Predict esempio
Articolo interessantissimo perchè introduce dei metodi di analisi dei dati molto particolari che utilizzano e sfruttano la data visualization correlata anche ad info quantitative.