Questi strumenti interattivi ti aiuteranno a comprendere l'apprendimento automatico e il funzionamento di un sistema intelligente.
L'apprendimento automatico è necessario per comprendere e applicare nel nostro lavoro quotidiano di scienziati dei dati. La conoscenza da conoscere non si limita all'importazione del codice dalla libreria, ma si estende al concetto di modello, alla scelta dell'algoritmo, alle metriche e molto altro. Per aiutare a imparare i concetti di machine learning, vorrei delineare i miei quattro strumenti interattivi che potresti usare per imparare in questo articolo. Entriamo nel merito!
1. Strumento interattivo What-If Tool
What-If strumento è uno strumento web-based di visualizzazione per capire come funziona il comportamento di machine learning. What-If Tool è stato sviluppato per comprendere le complessità alla base del nostro modello addestrato e sperimentare la situazione ipotetica. What-If Tool è uno strumento interattivo, significa che possiamo giocare con la GUI per vedere i cambiamenti in tempo reale. Lascia che ti mostri l'esempio nella GIF qui sotto.
Sembra uno strumento entusiasmante, vero? La GIF sopra mostra tutte le schede con cui potremmo giocare per comprendere il nostro modello di apprendimento automatico addestrato. Usiamo il modello di apprendimento automatico per il modello di classificazione binaria addestrato sui dati UCI sul reddito in questo esempio. Potremmo confrontare e sperimentare su due modelli addestrati su questi dati, quindi analizziamo ogni scheda per sapere meglio cosa ha fatto la funzione per il modello.
All'inizio ci vengono offerte tre schede; Editor di punti dati, Performance & Fairness e Features, in cui ogni scheda visualizza il modello di machine learning in diversi aspetti:
Editor punto dati: esplorazione della visualizzazione per ogni punto dati
Prestazioni e correttezza: esplorazione delle prestazioni del modello con varie metriche
Funzionalità: riepilogo delle funzionalità utilizzate per l'addestramento del modello
Diamo un'occhiata da vicino per l'usabilità in ogni scheda.
what-if Editor di punti dati
L'editor del punto dati è una scheda in cui è possibile esplorare ogni previsione del punto dati in base al modello. Questa scheda potrebbe selezionare ogni punto dati per studiare il comportamento del modello. Proviamo a scegliere uno dei punti dati.
Nella selezione del punto dati, la parte superiore ti ha permesso di selezionare l'asse, l'etichetta e il binning: questo è utile se vuoi avere informazioni specifiche da conoscere. Per impostazione predefinita, l'asse X e l'asse Y sono divisi per l'output del punteggio del modello (tra i modelli 1 e 2).
Dopo aver selezionato il punto dati, otterrai informazioni simili all'immagine sopra. In questa sezione riportiamo tutte le informazioni riguardanti la caratteristica del datapoint e il punteggio di confronto del modello per ogni etichetta.
what-if Prestazioni e correttezza
La scheda Prestazioni ed equità è dove puoi sperimentare varie soglie, verità di base, rapporto di costo e molti altri per comprendere il risultato del tuo modello di apprendimento automatico quando cambiamo determinati aspetti.
Puoi modificare le tue ipotesi nella sezione a sinistra, come la funzione di previsione e la strategia di ottimizzazione.
Nella sezione a destra, puoi sperimentare la soglia di ciascun modello per vedere l'effetto sulle prestazioni. I cambiamenti stanno avvenendo in tempo reale, quindi le informazioni necessarie per decidere quale modello utilizzare e se il tuo modello ha soddisfatto o meno i tuoi requisiti possono essere valutate rapidamente.
what-if Caratteristiche
La scheda Funzionalità è una sezione per ottenere statistiche di riepilogo di ciascuna funzionalità utilizzata nell'addestramento del modello. Sono disponibili tutte le statistiche di base di cui hai bisogno: media, mediana, deviazione standard e molte altre. Inoltre, le funzionalità sono suddivise in schede numeriche e categoriali per facilitare l'apprendimento.
2. Strumento interattivo Deep Playground
Il progetto Deep Playground è una rete neurale interattiva basata sul web da cui le persone possono imparare. Il web è abbastanza semplice da permettere a qualsiasi principiante di capire come funziona la rete neurale.
GIF per autoreLa GIF sopra riassume l'intera interazione; potresti armeggiare con l'iperparametro nella parte superiore: tasso di apprendimento, attivazione, regolarizzazione, tasso e tipo di problema.
Deep Playground ha solo quattro tipi di set di dati da utilizzare, ma rappresenta il problema comune nel progetto di machine learning. Su questa parte, puoi anche sperimentare su quanto rapporto dati di test, rumore e dimensione del batch.
Successivamente, puoi selezionare come vuoi trattare la tua caratteristica e il tipo di trasformazione che desideri. Inoltre, puoi aggiungere o diminuire i livelli e i neuroni nascosti per ogni livello nascosto. Quando hai finito di configurare l'esperimento, devi solo premere play e guardare l'output per capire come funzionerebbe la rete neurale con la tua configurazione.
Deep Playground è un progetto open source; se vuoi contribuire o sei curioso del codice sorgente, puoi visitare la pagina GitHub .
3. Strumento interattivo Distribuzione di probabilità di Simon-Ward Jones
L'apprendimento automatico riguarda l'output di probabilità dal nostro modello e l'apprendimento della distribuzione di probabilità ci aiuterebbe a capire come funziona il nostro modello. A volte è difficile capire come funziona la distribuzione di probabilità senza un chiaro aspetto di visualizzazione.
Lo strumento ti offre un esperimento di visualizzazione con la seguente distribuzione di probabilità:
Distribuzione Bernoulli
Distribuzione binomiale
Distribuzione normale
Distribuzione beta
Distribuzione logaritmica normale
lo strumento ha dettagliato la funzione di densità di probabilità in ogni distribuzione e cosa succede se cambiamo il valore del parametro. Ti suggerisco di sperimentare i cambiamenti nella distribuzione perché ti aiuta a capire il concetto più velocemente.
4. Strumento interattivo Embedding Projector
I dati non strutturati sono più difficili da comprendere rispetto ai dati strutturati quando vengono addestrati utilizzando il modello di machine learning. Un modo per capirlo è incorporare o rappresentare i dati come un vettore matematico utilizzando un algoritmo non supervisionato come PCA o t-SNE. Il proiettore di incorporamento di TensorFlow ci offre una visualizzazione interattiva per aiutarci a comprendere i livelli di incorporamento.
Come puoi vedere nella GIF sopra, abbiamo utilizzato il set di dati fornito da Word2Vec per capire come è rappresentata ogni parola e quanto sono vicine tra loro in una funzione di dimensioni ridotte.
Ci sono cinque set di dati da dati NLP, dati immagine o dati tabulari nella parte a sinistra. Potresti utilizzare alcuni algoritmi per incorporare il set di dati, come UMAP, T-SENE, PCA o Custom. Infine, puoi scegliere il componente che desideri visualizzare nella parte inferiore.
Sul lato destro, potremmo scegliere come visualizzare i nostri dati mostrando tutti i punti dati o isolando i punti dati. L'isolamento è correlato al numero del vicino che si desidera scegliere e la decisione si baserebbe sulla metrica della distanza che si sceglie. Se hai intenzione di selezionare una parola specifica, puoi utilizzare la barra di ricerca.
Se vuoi saperne di più sull'Embedding Projector, puoi visitare la documentazione qui .
Conclusione
Comprendere il concetto di machine learning è difficile, soprattutto senza una chiara visualizzazione. Per aiutarti a imparare, voglio delineare quattro strumenti interattivi per aiutarti a capire l'apprendimento automatico; Sono:
What-If Tool
Deep Playground
Probability Distribution
Embedding Projector
Speriamo possa essere d'aiuto!
Comentarios