Prima di iniziare a spiegarti cosa è Mito e come utilizzarlo sui tuoi dati per risparmiare l'80% sulla pulizia e analisi dati vogliamo mostrarti direttamente un video esempio di cosa si può fare con questa libreria. Giusto per farti vedere in pochi minuti quanto è potente. Subito dopo troverai spiegazioni e tutorial.
Mito combina i tuoi strumenti di data science preferiti in un pacchetto Python !
Mito è un'interfaccia per fogli di calcolo per Python. Puoi importare Mito nel tuo Jupyter Notebook e apparirà un foglio di calcolo.

Ogni modifica apportata al foglio di calcolo genererà il Python equivalente nella cella del codice sottostante. Ad esempio, se crei una tabella pivot in Mito, il codice pivot Pandas apparirà automaticamente, con la documentazione, nella cella del codice seguente.
Il codice generato automaticamente è ottimo per ripetere l'analisi su un'altra macchina e per i neofiti di Data Science per iniziare a lavorare con i panda nel modo di lavorare con i dati.
Mito è più comunemente usato in due modi:
Il primo è che gli utenti Python scrivano codice rapidamente. Poiché Mito genera automaticamente il codice e lo documenta automaticamente, non devi più andare su Google o Stack Overflow per trovare la sintassi giusta per molte operazioni.
Il secondo caso d'uso è la transizione dai flussi di lavoro dei fogli di calcolo a Python, che tratteremo in questo articolo.
Per prima cosa installiamo Mito la libreria di Python
Presumo che tu abbia una versione recente di Jupyter Lab installata sulla tua macchina. In caso contrario, consulta la documentazione ufficiale di Jupyter Lab per iniziare.
Per installare Mito, esegui questi comandi:
python -m pip install mitoinstaller
python -m mitoinstaller install
Quindi apri Jupyter Lab e importa il Mitosheet:
import mitosheet
mitosheet.sheet()
Puoi vedere le istruzioni di installazione complete nella pagina "documenti" del sito Web Mito.
Importare dataset con python e Mito
In Mito puoi importare file Excel o CSV. Tutto quello che devi fare è fare clic sul pulsante di importazione e puoi sfogliare i tuoi file locali.
La gestione di un set di dati di grandi dimensioni in un foglio di calcolo può essere incredibilmente lenta: l'aggiornamento di formule, la creazione di tabelle pivot o la generazione di grafici possono richiedere minuti o addirittura ore per il caricamento. E se hai un set di dati più grande di 1 milione di righe, Excel non lo accetterà nemmeno.
Molti utenti Mito prendono i loro fogli di calcolo e li importano in Mito per elaborare i dati rapidamente. Mito può gestire qualsiasi dimensione di dati che rientri in un DataFrame Pandas (ovvero milioni e milioni di righe) e quando importi il tuo set di dati, Mito lo trasforma automaticamente in un DataFrame.
Analisi dei dati con Mito
Con Mito puoi facilmente eseguire tutte le classiche operazioni solite dei data scientist o data analyst, ad esempio :
Pivoting
Graphing
Filtering
Sorting
Merging
Deduplicate
Potrai eseguire tutte le classiche operazioni di Excel
Creare formule come Excel
Creare Statistiche avanzate
Generare codice python in modo automatico
e tanto altro!
Nelle visualizzazioni seguenti, puoi vedere com'è filtrare un set di dati, creare una tabella pivot e creare un grafico e avere il codice equivalente generato nella cella del codice sottostante.

Creiamo una Tabella pivot con Mito

Vediamo le Statistiche di riepilogo

Aggiungiamo delle Formule simili a Excel

Esportare l'analisi con Mito e Python
Dopo aver completato l'analisi in Mito, ci sono alcuni modi per condividere il risultato. Alcuni utenti vogliono prendere il codice generato e copiarlo in un altro script o applicare qualcosa di più avanzato come un modello ML più avanti nel notebook.
Molti utenti desiderano riportare l'output su un foglio di calcolo. All'interno di Mito, puoi fare clic su "Pulsante Esporta" e recuperare lo stato corrente di Mito come file Excel o CSV.

Ecco il sito Web di Mito , dove puoi saperne di più sullo strumento e ottenere le istruzioni per l'installazione.
Conclusione su Mito la libreria che automatizza la Data Science e la Data Analysis
Mito è un potente strumento per coloro che desiderano passare da ambienti di fogli di calcolo come Excel o Google Spreadsheets a Python.
Usiamo Mito per l'analisi esplorativa dei dati iniziale, per avere un'idea dei dati. Digitare lo stesso insieme di comandi più e più volte diventa noioso dopo anni e anni.
Aggiungerai Mito ai strumenti di Data Science? Facci sapere nei commenti qui sotto.
Vuoi mettere in pratica quello che hai letto ?
Oppure segui i tutorial correlati :
Tutorial di Regressione Logistica per l'apprendimento automatico
Riconoscimento facciale con Python, in meno di 25 righe di codice
Tutorial di Regressione Logistica per l'apprendimento automatico
Scikit Learn e Python Tutorial Per Creare Modelli di Intelligenza Artificiale
Feature Engineering e Feature Selection per Principianti e non
Spiegazione della più semplice rete neurale per principianti
Il tuo Primo Programma di Machine Learning con Python e Google Colab
Il tuo primo Programma di Deep Learning in Python con Keras Step-By-Step
Come costruire modelli predittivi sanitari utilizzando PyHealth?
Implementare le reti neurali ricorrenti (RNN) con Python e Keras
Deep learnign e python : Object Recognition e Object Predict esempio
Comentários