Risultati Ricerca Intelligenza Artificiale Italia
178 risultati trovati per "applicazioni di Machine learning"
- Scalare i Valori
Formato CSV Funzioni di scala Quando i tuoi dati hanno valori diversi e persino unità di misura diverse Il metodo di standardizzazione utilizza questa formula: z = (x - u) / s Dov'è zil nuovo valore, x è il Se prendi la colonna del peso dal set di dati sopra, il primo valore è 790 e il valore scalato sarà: ) che restituisce un oggetto Scaler con metodi per trasformare i set di dati. Prevedi i valori di CO2 Prevedi le emissioni di CO2 di un'auto da 1,3 litri che pesa 2300 chilogrammi
- Cancellazione variabile
Questo metodo ha senso quando ci sono molti valori mancanti in una variabile e se la variabile è di importanza mancani più alti del threshold data = data[data.columns[data.isnull().mean() < threshold]] Nello snippet di codice sopra, puoi vedere come utilizzo NumPy e panda per caricare il set di dati e impostare una soglia che qualsiasi colonna con valori mancanti superiori al 70% delle osservazioni verrà eliminata dal set di Ti consiglio di impostare il valore di soglia in base alla dimensione del tuo set di dati.
- Foresta Casuale
Implementazione Algoritmi Foresta casuale Random Forest è un termine caratteristico per un insieme di Abbiamo una raccolta di alberi decisionali (conosciuti come "Foresta"). La foresta sceglie la classifica con il maggior numero di voti (su tutti gli alberi della foresta). di N casi viene preso a caso ma con sostituzione . Il valore di m è mantenuto costante durante la crescita della foresta.
- Creare Grafici Dinamici e Interattivi con Python
L'esplorazione dei dati è di gran lunga uno degli aspetti più importanti di qualsiasi attività di analisi Impareremo come creare grafici di trama e bokeh con la sintassi di base per la trama dei panda, con cui Creeremo ciascuno di questi grafici prima con la libreria di grafica panda e poi li ricreeremo in bokeh Lavoreremo con il set di dati NIFTY-50 . Importiamo le librerie e il set di dati necessari allo scopo di visualizzazione: # Importiamo le lebrerie
- PREREQUISITI
se non conosci alcuni degli argomenti ( che vedrai nello step sotto questa sezione ) ti consigliamo di leggere gli articoli ad essi legati prima di andare avanti. Non preoccuparti ci vorrà al massimo una decina di minuti.
- Chi è un Data Scientist
Testo Lezione : Gli scienziati dei dati raccolgono e analizzano grandi insiemi di dati strutturati e Il ruolo di uno scienziato dei dati combina : Informatica. Statistica. Matematica. Il lavoro di un data scientist in genere consiste nel dare un senso a dati disordinati e non strutturati pensatori analitici di alto livello. Data scientist e data manager esperti hanno il compito di sviluppare le migliori pratiche di un'azienda
- DATA SCIENTIST & INTELLIGENZA ARTIFICIALE
La premessa di base qui è sviluppare algoritmi in grado di ricevere dati di input e sfruttare modelli Questo perché entrambi gli approcci richiedono di cercare tra i dati per identificare i modelli e adattare il programma di conseguenza. La maggior parte di noi ha sperimentato l'apprendimento automatico in azione in una forma o nell'altra ampio non si concentra solo su algoritmi e statistiche, ma si occupa anche dell'intera metodologia di
- SANITA'
La mostruosa quantità di dati prodotti negli studi e nella medicina sta trasformando la nostra stessa percezione del processo biogeno di base, del processo decisionale clinico, delle decisioni sintomatiche : Collaborare con le parti interessate per definire gli obiettivi e il tipo di statistiche necessarie Accesso, aggiornamento, inserimento e manipolazione di grandi volumi di dati Organizzazione e coordinamento dei file di dati Un data scientist ospedaliero è la pulizia e la gestione dei dati per soddisfare lo
- Standardizzazione in Python
La Standardizzazione assicura che ogni caratteristica abbia una media di 0 e una deviazione standard di 1 , portando tutte le caratteristiche alla stessa grandezza. = osservazione, μ = media, σ = deviazione standard È possibile utilizzare il metodo StandardScaler di -0.79558708] # [ 0.84270097 -0.06119901] # [-1.32424438 1.65237317]] Verifichiamo che la media di E che la deviazione standard di ogni caratteristica (colonna) è 1 : print(scaled_data.std(axis=0)) [1
- Python
A scienziati e programmatori di dati piace Python perché è un linguaggio di programmazione dinamico e Python sembra essere preferito per la scienza dei dati su R perché finisce per essere più veloce di R Si dice anche che sia migliore di R per la manipolazione dei dati.
- Step 5
Specifichiamo il percorso dalla nostra immagine di input, immagine di output e modello. model_path =
- Approccio al problema da Data Scientist
Come detto in Precedenza il Data Scientist non è solo una figura aziendale, ma molto di più... Come tale dovrà imparare la giusta sequenza per arrivare a dire di essere alla soluzione del problema
- Distribuzione Normale dei Dati
Nel capitolo precedente abbiamo imparato a creare un array completamente casuale, di una data dimensione Nella teoria della probabilità questo tipo di distribuzione dei dati è nota come distribuzione normale distribuzione dei dati gaussiana , dal matematico Carl Friedrich Gauss che ha inventato la formula di Ciò significa che i valori dovrebbero essere concentrati intorno a 5,0 e raramente più lontani di 1,0 puoi vedere dall'istogramma, la maggior parte dei valori sono compresi tra 4.0 e 6.0, con un massimo di
- Albero Decisionale
È un tipo di algoritmo di apprendimento supervisionato utilizzato principalmente per problemi di classificazione
- Introduzione
nell'apprendimento automatico e nella scienza dei dati perché i dati provengono da fonti diverse con tipi di Pertanto non è possibile applicare lo stesso metodo di pulizia ed elaborazione a diversi tipi di dati Diversi metodi per gestire i dati mancanti nel tuo set di dati.