È sempre utile ottenere informazioni su come le persone stanno iniziando la loro carriera nel machine learning o nell'I.A. In questo post del blog, scoprirai come anche i principianti possono fare grandi progressi nell'applicare l'apprendimento automatico a problemi del mondo reale con questi fantastici progetti di apprendimento automatico per principianti consigliati dagli esperti del settore.
Abbiamo attentamente curato l'elenco dei migliori progetti di machine learning per principianti che coprono gli aspetti fondamentali dell'apprendimento automatico come l'apprendimento supervisionato, l'apprendimento non supervisionato, l'apprendimento profondo e le reti neurali. In tutti questi progetti di machine learning inizierai con set di dati del mondo reale che sono disponibili pubblicamente. Ti assicuriamo che troverai questo blog assolutamente interessante e che vale la pena leggere tutto articolo per le cose che puoi imparare sui progetti di machine learning più popolari.
Consigliamo questi dieci progetti di machine learning ai neofiti che iniziano la loro carriera nel machine learning in quanto sono una miscela perfetta di vari tipi di sfide che si possono incontrare quando si lavora come ingegnere di machine learning o data scientist.
Sommario
Riconoscimento dell'attività umana utilizzando il set di dati dello smartphone
Previsione della qualità del vino utilizzando il set di dati sulla qualità del vino
Impara a costruire sistemi di raccomandazione con Movielens Dataset
Analisi del sentiment sui social media utilizzando il set di dati di Twitter
1. Previsione delle vendite utilizzando Walmart Dataset
Il set di dati Walmart contiene dati di vendita per 98 prodotti in 45 punti vendita. Il set di dati contiene le vendite per negozio, per reparto su base settimanale. L'obiettivo di questo progetto di machine learning è prevedere le vendite per ogni reparto in ogni punto vendita per aiutarli a prendere decisioni migliori basate sui dati per l'ottimizzazione del canale e la pianificazione dell'inventario. L'aspetto impegnativo del lavorare con il set di dati Walmart è che contiene eventi di ribasso selezionati che influenzano le vendite e dovrebbero essere presi in considerazione.
In questo progetto, tratteremo i passaggi principali richiesti in ogni progetto di Data Science. Inizieremo importando un file CSV e eseguendo un'analisi EDA (Exploratory Data Analysis) di base. Impareremo come unire più set di dati e applicare gruppo per funzione per analizzare i dati. Tracciamo un grafico di serie temporali e lo analizzeremo. Quindi inseriamo il set di dati in un modello ARIMA (ARIMA è un acronimo che sta per AutoRegressive Integrated Moving Average) per l'addestramento. Ottimizziamo il modello selezionando caratteristiche importanti per migliorare il nostro punteggio di precisione. Quindi vengono effettuate le previsioni finali e il modello viene salvato.
2. Progetto ML di previsione delle vendite BigMart
Il set di dati di vendita BigMart è costituito da dati di vendita 2013 per 1559 prodotti in 10 diversi punti vendita in diverse città. L'obiettivo del progetto ML di previsione delle vendite di BigMart è costruire un modello di regressione per prevedere le vendite di ciascuno dei 1559 prodotti per l'anno successivo in ciascuno dei 10 diversi punti vendita BigMart. Il set di dati di vendita BigMart comprende anche alcuni attributi per ogni prodotto e negozio. Questo modello aiuta BigMart a comprendere le proprietà dei prodotti e dei negozi che svolgono un ruolo importante nell'aumento delle vendite complessive.
3. Progetto del sistema di raccomandazione musicale
Questo è uno dei progetti di apprendimento automatico più popolari e può essere utilizzato in diversi domini. Potresti avere molta familiarità con un sistema di consigli se hai utilizzato un sito di e-commerce o un sito web di film / musica. Nella maggior parte dei siti di e-commerce come Amazon, al momento del checkout, il sistema consiglierà prodotti che possono essere aggiunti al carrello. Allo stesso modo su Netflix o Spotify, in base ai film che ti sono piaciuti, mostrerà film o canzoni simili che potrebbero piacerti. Come fa il sistema a farlo? Questo è un classico esempio in cui è possibile applicare l'apprendimento automatico.
In questo progetto, utilizziamo il set di dati del servizio di streaming musicale leader in Asia per creare un sistema di raccomandazione musicale migliore. Cercheremo di determinare quale nuova canzone o quale nuovo artista potrebbe piacere a un ascoltatore in base alle sue scelte precedenti. Il compito principale è prevedere le possibilità che un utente ascolti una canzone ripetutamente entro un periodo di tempo. Nel set di dati, la previsione è contrassegnata come 1 se l'utente ha ascoltato la stessa canzone entro un mese. Il set di dati consiste in quale canzone è stata ascoltata da quale utente e in che momento.
Sta cercando un corso sulla DataScience? Però costano tutti un sacco di soldi e non sei sicuro questo mestiere faccia per te? Oppure più semplicemente già lavori in questo settore e vuoi approfondire argomenti come machine learning e reti neurali ?
Scopri il nostro Corso Gratuito da più di 100 Lezioni, a difficoltà crescente. L'unico corso in italiano gratuito che ti permetterà davvero di capire e approfondire temi fondamentali per questo mestiere.
Clicca qui non aspettare, intanto iscriviti è GRATIS.
4. Riconoscimento dell'attività umana utilizzando il set di dati dello smartphone
Il dataset dello smartphone è costituito da registrazioni di attività fitness di 30 persone acquisite tramite smartphone abilitato con sensori inerziali. L'obiettivo di questo progetto di machine learning è costruire un modello di classificazione in grado di identificare con precisione le attività di fitness umane. Lavorare a questo progetto di machine learning ti aiuterà a capire come risolvere i problemi di multi-classificazione.
5. Previsione dei prezzi delle azioni utilizzando le TimeSeries
Questa è un'altra interessante idea di progetto di machine learning o deep learning per data scientist / ingegneri di machine learning che lavorano o pianificano di lavorare con il dominio finanziario. Il predittore dei prezzi delle azioni è un sistema che apprende le prestazioni di un'azienda e prevede i futuri prezzi delle azioni. Le sfide associate al lavoro con i dati sui prezzi delle azioni sono che sono molto granulari e inoltre ci sono diversi tipi di dati come indici di volatilità, prezzi, indicatori macroeconomici globali, indicatori fondamentali e altro ancora. Un aspetto positivo del lavoro con i dati del mercato azionario è che i mercati finanziari hanno cicli di feedback più brevi, rendendo più facile per gli esperti di dati convalidare le loro previsioni sui nuovi dati. Per iniziare a lavorare con i dati del mercato azionario,
Esistono diversi metodi di previsione delle serie temporali per prevedere il prezzo delle azioni, la domanda, ecc.
6. Previsione della qualità del vino utilizzando il set di dati sulla qualità del vino
È risaputo che più vecchio è il vino, migliore è il gusto. Tuttavia, ci sono molti fattori diversi dall'età che entrano nella certificazione di qualità del vino che includono test fisicochimici come quantità di alcol, acidità fissa, acidità volatile, determinazione della densità, pH e altro. L'obiettivo principale di questo progetto di apprendimento automatico è costruire un modello di apprendimento automatico per prevedere la qualità dei vini esplorando le loro varie proprietà chimiche. Il set di dati sulla qualità del vino è costituito da 4898 osservazioni con 11 variabili indipendenti e 1 variabile dipendente.
7. Classificazione delle cifre scritte a mano MNIST
L'apprendimento profondo e le reti neurali svolgono un ruolo vitale nel riconoscimento delle immagini, nella generazione automatica di testi e persino nelle auto a guida autonoma. Per iniziare a lavorare in queste aree, è necessario iniziare con un set di dati semplice e gestibile come il set di dati MNIST. Il riconoscimento delle cifre scritte a mano ti metterà alla prova.
8. Impara a costruire sistemi di raccomandazione con Movielens Dataset
Da Netflix a Hulu, la necessità di creare un sistema di consigli cinematografici efficiente ha acquisito importanza nel tempo con la crescente domanda da parte dei consumatori moderni di contenuti personalizzati . Uno dei set di dati più popolari disponibili sul Web per i principianti che vogliono imparare a costruire sistemi di raccomandazione è il set di dati Movielens che contiene circa 1.000.209 valutazioni di film di 3.900 film realizzati da 6.040 utenti Movielens. Puoi iniziare a lavorare con questo set di dati creando una visualizzazione cloud mondiale dei titoli dei film per creare un sistema di consigli sui film.
9. Stimare il prezzo delle case di Boston
Il set di dati dei prezzi delle case di Boston comprende i prezzi delle case in diversi luoghi di Boston. Il set di dati comprende anche informazioni su aree di attività non al dettaglio (INDUS), tasso di criminalità (CRIM), età delle persone che possiedono una casa (AGE) e molti altri attributi (il set di dati ha un totale di 14 attributi). il set di dati può essere scaricato dal repository UCI Machine Learning. L'obiettivo di questo progetto di machine learning è prevedere il prezzo di vendita di una nuova casa applicando concetti di base di machine learning sui dati dei prezzi delle abitazioni. Questo set di dati è troppo piccolo con 506 osservazioni ed è considerato un buon inizio per i principianti del machine learning per avviare la loro pratica pratica sui concetti di regressione.
10. Analisi del sentimento sui social media utilizzando Twitter Dataset
Le piattaforme di social media come Twitter, Facebook, YouTube, Reddit generano enormi quantità di big data che possono essere estratti in vari modi per comprendere tendenze, sentimenti e opinioni del pubblico. I dati dei social media oggi sono diventati rilevanti per il marchio, il marketing e il business nel suo complesso. Un analizzatore di sentimenti apprende vari sentimenti dietro un "pezzo di contenuto" (potrebbe essere IM, e-mail, tweet o qualsiasi altro post sui social media) attraverso l'apprendimento automatico e prevede lo stesso utilizzando l'IA. I dati di Twitter sono considerati un punto di ingresso definitivo per i principianti. pratica l'analisi del sentiment sui problemi di machine learning. Utilizzando il set di dati di Twitter, è possibile ottenere una miscela accattivante di contenuti di tweet e altri metadati correlati come hashtag, retweet, posizione, utenti e altro che aprono la strada a un'analisi approfondita. Il set di dati di Twitter è composto da 31.962 tweet e ha una dimensione di 3 MB. Utilizzando i dati di Twitter puoi scoprire cosa dice il mondo su un argomento, sia che si tratti di film, opinioni sulle elezioni statunitensi o qualsiasi altro argomento di tendenza come prevedere chi vincerà la Coppa del mondo FIFA 2018. Lavorare con il set di dati Twitter ti aiuterà a capire sfide associate al data mining dei social media e anche conoscere in profondità i classificatori. Il problema principale su cui puoi iniziare a lavorare da principiante è costruire un modello per classificare i tweet come positivi o negativi.
Letture consigliate per "I 10 migliori progetti di machine learning per principianti da fare con python"
Come Iniziare a Utilizzare l'Intelligenza Artificiale (I.A.) Nella Tua Azienda
Migliori progetti Open Source Python di Intelligenza Artificiale
Come Creare Un Dataset per il tuo Progetto Di Machine Learning
Fantastiche Idee per Progetti di Data Science per Principianti ed Esperti
Semplici progetti di Deep Learning e Computer Vision Con Esempi pratici
Riconoscimento facciale con Python, in meno di 25 righe di codice
Il tuo Primo Programma di Machine Learning con Python e Google Colab
Esempio pratico Rilevamento Di Veicoli In Tempo Reale con il Deep Learning
Comments