Buonasera,
Sto facendo un progetto di machine learning e sono alla ricerca di un dataset.
Ho cercato all'interno del sito kaggle ma alcuni sono complessi per via delle numerose variabili presenti oppure della difficoltà di esporre i dati.
Nello specifico il mio progetto si basa su cleaning ed esplorazione dei dati, scelta di modello e algoritmo di classificazione, comparazione di due o più modelli mediante l'utilizzo dello strumento di orange datamining.
Al momento ho preso questo dataset che però a parer mio sembra essere troppo semplice e poco esplicativo per via delle poche e generali variabili inserite. (https://www.kaggle.com/datasets/jahnveenarang/cvdcvd-vd)
Premesso che sono uno studente di psicologia che si approccia la prima volta in un progetto e nella manipolazione di dati all'interno dell'area di machine learning, sapreste darmi un tipo di dataset magari più affine oppure darmi qualche consiglio su come approfondire il dataset sopra citato? Sarebbe interessante prendere un dataset che comunque abbia una prediction e un tipo di classificazione binaria.
Grazie mille dell'eventuale risposta e proposta
Ciao Alessandro e grazie per aver scritto sul nostro Forum.
Allora esistono letteralmente un infinità di data set che puoi scegliere e che fanno al tuo caso.
Nello specifico ricapitolando ti serve un dataset con una prediction e un tipo di classificazione binaria sul quale devi eseguire cleaning ed esplorazione dei dati, scelta di modello e algoritmo di classificazione, comparazione di due o più modelli.
Per rimanere nel tema della Psicologia/Medicina ti consigliamo i seguenti set di Dati, alcuni più semplici altri più complessi :
- Quì troverai 130 set di dati riguardanti la psicologia
- Previsione introversa vs estroversa 7K risponde a 282 domande sulla personalità, informazioni tecniche [TE LO CONSIGLIAMO]
- Maschi e Femmine Differiscono? Test di empatia-sistematizzazione 13K risposte a 125 domande sulla personalità, informazioni tecniche
- Cosa causa l'alta libido? Scala della compulsività sessuale 3K risponde a 13 domande sulla personalità, informazioni tecniche
- Risultati del test della personalità DISC 1K risponde a 42 domande sulla personalità, informazioni tecniche
- Dataset del diabete , Predire l'insorgenza del diabete sulla base di misure diagnostiche
- Set di dati (diagnostici) sul cancro al seno nel Wisconsin Prevedi se il cancro è benigno o maligno [TE LO CONSIGLIAMO]
- Set di dati personali sui costi medici , Previsione assicurativa utilizzando la regressione lineare
- Set di dati di previsione dell'ictus 11 caratteristiche cliniche per la previsione di eventi di ictus
- Set di dati di previsione dell'insufficienza cardiaca, 11 caratteristiche cliniche per la previsione di eventi di malattie cardiache. [TE LO CONSIGLIAMO]
- Repository su GITHUB
Diciamo che questi pensiamo sono i dataset con più spiegazioni e con molte feautere da analizzare. Se riscontri dei problemi mentre li scarichi non farti problemi, indicaci il set di dati e te lo scarichiamo noi.
Invece se vuoi provare con altri set di dati, che non riguardino per forza la psicologia o la medicina, ti segnaliamo DATASET una raccolta di oltre 1500 dataset pronti per essere utilizzati.
Facci sapere se possiamo aiutarti in altro 😊