Risultati Ricerca Intelligenza Artificiale Italia
203 elementi trovati per ""
- Importare File Csv con Python e Pandas
Vediamo adesso come è possibile importare un dataset per successivamente farci delle analisi o creare modelli predittivi grazie alla libreria di Python : Pandas Prima di iniziare in questo articolo diamo per scontato che i dati siano già ordinati. Cosa significa? Che i dati siano strutturati, infatti utilizzeremo pandas per importare dati da fogli Csv.
- Visualizzare i dati con il LinePlot Python
Visualizzare i dati con il LinePlot o grafico a linee con Python e MatplotLib. Cosa è lo linePlot? Il grafico a linee rappresenta su due assi (x & y), mediante una o piu linee, coppie di dati numerici, con una variabile di coordinate ( x, y ). Quando è consigliato usarlo? Quando bisogna cercare quale variabile indipendente influenzi maggiormente la variabile dipendente Quando la variabile dipendente può avere più valori per ogni valore della variabile indipendente Quando si cerca di determinare se le due variabili sono correlate. In alcuni casi vine anche usato per lo studio di funzioni.
- Importiamo una pagina HTML utilizzando Python
Prerequisiti : Se non sai perchè utilizzeremo python, clicca qui Se non hai ancora installato Python, clicca qui Se non sai come scaricare e gestire le librerie, clicca qui Se non sai cosa sia un Dataset, clicca qui Iniziamo Per scaricare questa libreria apriamo il terminale e digitiamo pip install pandas pip3 install pandas #per python3 e premiamo invio. Apriamo un nuovo file di Python e importiamo la libreria scaricata import pandas as pd Importiamo la nostra pagina HTML Per importare file html esiste un apposita funzione " read_html() ". Il terzo metodo che descriverò in questo articolo è come prendere le tabelle che troviamo sul web, come su wikipedia. Spesso questa funzione è molto comoda, sulla rete si trovano informazioni davvero utili. Questo link è la pagina di wikipedia sui presidenti degli stati uniti e appena la apriamo ci accorgiamo che è composta da diverse tabelle molto ben fatte. Vediamo qualche esempio url = "https://en.wikipedia.org/wiki/List_of_Presidents_of_the_United_States" #stampare i dati pd.read_html(url) #salvare i dati dentro una variabile tabella = pd.read_html(url) #filtrare e salvare i dati dentro una variabile #in questo caso verranno scartate tutte le righe che non corrispondono al match match = 'Barack Obama' tabella = pd.read_html(url, match=match) #saltare valori e salvare i dati dentro una variabile tabella = pd.read_html(url, skiprows=range(2)) Ed ecco il nostro DataFrame pronto da analizzare in pochi click. Questa è la magia di Python e delle sue librerie. Grandi risultati con qualche linea di codice. Scarica il codice contenente le funzioni per importare file Excel, Csv & HTML Rispondi alle domande e ricevi il badge
- Visualizzare i dati con lo ScatterPlot Python
Visualizzare i dati con lo ScatterPlot o grafico a dispersione con Python e MatplotLib. Cosa è lo Satterplot? Il grafico a dispersione rappresenta su due assi (x & y), mediante dei punti, coppie di dati numerici, con una variabile di coordinate ( x, y ). Quando è consigliato usarlo? Quando bisogna cercare quale variabile indipendente influenzi maggiormente la variabile dipendente Quando la variabile dipendente può avere più valori per ogni valore della variabile indipendente Quando si cerca di determinare se le due variabili sono correlate. In alcuni casi vine anche usato per la visualizzazione di cluster.
- Visualizzare i dati con il LinePlot
Visualizzare i dati con il LinePlot o grafico a linee con Python e MatplotLib Prerequisiti : Se non sai perchè utilizzeremo python, clicca qui Se non hai ancora installato Python, clicca qui Se non sai come scaricare e gestire le librerie, clicca qui Se non sai cosa sia un Dataset, clicca qui Prima di iniziare la giuda pratica per creare uno linePlot partendo da un dataset vediamo quando è utile o necessario utilizzare il grafico a linee. Cosa è lo linePlot? Il grafico a linee rappresenta su due assi (x & y), mediante una o piu linee, coppie di dati numerici, con una variabile di coordinate ( x, y ). Quando è consigliato usarlo? Quando bisogna cercare quale variabile indipendente influenzi maggiormente la variabile dipendente Quando la variabile dipendente può avere più valori per ogni valore della variabile indipendente Quando si cerca di determinare se le due variabili sono correlate. In alcuni casi vine anche usato per lo studio di funzioni. Installiamo la librerie Necessarie Per installare le librerie necessarie per la rappresentazione dei nostri dati con il LinePlot o grafico a linee apriamo il terminale e digitiamo il seguente comando: pip install matplotlib pip3 install matplotlib #per python3 pip install numpy pip3 install numpy #per python3 pip install pandas pip3 install pandas #per python3 Giuda alla visualizzazione dello LinePlot da un file Excel Creiamo un nuovo file e importiamo le librerie che ci serviranno. Per questo esempio utilizzeremo questo file excel import matplotlib.pyplot as plt import pandas as pd Creiamo adesso con pandas il nostro dataset in memoria Creiamo adesso con pandas il nostro dataset in memnoria #carichiamo in Ram i dati contenuti nel file excel dataset = pd.read_excel (r'mq_prezzo_appartamento.xlsx') #stampiamo il nostro dataset print(dataset) output: mq prezzo 0 50 37500 1 55 45375 2 60 54000 3 65 63375 4 70 73500 5 75 84375 6 80 96000 7 85 108375 8 90 121500 9 95 135375 10 100 150000 11 105 165375 12 110 181500 13 115 198375 14 120 216000 15 125 234375 16 130 253500 17 135 273375 18 140 294000 19 145 315375 20 150 337500 21 155 360375 22 160 384000 23 165 408375 24 170 433500 25 175 459375 26 180 486000 27 185 513375 28 190 541500 29 195 570375 30 200 600000 31 205 630375 32 210 661500 33 215 693375 34 220 726000 35 225 759375 36 230 793500 37 235 828375 38 240 864000 Creiamo due liste contenti rispettivamente i valori X (metri quadrati) e Y (prezzo appartamento) #creiamo due liste conteneti rispettivamente i valori X (metri quadrati) e Y (prezzo appartamento) mq = dataset['mq'] prezzo = dataset['prezzo'] #stampiamo le nostre liste print(mq,prezzo) output: 1 55 2 60 3 65 ... 37 235 38 240 1 45375 2 54000 3 63375 ... 37 828375 38 864000 Visti così si capisce poco e niente, ma ora vedremo come rappresentarli con un grafico a dispersione. La libreria MatplotLib offre anche la possibilità di personalizzare i nostri grafici. #definire il titolo del grafico plt.title("Rapporto dimensione / prezzo degli appartamenti") #definire il testo dell'asse x plt.xlabel("Dimensione in m^2 dell'appartamento") #definire il testo dell'asse y plt.ylabel("prezzo in € dell'appartamento") #definire lo sfondo a griglia plt.grid() #definire le dimensioni de grafico plt.rcParams['figure.figsize'] = [15,10] #altezza,lunghezza #la funzione per creare il grafico è molto semplice plt.plot(metriquadrati_appartamento,prezzi_appartamento, label="Rapporto appartamenti") #definire la leggenda del grafico plt.legend() #salviamo il grafico plt.savefig("scatterPlot_rapporto_mq_prezzo_appartamenti.png") #mostriamo il grafico plt.show() output: Scarica Gratuitamente l'esempio Giuda alla visualizzazione dello LinePlot da dati generati Creiamo un nuovo file e importiamo le librerie che ci serviranno. import matplotlib.pyplot as plt import numpy as np Creiamo adesso con Numpy dei dati da rappresentare # utilizzando la funzione np.linspace(35,150) andiamo a creare una lista # contenente 50 (size) numeri casuali da 50 a 150, i quali indicheranno la metratura quadrata metriquadrati_appartamento = np.linspace(50,150) # utilizzando la funzione np.power(metriquadrati_appartamento, 2)*9 andiamo a creare una lista # contenente 50 numeri generati elevando al quadrato e moltiplicato per 15 la metratura quadrata prezzi_appartamento = np.power(metriquadrati_appartamento, 2)*15 print(metriquadrati_appartamento,prezzi_appartamento) Output: [ 50. 52.04081633 54.08163265 56.12244898 58.16326531 60.20408163 62.24489796 64.28571429 66.32653061 68.36734694 70.40816327 72.44897959 74.48979592 76.53061224 78.57142857 80.6122449 ..... 192435.44356518 199432.52811329 206554.56059975 213801.54102457 221173.46938776 228670.3456893 236292.1699292 244038.94210746 251910.66222407 259907.33027905 268028.94627239 276275.51020408 284647.02207414 293143.48188255 301764.88962932 310511.24531445 319382.54893794 328378.80049979 337500. ] Visti così non si capisce poco e niente, ma ora vedremo come rappresentarli con un grafico a dispesione La libreria MatplotLib offre anche la possibilità di personalizzare i nostri grafici. #definire il titolo del grafico plt.title("Rapporto dimensione / prezzo degli appartamenti") #definire il testo dell'asse x plt.xlabel("Dimensione in m^2 dell'appartamento") #definire il testo dell'asse y plt.ylabel("prezzo in € dell'appartamento") #definire lo sfondo a griglia plt.grid() #definire le dimensioni de grafico plt.rcParams['figure.figsize'] = [15,10] #altezza,lunghezza #la funzione per creare il grafico è molto semplice plt.plot(metriquadrati_appartamento,prezzi_appartamento, label="Rapporto appartamenti") #definire la leggenda del grafico plt.legend() #salviamo il grafico plt.savefig("scatterPlot_rapporto_mq_prezzo_appartamenti.png") #visulazziare il grafico plt.show() Output: Scarica Gratuitamente l'esempio Scarica il Notebook Scarica il file Python Scarica il PDF
- Visualizzare i dati con lo ScatterPlot
Visualizzare i dati con lo ScatterPlot o grafico a dispersione con Python e MatplotLib. Prerequisiti : Se non sai perchè utilizzeremo python, clicca qui Se non hai ancora installato Python, clicca qui Se non sai come scaricare e gestire le librerie, clicca qui Se non sai cosa sia un Dataset, clicca qui Prima di iniziare la giuda pratica per creare uno Scatterplot partendo da un dataset vediamo quando è utile o necessario utilizzare il grafico a dispersione. Cosa è lo Satterplot? Il grafico a dispersione rappresenta su due assi (x & y), mediante dei punti, coppie di dati numerici, con una variabile di coordinate ( x, y ). Quando è consigliato usarlo? Quando bisogna cercare quale variabile indipendente influenzi maggiormente la variabile dipendente Quando la variabile dipendente può avere più valori per ogni valore della variabile indipendente Quando si cerca di determinare se le due variabili sono correlate. In alcuni casi vine anche usato per la visualizzazione di cluster. Installiamo le librerie Per installare le librerie necessarie per la rappresentazione apriamo il terminale e digitiamo il seguenti comandi: pip install matplotlib pip3 install matplotlib #per python3 pip install numpy pip3 install numpy #per python3 pip install pandas pip3 install pandas #per python3 Giuda alla visualizzazione dello ScatterPlot da un file Excel Creiamo un nuovo file e importiamo le librerie che ci serviranno. Per questo esempio utilizzeremo questo file excel import matplotlib.pyplot as plt import pandas as pd Creiamo adesso con pandas il nostro dataset in memoria. #carichiamo in Ram i dati contenuti nel file excel dataset = pd.read_excel (r'mq_prezzo_appartamento.xlsx') #stampiamo il nostro dataset print(dataset) Output: mq prezzo 0 50 37500 1 55 45375 2 60 54000 3 65 63375 4 70 73500 5 75 84375 6 80 96000 7 85 108375 8 90 121500 9 95 135375 10 100 150000 11 105 165375 12 110 181500 13 115 198375 14 120 216000 15 125 234375 16 130 253500 17 135 273375 18 140 294000 19 145 315375 20 150 337500 21 155 360375 22 160 384000 23 165 408375 24 170 433500 25 175 459375 26 180 486000 27 185 513375 28 190 541500 29 195 570375 30 200 600000 31 205 630375 32 210 661500 33 215 693375 34 220 726000 35 225 759375 36 230 793500 37 235 828375 38 240 864000 Creiamo due liste conteneti rispettivamente i valori X (metri quadrati) e Y (prezzo appartamento) mq = dataset['mq'] prezzo = dataset['prezzo'] #stampiamo le nostre liste print(mq,prezzo) Output: 0 50 1 55 2 60 3 65 4 70 5 75 6 80 7 85 8 90 9 95 10 100 11 105 12 110 13 115 14 120 15 125 16 130 17 135 18 140 19 145 20 150 21 155 22 160 23 165 24 170 25 175 26 180 27 185 28 190 29 195 30 200 31 205 32 210 33 215 34 220 35 225 36 230 37 235 38 240 Name: mq, dtype: int64 0 37500 1 45375 2 54000 3 63375 4 73500 5 84375 6 96000 7 108375 8 121500 9 135375 10 150000 11 165375 12 181500 13 198375 14 216000 15 234375 16 253500 17 273375 18 294000 19 315375 20 337500 21 360375 22 384000 23 408375 24 433500 25 459375 26 486000 27 513375 28 541500 29 570375 30 600000 31 630375 32 661500 33 693375 34 726000 35 759375 36 793500 37 828375 38 864000 Name: prezzo, dtype: int64 Visti così non si capisce poco e niente, ma ora vedremo come rappresentarli con un grafico a dispesione La libreria MatplotLib offre anche la possibilità di personalizzare i nostri grafici. #definire il titolo del grafico plt.title("Rapporto dimensione / prezzo degli appartamenti") #definire il testo dell'asse x plt.xlabel("Dimensione in m^2 dell'appartamento") #definire il testo dell'asse y plt.ylabel("prezzo in € dell'appartamento") #definire lo sfondo a griglia plt.grid() #definire le dimensioni de grafico plt.rcParams['figure.figsize'] = [15,10] #altezza,lunghezza #la funzione per creare il grafico è molto semplice plt.scatter(mq,prezzo, label="Rapporto appartamenti", marker="s") #definire la leggenda del grafico plt.legend() #salviamo il grafico plt.savefig("scatterPlot_rapporto_mq_prezzo_appartamenti.png") #mostriamo il grafico plt.show() output: Scarica Gratuitamente l'esempio Giuda alla visualizzazione dello scatterPlot da dati generati Creiamo un nuovo file e importiamo le librerie che ci serviranno. import matplotlib.pyplot as plt import numpy as np Creiamo adesso con numpy generiamo due liste di dati # utilizzando la funzione np.random.randint(50,150, size=50)+10 andiamo a creare una lista # contenente 50 (size) numeri casuali interi da 50 a 150, i quali indicheranno la metratura quadrata metriquadrati_appartamento = np.random.randint(50,150, size=50)+10 # utilizzando la funzione np.power(metriquadrati_appartamento, 2)*9 andiamo a creare una lista # contenente 50 numeri generati elevando al quadrato e moltiplicato per 15 la metratura quadrata prezzi_appartamento = np.power(metriquadrati_appartamento, 2)*15 print(metriquadrati_appartamento,prezzi_appartamento) output: [157 147 153 122 142 150 105 62 73 120 133 159 123 124 102 92 83 136 90 154 119 141 111 126 82 75 159 95 134 113 145 98 148 71 137 158 151 132 61 101 96 158 125 157 105 65 62 129 104 97] [369735 324135 351135 223260 302460 337500 165375 57660 79935 216000 265335 379215 226935 230640 156060 126960 103335 277440 121500 355740 212415 298215 184815 238140 100860 84375 379215 135375 269340 191535 315375 144060 328560 75615 281535 374460 342015 261360 55815 153015 138240 374460 234375 369735 165375 63375 57660 249615 162240 141135] Visti così non si capisce poco e niente, ma ora vedremo come rappresentarli con un grafico a dispersione La libreria MatplotLib offre anche la possibilità di personalizzare i nostri grafici. #definire il titolo del grafico plt.title("Rapporto dimensione / prezzo degli appartamenti") #definire il testo dell'asse x plt.xlabel("Dimensione in m^2 dell'appartamento") #definire il testo dell'asse y plt.ylabel("prezzo in € dell'appartamento") #definire lo sfondo a griglia plt.grid() #definire le dimensioni de grafico plt.rcParams['figure.figsize'] = [15,10] #altezza,lunghezza #la funzione per creare il grafico è molto semplice plt.scatter(metriquadrati_appartamento,prezzi_appartamento, label="Rapporto appartamenti", marker="s") #definire la leggenda del grafico plt.legend() #salviamo il grafico plt.savefig("scatterPlot_rapporto_mq_prezzo_appartamenti.png") #mostriamo il grafico plt.show() output: Scarica Gratuitamente l'esempio Scarica il Notebook Scarica il file Python Scarica il PDF
- Importiamo un file Csv utilizzando Python
Prerequisiti : Se non sai perchè utilizzeremo python, clicca qui Se non hai ancora installato Python, clicca qui Se non sai come scaricare e gestire le librerie, clicca qui Se non sai cosa sia un Dataset, clicca qui Iniziamo Per scaricare questa libreria apriamo il terminale e digitiamo pip install pandas pip3 install pandas #per python3 e premiamo invio. Apriamo un nuovo file di Python e importiamo la libreria scaricata import pandas as pd Importiamo il nostro File Per importare file Csv o di testo esiste un apposita funzione " read_csv() ". Vediamo qualche esempio #stampare i dati pd.read_csv("il_tuo_file.csv") #salvare i dati dentro una variabile dataset = pd.read_csv("il_tuo_file.csv") #filtrare e salvare i dati dentro una variabile #in questo caso verranno scartate tutte le righe contenti valori numerici dispari dataset = pd.read_csv("il_tuo_file.csv",skiprows=lambda x:x%2!=0) #saltare valori vuoti e salvare i dati dentro una variabile dataset = pd.read_csv("il_tuo_file.csv",skip_blank_lines=True) Ed ecco il nostro DataFrame pronto da analizzare in pochi click. Questa è la magia di Python e delle sue librerie. Grandi risultati con qualche linea di codice. Scarica il codice contenente le funzioni per importare file Excel, Csv & HTML Rispondi alle domande e ricevi il badge
- Importare File HTML con Python e Pandas
Vediamo adesso come è possibile importare un dataset per successivamente farci delle analisi o creare modelli predittivi grazie alla libreria di Python : Pandas Prima di iniziare in questo articolo diamo per scontato che i dati siano già ordinati. Cosa significa? Che i dati siano strutturati, infatti utilizzeremo pandas per importare dati da pagine HTML.