Slušaj robot čitača

Pandas

Pande Pande krkaju bambus
Pande znaju mašinsko učenje
Sadržaj strane:

Pandas je python-ov modul za analiziranje podataka. Vrlo je popularan i dobro povezan sa drugim modulima tako da je rad s njim vrlo lak.

Tipovi podataka u Pandas

Pandas nam daje dva tipa podataka, series, i dataframe. Series je prost, jednodimenzionalan tip podataka koji kreiramo od python listi

series = pd.Series(['jabuke', 'maline', 'banane']) enter
series shit+enter
0 jabuke
1 maline
2 banane
dtype: object

Dataframe je dvodimenzionalni tip podataka, i mnogo se češće koristi. Za razliku od series, dataframe prima dictionary umesto liste:

boje = pd.Series(['Zelena', 'Crvena', 'Žuta'])
df = pd.DataFrame({'Voće': series, 'Boje': boje}) enter
df shit+enter
Voće Boje
0 jabuke zelena
1 maline crvena
2 banane žuta

Naravno, kada radimo sa velikim brojem podataka, poslednje što nam pada na pamet jeste da unosimo sve podatke kao serije, nego ćemo umesto toga koristiti podatke u pogodnoj formi, npr u csv fajlu (izaberite Unicode (UTF-8) enkoding prilikom otvaranja). Sada takav fajl možemo importovati u naš notebook pomoću:

voće = pd.read_csv('Voće.csv')
voće
Voće Boje Bobica
0 Jabuke Zelena 0
1 Maline Crvena 0
2 Banane Žuta 1
3 Kivi Zelena 1
4 Pomorandža Narandžasta 1
5 Lubenica Crvena 1
6 Šljiva Ljubičasta 0
7 Kajsija Narandžasta 0
8 Borovnica Plava 1
struktura dataframe-a

Importovanje podataka pomoću url-a

importovanje preko urla

Eksportovanje DataFrame-a

voće.to_csv('exportovano voće.csv')
voće.to_csv

prva komanda će kreirati fajl exportovano voće.csv i sačuvati ga među našim fajlovima. Druga naredba će samo prikazati sadržaj fajla.

Ako sada importujemo ovaj eksportovani fajl:

exvoće = pd.read_csv('exportovano voće.csv') Enter
exvoće Shift+Enter
Unnamed Voće Boje Bobica
0 0 Jabuke Zelena 0
1 1 Maline Crvena 0
2 2 Banane Žuta 1
3 3 Kivi Zelena 1
4 4 Pomorandža Narandžasta 1
5 5 Lubenica Crvena 1
6 6 Šljiva Ljubičasta 0
7 7 Kajsija Narandžasta 0
8 8 Borovnica Plava 1

Videćemo da se kreirala nova kolona nazvana "Unnamed" u kojoj se nalaze redni brojevi naših redova.

Da bismo izbegli ovo dupliranje indexa, exportovanje bismo vršili na sledeći način:

voće.to_csv('exportovano voće.csv', index=False)

Članak prvi put objavljen: 27.4.2021.

Poslednje izmene: 31.1.2022.

Autor: k.

Top