Slušaj robot čitača

Jupyter Notebook

Sadržaj strane:

Da vidite kako da pokrenete Jupyter Notebook pogledajte prethodnu lekciju. Kada otvorite Jupyter Notebook, u meniju kliknite na new, pa na python3

Na vrhu strane ćete videti gde piše "untitled", kliknite tu da promenite ime file-a

Na radnoj površini ćete videti ćelije, dok u njih ukucavate kôd, one će biti zelene, a kada ih napustite poplaveće. Mogu sadržati kôd i markdown, koji nemaju veze sa bojom ćelije. Markdown se koristi da olakša čitanje kôda.

Kada ukucate komandu u ćeliju, da biste ga pokrenuli, potrebno je da kliknete Shift+Enter ili run u meniju. Ako kliknete samo Enter, prećićete u novi red u istoj ćeliji, i kod se neće izvršiti.

print('Pozdrav narode') Enter
Shift+Enter

Pozdrav narode

Broj levo od ćelije, se povećava svaki put kad se kod izvrši, tako da prikazuje redosled kojim su se komande izvršile. In označava ulaznu komandu, a Out, izlazni podatak

Da se izađe iz edit moda, pri čemu će ćelija iz zelene preći u plavu boju, i nestaće ikonica olovke iz menija, samo pritisnite Esc na tastaturi. Da bismo se vratili u edit môd, pritisnućemo Enter.

Kada smo u komandnom modu, (plavi mod, za razliku od zelenog, edit moda), ako pritisnemo slovo M uneti tekst će se tretirati kao markup, a ako hoćemo da se vratimo u kôd môd, pritisnućemo Y.

import pandas as pd

Da bismo uvezli podatke iz csv (excel) fajla u jupyter notebook, koristićemo Pandas, i to tako što ćemo kreirati DataFrame i u njega učitati podatke:

df = pd.read_csv('ime fajla')

Kad god unosite imena spoljnih fajlova, najbolje je da pritisnete tab da uradite autocomplete, jer kao što znate, jedna slovna greška i link neće raditi.

Ukupan broj podataka u dataframe-u:

df.shape

(9, 3)

Odgovor je broj redova, i broj kolona.

Pregled podataka

Sada imamo sadržaj csv fajla, pohranjen u promenjivu df. Ako npr hoćemo da vidimo prvih 5 od ovih podataka, možemo koristiti komandu:

df.head()

dokumentacija

A ako hoćemo neki drugi broj podataka, koristili bismo npr

df.head(10)

Ako hoćemo da vidimo sve podatke, osim određenog broja poslednjih podataka, mogli bismo koristiti:

df.head(-1)

Koja bi prikazala sve podatke sem poslednjeg. Dok će:

df.tail()

prikazati poslednjih 5 podataka.

Da bismo videli sve podatke, koristili bismo samo ime dataframe-a. Međutim, ovo neće zaista prikazati sve podatke ako ih imamo više od 10, prikazaće samo prvih 5 i poslednjih 5, pošto će notebook trunktirati ostale podatke.

df Shift + Enter

Ako to ima smisla, da bismo videli sve, sve podatke, mogli bismo izvršiti sledeća podešavanja:

pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)
pd.set_option('display.max_colwidth', None)

Esc + A ili B, kreira novu ćeliju iznad odnosno ispod trenutne ćelije

ctrl+shift+F da se otvori komanda paleta gde možemo videti sve keyboard shortcuts za yupiter notebook

Kako prebrojati koliko puta se određena vrednost javlja u koloni?

df.target.value_counts()

dokumentacija

Target je ime kolone, i pokretanjem ove komande ćemo videti da imamo 1 u 165 kolona i 0 u 138 kolona.

Prikaz u dijagramu

Ako hoćemo da prikažemo podatke u dijagramu:

df.target.value_counts().plot(kind="bar")

Bar znači šipka, i time pandas-u govorimo da hoćemo da nam nacrta stubasti dijaram

Ovo bi prikazalo podatke po rastućem redosledu učestalosti, što možda nije ono što želimo. Da bismo prikazali podatke redosledom koji nama ima smisla:

df.age.value_counts(sort=False).plot(kind="bar")

Slika kao markdown

![opciono ime](putanja\do\fajla\imefajla.ext)

Putanja i ime fajla nisu napisani pod navodnicima, tako da je potrebno da ime fajla bude jedna reč

preko html-a

naredbe iz terminala se mogu pokrenuti iz jupyterovih ćelija

Za linux komande:

ili za windows komande:

!dir

Članak prvi put objavljen: 27.4.2021.

Poslednje izmene: 31.1.2022.

Autor: k.