Pandas je odprtokodna knjižnica Python, ki se večinoma uporablja za manipulacijo in analizo podatkov. Zgrajen je na vrhu knjižnice NumPy in zagotavlja visoko zmogljive, enostavne za uporabo podatkovne strukture in orodja za analizo podatkov za programski jezik Python.

V tem članku se boste naučili, kako izvesti 6 osnovnih operacij s Pandas.

Uporaba primerov Pandas

Primere v tem članku lahko zaženete z uporabo računalniških zvezkov, kot je Jupyter Notebook, Google Colab, itd Primere lahko zaženete tudi tako, da vnesete kodo neposredno v tolmač Python v interaktivnem načinu.

Če si želite ogledati celotno izvorno kodo, uporabljeno v tem članku, lahko dostopate do datoteke Python Notebook iz tega GitHub repozitorij.

1. Kako uvoziti Pande kot pd in natisniti številko različice

Uporabiti morate uvoz ključno besedo za uvoz katere koli knjižnice v Pythonu. Pande se običajno uvažajo pod pd vzdevek. S tem pristopom se lahko sklicujete na paket Pandas kot pd namesto pande.

uvozi pande kot pd
natisni (pd.__različica__)
instagram viewer

Izhod:

1.2.4

2. Kako ustvariti serijo v Pandah

Pandas Series je enodimenzionalni niz, ki vsebuje podatke katere koli vrste. To je kot stolpec v tabeli. Nizo lahko ustvarite z uporabo nizov numpy, funkcij numpy, seznamov, slovarjev, skalarnih vrednosti itd.

Vrednosti serije so označene z njihovo indeksno številko. Privzeto ima prva vrednost indeks 0, druga vrednost ima indeks 1 itd. Če želite poimenovati lastne oznake, morate uporabiti indeks prepir.

Kako ustvariti prazno serijo

s = pd. Serija (dtype='float64')
s

Izhod:

Serija([], dtype: float64)

V zgornjem primeru je prazna serija z lebdeti je ustvarjena vrsta podatkov.

Kako ustvariti serijo z matriko NumPy

uvozi pande kot pd
uvozi numpy kot np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serija (d)
s

Izhod:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Povezano: Operacije NumPy za začetnike

Kako ustvariti serijo s seznamom

d = [1, 2, 3, 4, 5]
s = pd. Serija (d)
s

Izhod:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Kako ustvariti serijo z indeksom

Če želite ustvariti niz z indeksom, morate uporabiti indeks prepir. Število indeksov mora biti enako številu elementov v seriji.

d = [1, 2, 3, 4, 5]
s = pd. Serija (d, indeks=["ena", "dva", "tri", "štiri", "pet"])
s

Izhod:

ena 1
dva 2
trije 3
štiri 4
pet 5
dtype: int64

Kako ustvariti serijo s pomočjo slovarja

Ključi slovarja postanejo oznake serije.

d = {"ena": 1,
"dva": 2,
"trije": 3,
"štiri": 4,
"pet": 5}
s = pd. Serija (d)
s

Izhod:

ena 1
dva 2
trije 3
štiri 4
pet 5
dtype: int64

Kako ustvariti serijo z uporabo skalarne vrednosti

Če želite ustvariti niz z uporabo skalarne vrednosti, morate zagotoviti indeks prepir.

s = pd. Serija (1, indeks = ["a", "b", "c", "d"])
s

Izhod:

a 1
b 1
c 1
d 1
dtype: int64

3. Kako ustvariti podatkovni okvir v Pandah

DataFrame je dvodimenzionalna podatkovna struktura, kjer so podatki poravnani v obliki vrstic in stolpcev. DataFrame je mogoče ustvariti z uporabo slovarjev, seznamov, seznama slovarjev, nizov numpy itd. V resničnem svetu so DataFrames ustvarjeni z uporabo obstoječega pomnilnika, kot so datoteke CSV, Excelove datoteke, baze podatkov SQL itd.

Objekt DataFrame podpira številne atribute in metode. Če želite izvedeti več o njih, si lahko ogledate uradno dokumentacijo pandas podatkovni okvir.

Kako ustvariti prazen podatkovni okvir

df = pd. DataFrame()
natisni (df)

Izhod:

Prazen podatkovni okvir
Stolpci: []
Kazalo: []

Kako ustvariti podatkovni okvir z uporabo seznama

listObj = ["MUO", "tehnologija", "poenostavljeno"]
df = pd. DataFrame (listObj)
natisni (df)

Izhod:

 0
0 MUO
1 tehnologija
2 poenostavljeno

Kako ustvariti podatkovni okvir z uporabo slovarja ndarray/Lists

batmanData = {'Ime filma': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Leto izdaje': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
natisni (df)

Izhod:

 Ime filma Leto izdaje
0 Batman se začne 2005
1 Temni vitez 2008
2 The Dark Knight Rises 2012

Kako ustvariti podatkovni okvir s seznamom seznamov

podatki = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (podatki, stolpci = ['Ime', 'Roll No.'])
natisni (df)

Izhod:

 Ime Roll št.
0 Alex 601
1 Bob 602
2 Katalina 603

Kako ustvariti podatkovni okvir z uporabo seznama slovarjev

podatki = [{'Ime': 'Alex', 'Roll No.': 601},
{'Ime': 'Bob', 'Roll No.': 602},
{'Ime': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (podatki)
natisni (df)

Izhod:

 Ime Roll št.
0 Alex 601
1 Bob 602
2 Katalina 603

Povezano: Kako pretvoriti seznam v slovar v Pythonu

Kako ustvariti podatkovni okvir z uporabo funkcije zip().

Uporabi zip() funkcijo za spajanje seznamov v Pythonu.

Ime = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = seznam (zip (Ime, RollNo))
df = pd. DataFrame (listOfTuples, stolpci = ['Ime', 'Roll No.'])
natisni (df)

Izhod:

 Ime Roll št.
0 Alex 601
1 Bob 602
2 Katalina 603

4. Kako brati podatke CSV v Pandah

Datoteka "vrednosti, ločene z vejico" (CSV) je ločena besedilna datoteka, ki za ločevanje vrednosti uporablja vejico. Datoteko CSV lahko preberete s pomočjo read_csv() metoda pri pandah. Če želite natisniti celoten DataFrame, uporabite to_string() metoda.

V tem in naslednjih primerih, to datoteka CSV bo uporabljen za izvajanje operacij.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
natisni (df.to_string())

Izhod:

5. Kako analizirati okvirje podatkov z uporabo metod head(), tail() in info().

Kako si ogledate podatke z uporabo metode head().

The glava () Metoda je eden najboljših načinov za hiter pregled nad DataFrame. Ta metoda vrne glavo in določeno število vrstic, začenši z vrha.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisk (df.glava (10))

Izhod:

Če ne navedete števila vrstic, bo vrnjenih prvih 5 vrstic.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tiskanje (df.head())

Izhod:

Kako si ogledate podatke z uporabo metode tail().

The rep () vrne glavo in določeno število vrstic, začenši od spodaj.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisk (df.tail (10))

Izhod:

Če ne navedete števila vrstic, bo vrnjenih zadnjih 5 vrstic.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tiskanje (df.tail())

Izhod:

Kako pridobiti informacije o podatkih

The info() metode vrnejo kratek povzetek DataFrame, vključno z indeksom dtype in stolpcem dtypes, vrednostmi, ki niso ničelne, in uporabo pomnilnika.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
natisni (df.info())

Izhod:

6. Kako brati podatke JSON v Pandah

JSON (JavaSCript Opredmet Notation) je lahek format za izmenjavo podatkov. Datoteko JSON lahko preberete z uporabo read_json() metoda pri pandah. Če želite natisniti celoten DataFrame, uporabite to_string() metoda.

V spodnjem primeru je to JSON datoteka se uporablja za izvajanje operacij.

Povezano: Kaj je JSON? Pregled laika

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
natisni (df.to_string())

Izhod:

Osvežite svoje znanje o Pythonu z vgrajenimi funkcijami in metodami

Funkcije pomagajo skrajšati vašo kodo in izboljšati njeno učinkovitost. Funkcije in metode, kot so zmanjšati (), split(), naštej (), eval(), krog (), itd lahko naredi vašo kodo robustno in enostavno razumljivo. Vedno je dobro vedeti o vgrajenih funkcijah in metodah, saj lahko v veliki meri poenostavijo vaše programske naloge.

DelitiTweetE-naslov
20 funkcij Pythona, ki jih morate poznati

Standardna knjižnica Python vsebuje številne funkcije za pomoč pri programskih opravilih. Spoznajte najbolj uporabne in ustvarite robustnejšo kodo.

Preberite Naprej

Povezane teme
  • Programiranje
  • Python
  • Spletni razvoj
  • Programiranje
  • Analiza podatkov
O avtorju
Yuvraj Chandra (Objavljenih 69 člankov)

Yuvraj je dodiplomski študent računalništva na Univerzi v Delhiju v Indiji. Navdušen je nad spletnim razvojem Full Stack. Ko ne piše, raziskuje globino različnih tehnologij.

Več od Yuvraj Chandra

Naročite se na naše novice

Pridružite se našemu glasilu za tehnične nasvete, ocene, brezplačne e-knjige in ekskluzivne ponudbe!

Kliknite tukaj, da se naročite