Pandas je odprtokodna knjižnica Python, ki se večinoma uporablja za manipulacijo in analizo podatkov. Zgrajen je na vrhu knjižnice NumPy in zagotavlja visoko zmogljive, enostavne za uporabo podatkovne strukture in orodja za analizo podatkov za programski jezik Python.
V tem članku se boste naučili, kako izvesti 6 osnovnih operacij s Pandas.
Uporaba primerov Pandas
Primere v tem članku lahko zaženete z uporabo računalniških zvezkov, kot je Jupyter Notebook, Google Colab, itd Primere lahko zaženete tudi tako, da vnesete kodo neposredno v tolmač Python v interaktivnem načinu.
Če si želite ogledati celotno izvorno kodo, uporabljeno v tem članku, lahko dostopate do datoteke Python Notebook iz tega GitHub repozitorij.
1. Kako uvoziti Pande kot pd in natisniti številko različice
Uporabiti morate uvoz ključno besedo za uvoz katere koli knjižnice v Pythonu. Pande se običajno uvažajo pod pd vzdevek. S tem pristopom se lahko sklicujete na paket Pandas kot pd namesto pande.
uvozi pande kot pd
natisni (pd.__različica__)
Izhod:
1.2.4
2. Kako ustvariti serijo v Pandah
Pandas Series je enodimenzionalni niz, ki vsebuje podatke katere koli vrste. To je kot stolpec v tabeli. Nizo lahko ustvarite z uporabo nizov numpy, funkcij numpy, seznamov, slovarjev, skalarnih vrednosti itd.
Vrednosti serije so označene z njihovo indeksno številko. Privzeto ima prva vrednost indeks 0, druga vrednost ima indeks 1 itd. Če želite poimenovati lastne oznake, morate uporabiti indeks prepir.
Kako ustvariti prazno serijo
s = pd. Serija (dtype='float64')
s
Izhod:
Serija([], dtype: float64)
V zgornjem primeru je prazna serija z lebdeti je ustvarjena vrsta podatkov.
Kako ustvariti serijo z matriko NumPy
uvozi pande kot pd
uvozi numpy kot np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serija (d)
s
Izhod:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Povezano: Operacije NumPy za začetnike
Kako ustvariti serijo s seznamom
d = [1, 2, 3, 4, 5]
s = pd. Serija (d)
s
Izhod:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Kako ustvariti serijo z indeksom
Če želite ustvariti niz z indeksom, morate uporabiti indeks prepir. Število indeksov mora biti enako številu elementov v seriji.
d = [1, 2, 3, 4, 5]
s = pd. Serija (d, indeks=["ena", "dva", "tri", "štiri", "pet"])
s
Izhod:
ena 1
dva 2
trije 3
štiri 4
pet 5
dtype: int64
Kako ustvariti serijo s pomočjo slovarja
Ključi slovarja postanejo oznake serije.
d = {"ena": 1,
"dva": 2,
"trije": 3,
"štiri": 4,
"pet": 5}
s = pd. Serija (d)
s
Izhod:
ena 1
dva 2
trije 3
štiri 4
pet 5
dtype: int64
Kako ustvariti serijo z uporabo skalarne vrednosti
Če želite ustvariti niz z uporabo skalarne vrednosti, morate zagotoviti indeks prepir.
s = pd. Serija (1, indeks = ["a", "b", "c", "d"])
s
Izhod:
a 1
b 1
c 1
d 1
dtype: int64
3. Kako ustvariti podatkovni okvir v Pandah
DataFrame je dvodimenzionalna podatkovna struktura, kjer so podatki poravnani v obliki vrstic in stolpcev. DataFrame je mogoče ustvariti z uporabo slovarjev, seznamov, seznama slovarjev, nizov numpy itd. V resničnem svetu so DataFrames ustvarjeni z uporabo obstoječega pomnilnika, kot so datoteke CSV, Excelove datoteke, baze podatkov SQL itd.
Objekt DataFrame podpira številne atribute in metode. Če želite izvedeti več o njih, si lahko ogledate uradno dokumentacijo pandas podatkovni okvir.
Kako ustvariti prazen podatkovni okvir
df = pd. DataFrame()
natisni (df)
Izhod:
Prazen podatkovni okvir
Stolpci: []
Kazalo: []
Kako ustvariti podatkovni okvir z uporabo seznama
listObj = ["MUO", "tehnologija", "poenostavljeno"]
df = pd. DataFrame (listObj)
natisni (df)
Izhod:
0
0 MUO
1 tehnologija
2 poenostavljeno
Kako ustvariti podatkovni okvir z uporabo slovarja ndarray/Lists
batmanData = {'Ime filma': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Leto izdaje': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
natisni (df)
Izhod:
Ime filma Leto izdaje
0 Batman se začne 2005
1 Temni vitez 2008
2 The Dark Knight Rises 2012
Kako ustvariti podatkovni okvir s seznamom seznamov
podatki = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (podatki, stolpci = ['Ime', 'Roll No.'])
natisni (df)
Izhod:
Ime Roll št.
0 Alex 601
1 Bob 602
2 Katalina 603
Kako ustvariti podatkovni okvir z uporabo seznama slovarjev
podatki = [{'Ime': 'Alex', 'Roll No.': 601},
{'Ime': 'Bob', 'Roll No.': 602},
{'Ime': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (podatki)
natisni (df)
Izhod:
Ime Roll št.
0 Alex 601
1 Bob 602
2 Katalina 603
Povezano: Kako pretvoriti seznam v slovar v Pythonu
Kako ustvariti podatkovni okvir z uporabo funkcije zip().
Uporabi zip() funkcijo za spajanje seznamov v Pythonu.
Ime = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = seznam (zip (Ime, RollNo))
df = pd. DataFrame (listOfTuples, stolpci = ['Ime', 'Roll No.'])
natisni (df)
Izhod:
Ime Roll št.
0 Alex 601
1 Bob 602
2 Katalina 603
4. Kako brati podatke CSV v Pandah
Datoteka "vrednosti, ločene z vejico" (CSV) je ločena besedilna datoteka, ki za ločevanje vrednosti uporablja vejico. Datoteko CSV lahko preberete s pomočjo read_csv() metoda pri pandah. Če želite natisniti celoten DataFrame, uporabite to_string() metoda.
V tem in naslednjih primerih, to datoteka CSV bo uporabljen za izvajanje operacij.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
natisni (df.to_string())
Izhod:
5. Kako analizirati okvirje podatkov z uporabo metod head(), tail() in info().
Kako si ogledate podatke z uporabo metode head().
The glava () Metoda je eden najboljših načinov za hiter pregled nad DataFrame. Ta metoda vrne glavo in določeno število vrstic, začenši z vrha.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisk (df.glava (10))
Izhod:
Če ne navedete števila vrstic, bo vrnjenih prvih 5 vrstic.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tiskanje (df.head())
Izhod:
Kako si ogledate podatke z uporabo metode tail().
The rep () vrne glavo in določeno število vrstic, začenši od spodaj.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisk (df.tail (10))
Izhod:
Če ne navedete števila vrstic, bo vrnjenih zadnjih 5 vrstic.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tiskanje (df.tail())
Izhod:
Kako pridobiti informacije o podatkih
The info() metode vrnejo kratek povzetek DataFrame, vključno z indeksom dtype in stolpcem dtypes, vrednostmi, ki niso ničelne, in uporabo pomnilnika.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
natisni (df.info())
Izhod:
6. Kako brati podatke JSON v Pandah
JSON (JavaSCript Opredmet Notation) je lahek format za izmenjavo podatkov. Datoteko JSON lahko preberete z uporabo read_json() metoda pri pandah. Če želite natisniti celoten DataFrame, uporabite to_string() metoda.
V spodnjem primeru je to JSON datoteka se uporablja za izvajanje operacij.
Povezano: Kaj je JSON? Pregled laika
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
natisni (df.to_string())
Izhod:
Osvežite svoje znanje o Pythonu z vgrajenimi funkcijami in metodami
Funkcije pomagajo skrajšati vašo kodo in izboljšati njeno učinkovitost. Funkcije in metode, kot so zmanjšati (), split(), naštej (), eval(), krog (), itd lahko naredi vašo kodo robustno in enostavno razumljivo. Vedno je dobro vedeti o vgrajenih funkcijah in metodah, saj lahko v veliki meri poenostavijo vaše programske naloge.
Standardna knjižnica Python vsebuje številne funkcije za pomoč pri programskih opravilih. Spoznajte najbolj uporabne in ustvarite robustnejšo kodo.
Preberite Naprej
- Programiranje
- Python
- Spletni razvoj
- Programiranje
- Analiza podatkov

Yuvraj je dodiplomski študent računalništva na Univerzi v Delhiju v Indiji. Navdušen je nad spletnim razvojem Full Stack. Ko ne piše, raziskuje globino različnih tehnologij.
Naročite se na naše novice
Pridružite se našemu glasilu za tehnične nasvete, ocene, brezplačne e-knjige in ekskluzivne ponudbe!
Kliknite tukaj, da se naročite