Python je kot jezik nadvse dragocen, še posebej, če želite delati s strukturiranimi podatki. Ker ljudje shranijo veliko podatkov v Excelove datoteke, je nujno združiti več datotek, da prihranimo čas in trud.
Python vam omogoča točno to; ne glede na to, koliko datotek Excel želite združiti, lahko to storite z relativno lahkoto. Glede na nabor knjižnic in virov tretjih oseb lahko uvozite in uporabljate večplastna orodja Python za svoje ponudbe.
V tem priročniku boste morali namestiti in uporabiti Pandasove knjižnice za uvoz podatkov v Python, preden jih konsolidirate.
Namestite Pandas Libraries v Python
Pandas je knjižnica drugega proizvajalca, ki jo lahko namestite v Python. Nekateri IDE-ji že imajo nameščene Pande.
Če uporabljate IDE različica ki ne prihaja z vnaprej nameščenimi Pandami, bodite prepričani, da ga lahko namestite neposredno v Python.
Takole namestite Pande:
pip install pandas
Če uporabljate Jupyter Notebook, lahko Pande namestite neposredno z Ukaz PIP. Večinoma, ko ste namestili Jupyter z Anacondo, so velike možnosti, da so Pande že na voljo za neposredno uporabo.
Če Pande ne morete poklicati, jih lahko neposredno namestite z zgornjim ukazom.
Kombinacija Excelovih datotek s Pythonom
Najprej morate ustvariti mapo na želeni lokaciji z vsemi datotekami Excel. Ko je mapa pripravljena, lahko začnete pisati kodo za uvoz knjižnic.
V tej kodi boste uporabili dve spremenljivki:
- pande: Knjižnica Pandas ponuja podatkovne okvirje za shranjevanje Excelovih datotek.
- OS: Knjižnica je koristna za branje podatkov iz mape vaše naprave
Za uvoz teh knjižnic uporabite te ukaze:
Uvozite Pande kot pd
Uvozi OS
- uvoz: Sintaksa Python, ki se uporablja za uvoz knjižnic v Python
- pande: Ime knjižnice
- pd: Vzdevek, dan knjižnici
- OS: Knjižnica za dostop do sistemske mape
Ko uvozite knjižnice, ustvarite dve spremenljivki za shranjevanje poti vhodne in izhodne datoteke. Pot vhodne datoteke je potrebna za dostop do mape datotek. Pot izhodne datoteke je potrebna, saj bo združena datoteka izvožena tja.
Če uporabljate Python, se prepričajte, da spremenite poševnico nazaj v poševnico naprej (\ do /)
input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel datoteke/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"
Pripnite / na koncu tudi za dokončanje poti.
Datoteke v mapi so na voljo na seznamu. Ustvarite seznam za shranjevanje vseh referenc datotek v vhodni mapi z uporabo listdir funkcijo iz OS knjižnica.
Če niste prepričani o funkcijah, ki so na voljo v knjižnici, lahko uporabite r funkcijo z imenom knjižnice. Če želite na primer preveriti natančno različico funkcije listdir, lahko uporabite ukaz, kot sledi:
dir (OS)
Izhod bo sestavljen iz vseh povezanih funkcij, ki so na voljo v knjižnici OS. Funkcija listdir je ena izmed mnogih funkcij, ki so na voljo v tej knjižnici.
Ustvarite novo spremenljivko za shranjevanje vhodnih datotek iz mape.
excel_file_list = os.listdir (input_file_path)
Natisnite to spremenljivko, če si želite ogledati imena datotek, shranjenih v mapi. Vse datoteke, shranjene v mapi, se prikažejo, ko uporabite funkcijo tiskanja.
natisni (excel_file_list)
Nato morate dodati nov podatkovni okvir za shranjevanje vsake Excelove datoteke. Predstavljajte si podatkovni okvir kot vsebnik za shranjevanje podatkov. Tukaj je ukaz za ustvarjanje podatkovnega okvirja.
df = pd. DataFrame()
- df: Spremenljivka za shranjevanje vrednosti DataFrame
- pd: Vzdevek za Pandas knjižnica
- Podatkovni okvir: Privzeta sintaksa za dodajanje podatkovnega okvirja
Vhodna mapa ima tri .xlsx datoteke v tem primeru. Imena datotek so:
File1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx
Če želite odpreti vsako datoteko iz te mape, morate zagnati zanko. Zanka se bo izvajala za vsako od datotek na zgornjem seznamu.
To lahko storite tako:
za excel_files v excel_file_list:
Nato morate preveriti razširitve datotek, saj bo koda odprla samo datoteke XLSX. Če želite preveriti te datoteke, lahko uporabite datoteko Če izjava.
Uporabi konča z deluje v ta namen, kot sledi:
za excel_files v excel_file_list:
če excel_files.endswith(".xlsx"):
- excel_files: Seznam z vsemi vrednostmi datoteke
- konča z: Funkcija za preverjanje razširitve datotek
- (".xlsx"): Ta vrednost niza se lahko spremeni, odvisno od tega, kaj želite iskati
Zdaj, ko ste identificirali datoteke Excel, lahko ustvarite nov podatkovni okvir za branje in shranjevanje datotek posamezno.
za excel_files v excel_file_list:
če excel_files.endswith(".xlsx"):
df1 = pd.read_excel (pot_vhodne_datoteke+datoteke_excel)
- df1: Nov podatkovni okvir
- pd: Pandas knjižnica
- read_excel: Funkcija za branje datotek Excel v knjižnici Pandas
- input_file_path: Pot do mape, v kateri so shranjene datoteke
- excel_files: Vsaka spremenljivka, ki se uporablja v zanki for
Če želite začeti dodajati datoteke, morate uporabiti dodaj funkcijo.
za excel_files v excel_file_list:
če excel_files.endswith(".xlsx"):
df1 = pd.read_excel (pot_vhodne_datoteke+datoteke_excel)
df = df.dodati (df1)
Končno, zdaj, ko je konsolidirani podatkovni okvir pripravljen, ga lahko izvozite na izhodno lokacijo. V tem primeru izvozite podatkovni okvir v datoteko XLSX.
df.to_excel (pot_izhodne_datoteke+"Consolidated_file.xlsx")
- df: Podatkovni okvir za izvoz
- to_excel: Ukaz, ki se uporablja za izvoz podatkov
- pot_izhodne_datoteke: Določena pot za shranjevanje izhoda
- Consolidated_file.xlsx: Ime konsolidirane datoteke
Zdaj pa poglejmo končno kodo:
#Pandas se uporablja kot podatkovni okvir za obdelavo Excelovih datotek
uvozi pande kot pd
uvoz os# spremenite poševnico iz “\” v “/”, če uporabljate naprave Windows
input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel datoteke/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"#ustvarite seznam za shranjevanje vseh referenc datotek v vhodni mapi s funkcijo listdir iz knjižnice os.
#Če želite videti vsebino knjižnice (kot je funkcija listdir, lahko uporabite funkcijo dir v imenu knjižnice).
#Uporabi dir (ime_knjižnice) za seznam vsebineexcel_file_list = os.listdir (input_file_path)
#natisnite vse datoteke, shranjene v mapi, potem ko definirate seznam
excel_file_list#Ko se vsaka datoteka odpre, uporabite funkcijo dodajanja, da začnete združevati podatke, shranjene v več datotekah
#ustvarite nov, prazen podatkovni okvir za obdelavo uvozov Excelove datoteke
df = pd. DataFrame()#Zaženite zanko for, da prelistate vsako datoteko na seznamu
za excel_files v excel_file_list:
#preveri samo datoteke s pripono .xlsx
če excel_files.endswith(".xlsx"):
#ustvarite nov podatkovni okvir za branje/odpiranje vsake Excelove datoteke s seznama datotek, ustvarjenih zgoraj
df1 = pd.read_excel (pot_vhodne_datoteke+datoteke_excel)
#dodajte vsako datoteko v izvirni prazen podatkovni okvir
df = df.dodati (df1)
#prenesi končni izhod v datoteko Excel (xlsx) na izhodni poti
df.to_excel (pot_izhodne_datoteke+"Consolidated_file.xlsx")
Uporaba Pythona za združevanje več Excelovih delovnih zvezkov
Python's Pandas je odlično orodje za začetnike in napredne uporabnike. Knjižnico v veliki meri uporabljajo razvijalci, ki želijo obvladati Python.
Tudi če ste začetnik, vam lahko zelo koristi, če se naučite nians Pande in kako se knjižnica uporablja v Pythonu.
Obvladajte Pande s temi začetniškimi operacijami.
Preberite Naprej
- Programiranje
- Python
- Microsoft Excel
- Preglednica

Gaurav Siyal ima dve leti izkušenj s pisanjem, pisanjem za vrsto podjetij za digitalni marketing in dokumente o življenjskem ciklu programske opreme.
Naročite se na naše novice
Pridružite se našemu glasilu za tehnične nasvete, ocene, brezplačne e-knjige in ekskluzivne ponudbe!
Kliknite tukaj, da se naročite