Kako združiti več Excelovih delovnih zvezkov s Pythonom

Python je kot jezik nadvse dragocen, še posebej, če želite delati s strukturiranimi podatki. Ker ljudje shranijo veliko podatkov v Excelove datoteke, je nujno združiti več datotek, da prihranimo čas in trud.

Python vam omogoča točno to; ne glede na to, koliko datotek Excel želite združiti, lahko to storite z relativno lahkoto. Glede na nabor knjižnic in virov tretjih oseb lahko uvozite in uporabljate večplastna orodja Python za svoje ponudbe.

V tem priročniku boste morali namestiti in uporabiti Pandasove knjižnice za uvoz podatkov v Python, preden jih konsolidirate.

Namestite Pandas Libraries v Python

Pandas je knjižnica drugega proizvajalca, ki jo lahko namestite v Python. Nekateri IDE-ji že imajo nameščene Pande.

Če uporabljate IDE različica ki ne prihaja z vnaprej nameščenimi Pandami, bodite prepričani, da ga lahko namestite neposredno v Python.

Takole namestite Pande:

pip install pandas

Če uporabljate Jupyter Notebook, lahko Pande namestite neposredno z Ukaz PIP. Večinoma, ko ste namestili Jupyter z Anacondo, so velike možnosti, da so Pande že na voljo za neposredno uporabo.

instagram viewer

Če Pande ne morete poklicati, jih lahko neposredno namestite z zgornjim ukazom.

Kombinacija Excelovih datotek s Pythonom

Najprej morate ustvariti mapo na želeni lokaciji z vsemi datotekami Excel. Ko je mapa pripravljena, lahko začnete pisati kodo za uvoz knjižnic.

V tej kodi boste uporabili dve spremenljivki:

pande: Knjižnica Pandas ponuja podatkovne okvirje za shranjevanje Excelovih datotek.
OS: Knjižnica je koristna za branje podatkov iz mape vaše naprave

Za uvoz teh knjižnic uporabite te ukaze:

Uvozite Pande kot pd
Uvozi OS

uvoz: Sintaksa Python, ki se uporablja za uvoz knjižnic v Python
pande: Ime knjižnice
pd: Vzdevek, dan knjižnici
OS: Knjižnica za dostop do sistemske mape

Ko uvozite knjižnice, ustvarite dve spremenljivki za shranjevanje poti vhodne in izhodne datoteke. Pot vhodne datoteke je potrebna za dostop do mape datotek. Pot izhodne datoteke je potrebna, saj bo združena datoteka izvožena tja.

Če uporabljate Python, se prepričajte, da spremenite poševnico nazaj v poševnico naprej (\ do /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel datoteke/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

Pripnite / na koncu tudi za dokončanje poti.

Datoteke v mapi so na voljo na seznamu. Ustvarite seznam za shranjevanje vseh referenc datotek v vhodni mapi z uporabo listdir funkcijo iz OS knjižnica.

Če niste prepričani o funkcijah, ki so na voljo v knjižnici, lahko uporabite r funkcijo z imenom knjižnice. Če želite na primer preveriti natančno različico funkcije listdir, lahko uporabite ukaz, kot sledi:

dir (OS)

Izhod bo sestavljen iz vseh povezanih funkcij, ki so na voljo v knjižnici OS. Funkcija listdir je ena izmed mnogih funkcij, ki so na voljo v tej knjižnici.

Ustvarite novo spremenljivko za shranjevanje vhodnih datotek iz mape.

excel_file_list = os.listdir (input_file_path)

Natisnite to spremenljivko, če si želite ogledati imena datotek, shranjenih v mapi. Vse datoteke, shranjene v mapi, se prikažejo, ko uporabite funkcijo tiskanja.

natisni (excel_file_list)

Nato morate dodati nov podatkovni okvir za shranjevanje vsake Excelove datoteke. Predstavljajte si podatkovni okvir kot vsebnik za shranjevanje podatkov. Tukaj je ukaz za ustvarjanje podatkovnega okvirja.

df = pd. DataFrame()

df: Spremenljivka za shranjevanje vrednosti DataFrame
pd: Vzdevek za Pandas knjižnica
Podatkovni okvir: Privzeta sintaksa za dodajanje podatkovnega okvirja

Vhodna mapa ima tri .xlsx datoteke v tem primeru. Imena datotek so:

File1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx

Če želite odpreti vsako datoteko iz te mape, morate zagnati zanko. Zanka se bo izvajala za vsako od datotek na zgornjem seznamu.

To lahko storite tako:

za excel_files v excel_file_list:

Nato morate preveriti razširitve datotek, saj bo koda odprla samo datoteke XLSX. Če želite preveriti te datoteke, lahko uporabite datoteko Če izjava.

Uporabi konča z deluje v ta namen, kot sledi:

za excel_files v excel_file_list:če excel_files.endswith(".xlsx"):

excel_files: Seznam z vsemi vrednostmi datoteke
konča z: Funkcija za preverjanje razširitve datotek
(".xlsx"): Ta vrednost niza se lahko spremeni, odvisno od tega, kaj želite iskati

Zdaj, ko ste identificirali datoteke Excel, lahko ustvarite nov podatkovni okvir za branje in shranjevanje datotek posamezno.

za excel_files v excel_file_list:če excel_files.endswith(".xlsx"):df1 = pd.read_excel (pot_vhodne_datoteke+datoteke_excel)

df1: Nov podatkovni okvir
pd: Pandas knjižnica
read_excel: Funkcija za branje datotek Excel v knjižnici Pandas
input_file_path: Pot do mape, v kateri so shranjene datoteke
excel_files: Vsaka spremenljivka, ki se uporablja v zanki for

Če želite začeti dodajati datoteke, morate uporabiti dodaj funkcijo.

za excel_files v excel_file_list:če excel_files.endswith(".xlsx"):df1 = pd.read_excel (pot_vhodne_datoteke+datoteke_excel)
 df = df.dodati (df1)

Končno, zdaj, ko je konsolidirani podatkovni okvir pripravljen, ga lahko izvozite na izhodno lokacijo. V tem primeru izvozite podatkovni okvir v datoteko XLSX.

df.to_excel (pot_izhodne_datoteke+"Consolidated_file.xlsx")

df: Podatkovni okvir za izvoz
to_excel: Ukaz, ki se uporablja za izvoz podatkov
pot_izhodne_datoteke: Določena pot za shranjevanje izhoda
Consolidated_file.xlsx: Ime konsolidirane datoteke

Zdaj pa poglejmo končno kodo:

#Pandas se uporablja kot podatkovni okvir za obdelavo Excelovih datotek uvozi pande kot pd uvoz os# spremenite poševnico iz “\” v “/”, če uporabljate naprave Windows input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel datoteke/" output_file_path = "C:/Users/gaurav/OneDrive/Desktop/" #ustvarite seznam za shranjevanje vseh referenc datotek v vhodni mapi s funkcijo listdir iz knjižnice os. #Če želite videti vsebino knjižnice (kot je funkcija listdir, lahko uporabite funkcijo dir v imenu knjižnice). #Uporabi dir (ime_knjižnice) za seznam vsebine excel_file_list = os.listdir (input_file_path) #natisnite vse datoteke, shranjene v mapi, potem ko definirate seznam excel_file_list #Ko se vsaka datoteka odpre, uporabite funkcijo dodajanja, da začnete združevati podatke, shranjene v več datotekah #ustvarite nov, prazen podatkovni okvir za obdelavo uvozov Excelove datoteke df = pd. DataFrame() #Zaženite zanko for, da prelistate vsako datoteko na seznamu za excel_files v excel_file_list: #preveri samo datoteke s pripono .xlsx če excel_files.endswith(".xlsx"): #ustvarite nov podatkovni okvir za branje/odpiranje vsake Excelove datoteke s seznama datotek, ustvarjenih zgoraj df1 = pd.read_excel (pot_vhodne_datoteke+datoteke_excel) #dodajte vsako datoteko v izvirni prazen podatkovni okvir df = df.dodati (df1)

#prenesi končni izhod v datoteko Excel (xlsx) na izhodni poti df.to_excel (pot_izhodne_datoteke+"Consolidated_file.xlsx")

Uporaba Pythona za združevanje več Excelovih delovnih zvezkov

Python's Pandas je odlično orodje za začetnike in napredne uporabnike. Knjižnico v veliki meri uporabljajo razvijalci, ki želijo obvladati Python.

Tudi če ste začetnik, vam lahko zelo koristi, če se naučite nians Pande in kako se knjižnica uporablja v Pythonu.

6 Pandas Operations za začetnike

Obvladajte Pande s temi začetniškimi operacijami.

Preberite Naprej

DelitiTweetE-naslov

Povezane teme

Programiranje
Python
Microsoft Excel
Preglednica

O avtorju

Gaurav Siyal (59 objavljenih člankov)

Gaurav Siyal ima dve leti izkušenj s pisanjem, pisanjem za vrsto podjetij za digitalni marketing in dokumente o življenjskem ciklu programske opreme.

Več od Gaurav Siyal

Naročite se na naše novice

Pridružite se našemu glasilu za tehnične nasvete, ocene, brezplačne e-knjige in ekskluzivne ponudbe!

Kliknite tukaj, da se naročite

About Technology - denizatm.com

Kako združiti več Excelovih delovnih zvezkov s Pythonom

Namestite Pandas Libraries v Python

Kombinacija Excelovih datotek s Pythonom

Uporaba Pythona za združevanje več Excelovih delovnih zvezkov

Naročite se na naše novice

Kategorije

Recent Post

Vklopite računalnik z napravo Android prek Wi-Fi-ja [WoW LAN]

Amazon ljubi opeko in malto, Trump je označil zgubo... [Izvleček tehničnih novic]

3 najboljše brezplačne oddaljene aplikacije XBMC za iPhone in iPad