Python, kaip kalba, yra nepaprastai vertinga, ypač kai norite dirbti su struktūriniais duomenimis. Kadangi žmonės „Excel“ failuose saugo daug duomenų, norint sutaupyti laiko ir pastangų, būtina sujungti kelis failus.

Python leidžia daryti būtent tai; nesvarbu, kiek Excel failų norite sujungti, galite tai padaryti gana lengvai. Atsižvelgdami į bibliotekų ir trečiųjų šalių išteklių asortimentą, galite importuoti ir naudoti daugialypius „Python“ įrankius, kad pateiktumėte pasiūlymus.

Šiame vadove turėsite įdiegti ir naudoti Pandas bibliotekas, kad importuotumėte duomenis į Python, prieš juos konsoliduodami.

Įdiekite Pandas bibliotekas Python

Pandas yra trečiosios šalies biblioteka, kurią galite įdiegti Python. Kai kuriuose IDE jau yra įdiegtos Pandos.

Jei naudojate an IDE versija būkite tikri, kad jas galite įdiegti tiesiogiai Python.

Štai kaip įdiegti Pandas:

pip įdiegti pandas

Jei naudojate Jupyter Notepad, galite įdiegti Pandas tiesiogiai naudodami PIP komanda. Dažniausiai, kai įdiegiate Jupyter su Anaconda, yra didelė tikimybė, kad Pandas jau bus galima naudoti tiesiogiai.

instagram viewer

Jei negalite paskambinti Pandai, galite naudoti aukščiau pateiktą komandą, kad jas tiesiogiai įdiegtumėte.

„Excel“ failų derinimas su „Python“.

Pirmiausia turite sukurti aplanką pageidaujamoje vietoje su visais „Excel“ failais. Kai aplankas bus paruoštas, galite pradėti rašyti kodą, kad importuotumėte bibliotekas.

Šiame kode naudosite du kintamuosius:

  1. Pandos: „Pandas“ bibliotekoje pateikiami duomenų rėmeliai „Excel“ failams saugoti.
  2. OS: Biblioteka naudinga nuskaitant duomenis iš įrenginio aplanko

Norėdami importuoti šias bibliotekas, naudokite šias komandas:

Importuoti Pandas kaip pd
Importuoti OS
  • Importuoti: Python sintaksė, naudojama bibliotekoms importuoti į Python
  • Pandos: Bibliotekos pavadinimas
  • pd: Bibliotekai suteiktas slapyvardis
  • OS: Biblioteka, skirta pasiekti sistemos aplanką

Kai importuosite bibliotekas, sukurkite du kintamuosius, kad išsaugotumėte įvesties ir išvesties failo kelią. Įvesties failo kelias reikalingas norint pasiekti failų aplanką. Išvesties failo kelias yra būtinas, nes sujungtas failas bus eksportuojamas ten.

Jei naudojate Python, būtinai pakeiskite pasvirąjį brūkšnį į priekį (\ į /)

input_file_path = "C:/Vartotojai/gaurav/OneDrive/Desktop/Excel failai/"
output_file_path = "C:/Vartotojai/gaurav/OneDrive/Desktop/"

Pridėkite / pabaigoje taip pat užbaigti kelius.

Aplanko failai yra sąraše. Sukurkite sąrašą, kad išsaugotumėte visas įvesties aplanko failų nuorodas naudodami sąrašo vad funkcija iš OS biblioteka.

Jei nesate tikri, kokios funkcijos yra prieinamos bibliotekoje, galite naudoti rež funkcija su bibliotekos pavadinimu. Pavyzdžiui, norėdami patikrinti tikslią funkcijos listdir versiją, galite naudoti komandą taip:

dir (OS)

Išvestį sudarys visos susijusios funkcijos, prieinamos OS bibliotekoje. Listdir funkcija yra viena iš daugelio šioje bibliotekoje galimų funkcijų.

Sukurkite naują kintamąjį, kad išsaugotumėte įvesties failus iš aplanko.

excel_file_list = os.listdir (input_file_path)

Išspausdinkite šį kintamąjį, kad pamatytumėte aplanke saugomų failų pavadinimus. Kai naudojate spausdinimo funkciją, rodomi visi aplanke saugomi failai.

spausdinti (excel_file_list)

Tada turite pridėti naują duomenų rėmelį, kad išsaugotumėte kiekvieną "Excel" failą. Įsivaizduokite duomenų rėmelį kaip duomenų saugojimo talpyklą. Čia yra duomenų rėmelio kūrimo komanda.

df = pd. DataFrame()
  • df: Kintamasis, skirtas saugoti DataFrame reikšmę
  • pd: Pseudonimas Pandos biblioteka
  • DataFrame: Numatytoji duomenų rėmelio pridėjimo sintaksė

Įvesties aplanke yra trys .xlsx failai šiame pavyzdyje. Failų pavadinimai yra:

Failas1_excel.xlsx
Failas2_excel.xlsx
Failas3_excel.xlsx

Norėdami atidaryti kiekvieną failą iš šio aplanko, turite paleisti kilpą. Ciklas bus paleistas kiekvienam iš anksčiau sukurtame sąraše esantiems failams.

Štai kaip tai galite padaryti:

excel_files excel_file_list:

Tada būtina patikrinti failų plėtinius, nes kodas atidarys tik XLSX failus. Norėdami patikrinti šiuos failus, galite naudoti Jeigu pareiškimas.

Naudoti baigiasi funkcija šiam tikslui, kaip nurodyta toliau:

excel_files excel_file_list:

jei excel_files.endswith(.xlsx"):

  • excel_files: Sąrašas su visomis failo reikšmėmis
  • baigiasi: Funkcija patikrinti failų plėtinį
  • (.xlsx"): Šios eilutės reikšmė gali keistis, atsižvelgiant į tai, ko norite ieškoti

Dabar, kai identifikavote „Excel“ failus, galite sukurti naują duomenų rėmelį, kad galėtumėte skaityti ir saugoti failus atskirai.

excel_files excel_file_list:

jei excel_files.endswith(.xlsx"):

df1 = pd.read_excel (įvesties_failo_kelias+excel_failai)

  • df1: Naujas duomenų rėmelis
  • pd: Pandos biblioteka
  • read_excel: Funkcija skaityti Excel failus Pandas bibliotekoje
  • input_file_path: Aplanko, kuriame saugomi failai, kelias
  • excel_files: Bet koks kintamasis, naudojamas cikle for

Norėdami pradėti pridėti failus, turite naudoti pridėti funkcija.

excel_files excel_file_list:

jei excel_files.endswith(.xlsx"):

df1 = pd.read_excel (įvesties_failo_kelias+excel_failai)
df = df.pridėti (df1)

Galiausiai, dabar, kai konsoliduotų duomenų rėmelis yra paruoštas, galite eksportuoti jį į išvesties vietą. Tokiu atveju duomenų rėmelį eksportuojate į XLSX failą.

df.to_excel (output_file_path+"Consolidated_file.xlsx")
  • df: Eksportuotinas duomenų rėmelis
  • to_excel: Duomenims eksportuoti naudojama komanda
  • output_file_path: Nurodytas išvesties saugojimo kelias
  • Consolidated_file.xlsx: Suvestinio failo pavadinimas

Dabar pažiūrėkime į galutinį kodą:

#Pandas naudojamas kaip duomenų rėmelis Excel failams tvarkyti
importuoti pandas kaip pd
importuoti os

# pakeiskite pasvirąjį brūkšnį iš „\“ į „/“, jei naudojate „Windows“ įrenginius

input_file_path = "C:/Vartotojai/gaurav/OneDrive/Desktop/Excel failai/"
output_file_path = "C:/Vartotojai/gaurav/OneDrive/Desktop/"

#sukurkite sąrašą, kad išsaugotumėte visas įvesties aplanko failų nuorodas naudodami listdir funkciją iš OS bibliotekos.
#Jei norite pamatyti bibliotekos turinį (pvz., funkciją listdir, bibliotekos pavadinime galite naudoti dir funkciją).
#Turiniui išvardyti naudokite dir (bibliotekos_pavadinimas).

excel_file_list = os.listdir (input_file_path)

#išspausdinkite visus aplanke saugomus failus, sukūrę sąrašą
excel_file_list

#Kai kiekvienas failas atsidarys, naudokite pridėjimo funkciją, kad pradėtumėte konsoliduoti keliuose failuose saugomus duomenis

#sukurkite naują, tuščią duomenų rėmelį, kad galėtumėte importuoti „Excel“ failus
df = pd. DataFrame()

#Paleiskite for ciklus, kad peržiūrėtumėte kiekvieną sąrašo failą
excel_files excel_file_list:
#tikrinkite tik .xlsx priesagų failus
jei excel_files.endswith(.xlsx"):
#sukurkite naują duomenų rėmelį, kad galėtumėte skaityti / atidaryti kiekvieną Excel failą iš anksčiau sukurtų failų sąrašo
df1 = pd.read_excel (įvesties_failo_kelias+excel_failai)
#pridėkite kiekvieną failą į pradinį tuščią duomenų rėmelį
df = df.pridėti (df1)

#perkelkite galutinę išvestį į Excel (xlsx) failą išvesties kelyje
df.to_excel (output_file_path+"Consolidated_file.xlsx")

„Python“ naudojimas norint sujungti kelias „Excel“ darbaknyges

Python's Pandas yra puikus įrankis pradedantiesiems ir pažengusiems vartotojams. Biblioteka plačiai naudojama kūrėjų, kurie nori įvaldyti Python.

Net jei esate pradedantysis, išmoksite „Pandų“ niuansų ir sužinosite, kaip biblioteka naudojama „Python“ sistemoje.

6 Pandos operacijos pradedantiesiems

Susipažinkite su pandomis atlikdami šias pradedančiųjų operacijas.

Skaitykite toliau

DalintisTviteryjeEl. paštas
Susijusios temos
  • Programavimas
  • Python
  • Microsoft Excel
  • Skaičiuoklė
Apie autorių
Gaurav Siyal (59 straipsniai paskelbti)

Gaurav Siyal turi dvejų metų rašymo patirtį, rašo skaitmeninės rinkodaros įmonėms ir programinės įrangos gyvavimo ciklo dokumentus.

Daugiau iš Gaurav Siyal

Prenumeruokite mūsų naujienlaiškį

Prisijunkite prie mūsų naujienlaiškio, kad gautumėte techninių patarimų, apžvalgų, nemokamų el. knygų ir išskirtinių pasiūlymų!

Norėdami užsiprenumeruoti, spustelėkite čia