Pivot lentelės ir toliau yra viena iš labiausiai gerbiamų ir plačiausiai naudojamų MS Excel įrankių. Nesvarbu, ar esate duomenų analitikas, duomenų inžinierius ar tiesiog eilinis vartotojas, tikėtina, kad jau turite „MS Excel“ darbo vietą.

Nepaisant to, atsiranda vis daugiau galimybių atkartoti MS Excel įrankius ir komunalines paslaugas, ypač Python. Ar žinojote, kad Python's DataFrames galite sukurti plačias suvestines lenteles su keliomis kodo eilutėmis?

Taip, tai teisinga; jei jus domina, štai kaip galite tai padaryti.

Išankstiniai suvestinių lentelių kūrimo reikalavimai

Kaip ir bet kuri kita programavimo kalba, net „Python“ turi įvykdyti keletą būtinų sąlygų, kad galėtumėte pradėti koduoti.

Norėdami gauti maksimaliai optimizuotą patirtį kurdami pirmąją „Python“ suvestinę lentelę, jums reikės štai ko:

  • Python IDE: Daugumos Python kodų sistemoje iš anksto įdiegta integruota kūrimo aplinka (IDE). Yra keli Rinkoje yra su Python suderinami IDE, įskaitant Jupyter Notebook, Spyder, PyCharm ir daugelį kitų.
  • instagram viewer
  • Duomenų pavyzdžiai: Norėdami iliustruoti, pateikiame pavyzdinį duomenų rinkinį, su kuriuo galite dirbti. Arba galite koreguoti šiuos kodus tiesiogiai savo tiesioginiuose duomenyse.

Duomenų pavyzdžio nuoroda:Parduotuvės pavyzdys

Svarbių bibliotekų importavimas

Kadangi Python dirba su trečiųjų šalių bibliotekų koncepcija, turite importuoti Pandos biblioteka sukiniams kurti.

Galite naudoti Pandas importuoti Excel failą į Python ir saugoti duomenis DataFrame. Norėdami importuoti Pandas, naudokite importuoti komandą tokiu būdu:

importuoti pandos kaip pd

Kaip sukurti „Pivots“ programoje „Python“.

Kadangi dabar biblioteka yra prieinama, turite importuoti „Excel“ failą į „Python“, kuris yra „Python“ sukinių kūrimo ir tikrinimo pagrindas. Išsaugokite importuotus duomenis DataFrame su šiuo kodu:

# Sukurkite naują duomenų rėmelį
# čia pakeiskite savo keliu
kelias = "C://Users//user/OneDrive//Desktop//"
# čia galite nustatyti failo pavadinimą
failas = "Pavyzdys – Superstore.xls"
df = pd.read_excel (kelias + failas)
df.galva()

Kur:

  • df: Kintamojo pavadinimas, skirtas saugoti „DataFrame“ duomenis
  • pd: Pseudonimas Pandos bibliotekai
  • skaityti_excel(): Pandos funkcija nuskaityti Excel failą į Python
  • kelias: Vieta, kurioje saugomas „Excel“ failas (Sample Superstore)
  • failą: importuotino failo pavadinimas
  • galva(): Pagal numatytuosius nustatymus rodomos pirmosios penkios DataFrame eilutės

Aukščiau pateiktas kodas importuoja „Excel“ failą į „Python“ ir išsaugo duomenis „DataFrame“. Galiausiai, galva funkcija rodo pirmąsias penkias duomenų eilutes.

Ši funkcija yra patogi norint užtikrinti, kad duomenys būtų tinkamai importuoti į Python.

Kurie Pivot lentelės laukai egzistuoja Python?

Kaip ir „Excel“ atitikmuo, suvestinė lentelė turi panašų „Python“ laukų rinkinį. Štai keli laukai, kuriuos turite žinoti:

  • Duomenys: Duomenų laukas nurodo duomenis, saugomus Python DataFrame
  • Vertybės: Suvestyje naudojami stulpelių duomenys
  • Indeksas: Rodyklės stulpelis (-iai) duomenims grupuoti
  • Stulpeliai: Stulpeliai padeda kaupti esamus duomenis „DataFrame“.

Indekso funkcijos naudojimo tikslas

Kadangi indekso funkcija yra pagrindinis suvestinės lentelės elementas, ji grąžina pagrindinį duomenų išdėstymą. Kitaip tariant, galite sugrupuoti savo duomenis su indeksas funkcija.

Tarkime, kad norite matyti kai kurias apibendrintas produktų, išvardytų sąraše, vertes Segmentas stulpelyje. Galite apskaičiuoti iš anksto apibrėžtą agregatą (vidutinę reikšmę) Python, apibrėždami nurodytą stulpelio anindekso reikšmę.

df.pivot_table (indeksas = "Segmentas")

Kur:

  • df:DataFrame su duomenimis
  • suvestinės lentelės:Pivot lentelės funkcija Python
  • indeksas: Integruota funkcija, skirta stulpeliui apibrėžti kaip indeksą
  • Segmentas: stulpelis, naudojamas kaip indekso reikšmė

Python kintamųjų pavadinimuose skiriamos didžiosios ir mažosios raidės, todėl venkite pereiti nuo iš anksto nustatytų kintamųjų pavadinimų, išvardytų šiame vadove.

Kaip naudoti kelių indeksų reikšmes

Jei norite naudoti kelis indekso stulpelius, stulpelių pavadinimus galite apibrėžti a sąrašą indekso funkcijos viduje. Viskas, ką jums reikia padaryti, tai nurodyti stulpelių pavadinimus rinkinyje laužtiniai skliaustai ([ ]), kaip parodyta žemiau:

df.pivot_table (indeksas = ["Kategorija", "Subkategorija"])

Sukties funkcija įtraukia indekso stulpelį išvestyje. Python rodo reiškia visų skaitinių reikšmių, palyginti su kiekviena indekso verte.

Išmokite apriboti išvesties reikšmes

Kadangi „Python“ pagal numatytuosius nustatymus pasirenka visus skaitinius stulpelius, galite apriboti reikšmes, kad pakeistumėte galutiniame išvestyje rodomus rezultatus. Naudoti vertybes funkcija, kad apibrėžtumėte norimus matyti stulpelius.

df.pivot_table (indeksas = ["Regionas", "Kategorija", "Subkategorija"], reikšmės = "Pardavimai")

Galutinėje išvestyje bus trys indekso stulpeliai, o vidutinės stulpelio Pardavimas reikšmės bus sugretintos su kiekvienu elementu.

Suvestinių funkcijų apibrėžimas suvestinėje lentelėje

Kas atsitiks, kai nenorite skaičiuoti vidutinių verčių pagal numatytuosius nustatymus? Sukamojoje lentelėje yra daug kitų funkcijų, kurios neapsiriboja paprasto vidurkio apskaičiavimu.

Štai kaip parašyti kodą:

df.pivot_table (indeksas = ["Kategorija"], reikšmės = "Pardavimai", aggfunc = [suma, maks., min., len])

Kur:

  • suma: Apskaičiuoja reikšmių sumą
  • maks.: Apskaičiuoja didžiausią vertę
  • min.: Apskaičiuoja didžiausią vertę
  • len: Skaičiuoja reikšmių skaičių

Kiekvieną iš šių funkcijų taip pat galite apibrėžti atskirose kodo eilutėse.

Kaip pridėti pagrindines sumas prie suvestinės lentelės

Joks duomenų išteklius nėra baigtas be bendrųjų sumų. Norėdami apskaičiuoti ir rodyti bendras sumas kiekviename duomenų stulpelyje, naudokite paraštės ir paraštės_pavadinimas funkcija.

df.pivot_table (indeksas = ["Kategorija"], reikšmės = "Pardavimai", aggfunc = [suma, maks., min., len], margins=Tiesa, margins_name='Didžiosios sumos')

Kur:

  • paraštės: Funkcija bendros sumos apskaičiavimui
  • margins_name: Rodyklės stulpelyje nurodykite kategorijos pavadinimą (pvz., bendrosios sumos)

Pakeiskite ir naudokite galutinį kodą

Štai galutinis trumpas kodas:

importuoti pandos kaip pd
# čia pakeiskite savo keliu
kelias = "C://Users//user/OneDrive//Desktop//"
# čia galite nustatyti failo pavadinimą
failas = "Pavyzdys – Superstore.xls"
df = pd.read_excel (kelias + failas)
df.pivot_table (indeksas = ["Regionas", "Kategorija", "Subkategorija"], reikšmės = "Pardavimai",
aggfunc = [suma, maks., min., len],
paraštės =Tiesa,
paraštės_vardas='Didžiosios sumos')

Suvestinių lentelių kūrimas Python

Kai naudojate Pivot lenteles, parinkčių yra tiesiog begalė. Python leidžia lengvai tvarkyti didžiulius duomenų masyvus, nesijaudinant dėl ​​duomenų neatitikimų ir sistemos vėlavimų.

Kadangi „Python“ funkcijos neapsiriboja tik duomenų sutankinimu į suvestinę, galite sujungti kelias „Excel“ darbaknyges ir lapus, atlikdami su Python susijusias funkcijas.

Naudojant Python horizonte visada yra kažkas naujo.