Pandas yra atvirojo kodo Python biblioteka, daugiausia naudojama duomenų apdorojimui ir analizei. Jis sukurtas ant NumPy bibliotekos ir teikia didelio našumo, lengvai naudojamas duomenų struktūras ir duomenų analizės įrankius, skirtus Python programavimo kalbai.
Šiame straipsnyje sužinosite, kaip atlikti 6 pagrindines operacijas naudojant Pandas.
Pandų pavyzdžių naudojimas
Šiame straipsnyje pateiktus pavyzdžius galite paleisti naudodami tokius skaičiavimo bloknotus kaip Jupyter užrašų knygelė, Google Colabir kt. Taip pat galite paleisti pavyzdžius įvesdami kodą tiesiai į Python interpretatorių interaktyviuoju režimu.
Jei norite peržiūrėti visą šiame straipsnyje naudojamą šaltinio kodą, Python Notebook failą galite pasiekti iš šio GitHub saugykla.
1. Kaip importuoti Pandas kaip pd ir atspausdinti versijos numerį
Jums reikia naudoti importuoti raktinį žodį, norėdami importuoti bet kurią Python biblioteką. Pandos paprastai importuojamos pagal pd slapyvardis. Taikydami šį metodą galite kreiptis į Pandas paketą kaip pd vietoj pandos.
importuoti pandas kaip pd
spausdinti (pd.__version__)
Išvestis:
1.2.4
2. Kaip sukurti serialą „Pandose“.
Pandas Series yra vienmatis masyvas, kuriame saugomi bet kokio tipo duomenys. Tai tarsi lentelės stulpelis. Galite sukurti seriją naudodami numpy masyvus, numpy funkcijas, sąrašus, žodynus, skaliarines reikšmes ir kt.
Eilučių reikšmės pažymėtos jų indekso numeriu. Pagal numatytuosius nustatymus pirmosios reikšmės indeksas yra 0, antrosios reikšmės indeksas 1 ir pan. Norėdami pavadinti savo etiketes, turite naudoti indeksas argumentas.
Kaip sukurti tuščią seriją
s = pd. Serija (dtype='float64')
s
Išvestis:
Serija ([], dtype: float64)
Aukščiau pateiktame pavyzdyje tuščia serija su plūdė sukuriamas duomenų tipas.
Kaip sukurti seriją naudojant „NumPy“ masyvą
importuoti pandas kaip pd
importuoti numpy kaip np
d = np.masyvas([1, 2, 3, 4, 5])
s = pd. Serija (d)
s
Išvestis:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Susijęs: NumPy operacijos pradedantiesiems
Kaip sukurti seriją naudojant sąrašą
d = [1, 2, 3, 4, 5]
s = pd. Serija (d)
s
Išvestis:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Kaip sukurti serialą su indeksu
Norėdami sukurti seriją su indeksu, turite naudoti indeksas argumentas. Indeksų skaičius turi būti lygus serijos elementų skaičiui.
d = [1, 2, 3, 4, 5]
s = pd. Serija (d, index=["vienas", "du", "trys", "keturi", "penki"])
s
Išvestis:
vienas 1
du 2
trys 3
keturi 4
penki 5
dtype: int64
Kaip sukurti seriją naudojant žodyną
Žodyno raktai tampa serijos etiketėmis.
d = {"vienas": 1,
"du": 2,
"trys": 3,
"keturi": 4,
"penki": 5}
s = pd. Serija (d)
s
Išvestis:
vienas 1
du 2
trys 3
keturi 4
penki 5
dtype: int64
Kaip sukurti seriją naudojant skaliarinę vertę
Jei norite sukurti seriją naudodami skaliarinę vertę, turite pateikti indeksas argumentas.
s = pd. Serija (1, indeksas = ["a", "b", "c", "d"])
s
Išvestis:
a 1
b 1
c 1
d 1
dtype: int64
3. Kaip sukurti duomenų rėmelį „Pandas“.
„DataFrame“ yra dvimatė duomenų struktūra, kurioje duomenys sulygiuojami eilučių ir stulpelių pavidalu. DataFrame galima sukurti naudojant žodynus, sąrašus, žodynų sąrašą, numpy masyvus ir kt. Realiame pasaulyje „DataFrames“ kuriami naudojant esamą saugyklą, pvz., CSV failus, „Excel“ failus, SQL duomenų bazes ir kt.
„DataFrame“ objektas palaiko daugybę atributų ir metodų. Jei norite sužinoti daugiau apie juos, galite peržiūrėti oficialią dokumentaciją pandos duomenų rėmelis.
Kaip sukurti tuščią duomenų rėmelį
df = pd. DataFrame()
spausdinti (df)
Išvestis:
Tuščias duomenų rėmelis
Stulpeliai: []
Indeksas: []
Kaip sukurti duomenų rėmelį naudojant sąrašą
listObj = ["MUO", "technologija", "supaprastinta"]
df = pd. DataFrame (listObj)
spausdinti (df)
Išvestis:
0
0 MUO
1 technologija
2 supaprastinta
Kaip sukurti duomenų rėmelį naudojant ndarray / sąrašų žodyną
batmanData = {'Filmo pavadinimas': ['Betmenas prasideda', 'Tamsos riteris', 'Tamsos riteris kyla'],
„Išleidimo metai“: [2005, 2008, 2012]}
df = pd. „DataFrame“ („batmanData“)
spausdinti (df)
Išvestis:
Filmo pavadinimas Išleidimo metai
0 Betmenas prasideda 2005 m
1 Tamsos riteris 2008 m
2 „Tamsos riteris prisikelia“, 2012 m
Kaip sukurti duomenų rėmelį naudojant sąrašų sąrašą
duomenys = [['Aleksas', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. „DataFrame“ (duomenys, stulpeliai = ["Vardas", "Ritinio Nr."])
spausdinti (df)
Išvestis:
Vardinis ritinys Nr.
0 Aleksas 601
1 Bobas 602
2 Katalinas 603
Kaip sukurti duomenų rėmelį naudojant žodynų sąrašą
data = [{'Vardas': 'Aleksas', 'Ritinio Nr.': 601},
{'Vardas': 'Bob', 'Ritinio Nr.': 602},
{'Vardas': 'Cataline', 'Ritinio Nr.': 603}]
df = pd. DataFrame (duomenys)
spausdinti (df)
Išvestis:
Vardinis ritinys Nr.
0 Aleksas 601
1 Bobas 602
2 Katalinas 603
Susijęs: Kaip paversti sąrašą į žodyną „Python“.
Kaip sukurti duomenų rėmelį naudojant zip() funkciją
Naudoti zip () funkcija sujungti Python sąrašus.
Vardas = [Aleksas, Bobas, Katalina]
RollNo = [601, 602, 603]
listOfTuples = sąrašas (zip (pavadinimas, sąrašo numeris))
df = pd. DataFrame (listOfTuples, columns = ['Pavadinimas', 'Ritinio Nr.'])
spausdinti (df)
Išvestis:
Vardinis ritinys Nr.
0 Aleksas 601
1 Bobas 602
2 Katalinas 603
4. Kaip skaityti CSV duomenis „Pandas“.
„Kableliais atskirtų reikšmių“ (CSV) failas yra atskirtas tekstinis failas, kuriame reikšmės atskiriamos kableliais. CSV failą galite skaityti naudodami skaityti_csv() metodas pandose. Jei norite spausdinti visą DataFrame, naudokite to_string() metodas.
Šiame ir kituose pavyzdžiuose tai CSV failą bus naudojami operacijoms atlikti.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.to_string())
Išvestis:
5. Kaip analizuoti duomenų rėmelius naudojant head(), tail() ir info() metodus
Kaip peržiūrėti duomenis naudojant head() metodą
The galva() metodas yra vienas geriausių būdų greitai apžvelgti DataFrame. Šis metodas grąžina antraštę ir nurodytą eilučių skaičių, pradedant nuo viršaus.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.head (10))
Išvestis:
Jei nenurodysite eilučių skaičiaus, bus grąžintos pirmosios 5 eilutės.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.head())
Išvestis:
Kaip peržiūrėti duomenis naudojant tail() metodą
The uodega () metodas grąžina antraštę ir nurodytą eilučių skaičių, pradedant nuo apačios.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.tail (10))
Išvestis:
Jei nenurodysite eilučių skaičiaus, bus grąžintos paskutinės 5 eilutės.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.tail())
Išvestis:
Kaip gauti informacijos apie duomenis
The informacija () metodai pateikia trumpą DataFrame santrauką, įskaitant indeksą dtype ir stulpelio dtypes, nenulines reikšmes ir atminties naudojimą.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.info())
Išvestis:
6. Kaip skaityti JSON duomenis „Pandas“.
JSON (JavaSkripta Oobjektas Notation) yra lengvas duomenų mainų formatas. JSON failą galite skaityti naudodami read_json() metodas pandose. Jei norite spausdinti visą DataFrame, naudokite to_string() metodas.
Žemiau pateiktame pavyzdyje tai JSON failą naudojamas operacijoms atlikti.
Susijęs: Kas yra JSON? Pasauliečių apžvalga
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
spausdinti (df.to_string())
Išvestis:
Atnaujinkite savo Python žinias naudodami integruotas funkcijas ir metodus
Funkcijos padeda sutrumpinti kodą ir pagerinti jo efektyvumą. Funkcijos ir metodai kaip sumažinti (), padalinti (), išvardinti (), eval (), apvalus ()ir kt. gali padaryti jūsų kodą tvirtą ir lengvai suprantamą. Visada naudinga žinoti apie integruotas funkcijas ir metodus, nes jie gali labai supaprastinti jūsų programavimo užduotis.
Python standartinėje bibliotekoje yra daug funkcijų, padedančių atlikti programavimo užduotis. Sužinokite apie naudingiausią ir sukurkite patikimesnį kodą.
Skaitykite toliau
- Programavimas
- Python
- Interneto kūrimas
- Programavimas
- Duomenų analizė

Yuvraj yra kompiuterių mokslų bakalauro studentas Delio universitete, Indijoje. Jis aistringai vertina „Full Stack“ žiniatinklio kūrimą. Kai jis nerašo, jis tyrinėja įvairių technologijų gelmes.
Prenumeruokite mūsų naujienlaiškį
Prisijunkite prie mūsų naujienlaiškio, kad gautumėte techninių patarimų, apžvalgų, nemokamų el. knygų ir išskirtinių pasiūlymų!
Spauskite čia norėdami užsiprenumeruoti