Pandas yra atvirojo kodo Python biblioteka, daugiausia naudojama duomenų apdorojimui ir analizei. Jis sukurtas ant NumPy bibliotekos ir teikia didelio našumo, lengvai naudojamas duomenų struktūras ir duomenų analizės įrankius, skirtus Python programavimo kalbai.

Šiame straipsnyje sužinosite, kaip atlikti 6 pagrindines operacijas naudojant Pandas.

Pandų pavyzdžių naudojimas

Šiame straipsnyje pateiktus pavyzdžius galite paleisti naudodami tokius skaičiavimo bloknotus kaip Jupyter užrašų knygelė, Google Colabir kt. Taip pat galite paleisti pavyzdžius įvesdami kodą tiesiai į Python interpretatorių interaktyviuoju režimu.

Jei norite peržiūrėti visą šiame straipsnyje naudojamą šaltinio kodą, Python Notebook failą galite pasiekti iš šio GitHub saugykla.

1. Kaip importuoti Pandas kaip pd ir atspausdinti versijos numerį

Jums reikia naudoti importuoti raktinį žodį, norėdami importuoti bet kurią Python biblioteką. Pandos paprastai importuojamos pagal pd slapyvardis. Taikydami šį metodą galite kreiptis į Pandas paketą kaip pd vietoj pandos.

instagram viewer
importuoti pandas kaip pd
spausdinti (pd.__version__)

Išvestis:

1.2.4

2. Kaip sukurti serialą „Pandose“.

Pandas Series yra vienmatis masyvas, kuriame saugomi bet kokio tipo duomenys. Tai tarsi lentelės stulpelis. Galite sukurti seriją naudodami numpy masyvus, numpy funkcijas, sąrašus, žodynus, skaliarines reikšmes ir kt.

Eilučių reikšmės pažymėtos jų indekso numeriu. Pagal numatytuosius nustatymus pirmosios reikšmės indeksas yra 0, antrosios reikšmės indeksas 1 ir pan. Norėdami pavadinti savo etiketes, turite naudoti indeksas argumentas.

Kaip sukurti tuščią seriją

s = pd. Serija (dtype='float64')
s

Išvestis:

Serija ([], dtype: float64)

Aukščiau pateiktame pavyzdyje tuščia serija su plūdė sukuriamas duomenų tipas.

Kaip sukurti seriją naudojant „NumPy“ masyvą

importuoti pandas kaip pd
importuoti numpy kaip np
d = np.masyvas([1, 2, 3, 4, 5])
s = pd. Serija (d)
s

Išvestis:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Susijęs: NumPy operacijos pradedantiesiems

Kaip sukurti seriją naudojant sąrašą

d = [1, 2, 3, 4, 5]
s = pd. Serija (d)
s

Išvestis:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Kaip sukurti serialą su indeksu

Norėdami sukurti seriją su indeksu, turite naudoti indeksas argumentas. Indeksų skaičius turi būti lygus serijos elementų skaičiui.

d = [1, 2, 3, 4, 5]
s = pd. Serija (d, index=["vienas", "du", "trys", "keturi", "penki"])
s

Išvestis:

vienas 1
du 2
trys 3
keturi 4
penki 5
dtype: int64

Kaip sukurti seriją naudojant žodyną

Žodyno raktai tampa serijos etiketėmis.

d = {"vienas": 1,
"du": 2,
"trys": 3,
"keturi": 4,
"penki": 5}
s = pd. Serija (d)
s

Išvestis:

vienas 1
du 2
trys 3
keturi 4
penki 5
dtype: int64

Kaip sukurti seriją naudojant skaliarinę vertę

Jei norite sukurti seriją naudodami skaliarinę vertę, turite pateikti indeksas argumentas.

s = pd. Serija (1, indeksas = ["a", "b", "c", "d"])
s

Išvestis:

a 1
b 1
c 1
d 1
dtype: int64

3. Kaip sukurti duomenų rėmelį „Pandas“.

„DataFrame“ yra dvimatė duomenų struktūra, kurioje duomenys sulygiuojami eilučių ir stulpelių pavidalu. DataFrame galima sukurti naudojant žodynus, sąrašus, žodynų sąrašą, numpy masyvus ir kt. Realiame pasaulyje „DataFrames“ kuriami naudojant esamą saugyklą, pvz., CSV failus, „Excel“ failus, SQL duomenų bazes ir kt.

„DataFrame“ objektas palaiko daugybę atributų ir metodų. Jei norite sužinoti daugiau apie juos, galite peržiūrėti oficialią dokumentaciją pandos duomenų rėmelis.

Kaip sukurti tuščią duomenų rėmelį

df = pd. DataFrame()
spausdinti (df)

Išvestis:

Tuščias duomenų rėmelis
Stulpeliai: []
Indeksas: []

Kaip sukurti duomenų rėmelį naudojant sąrašą

listObj = ["MUO", "technologija", "supaprastinta"]
df = pd. DataFrame (listObj)
spausdinti (df)

Išvestis:

 0
0 MUO
1 technologija
2 supaprastinta

Kaip sukurti duomenų rėmelį naudojant ndarray / sąrašų žodyną

batmanData = {'Filmo pavadinimas': ['Betmenas prasideda', 'Tamsos riteris', 'Tamsos riteris kyla'],
„Išleidimo metai“: [2005, 2008, 2012]}
df = pd. „DataFrame“ („batmanData“)
spausdinti (df)

Išvestis:

 Filmo pavadinimas Išleidimo metai
0 Betmenas prasideda 2005 m
1 Tamsos riteris 2008 m
2 „Tamsos riteris prisikelia“, 2012 m

Kaip sukurti duomenų rėmelį naudojant sąrašų sąrašą

duomenys = [['Aleksas', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. „DataFrame“ (duomenys, stulpeliai = ["Vardas", "Ritinio Nr."])
spausdinti (df)

Išvestis:

 Vardinis ritinys Nr.
0 Aleksas 601
1 Bobas 602
2 Katalinas 603

Kaip sukurti duomenų rėmelį naudojant žodynų sąrašą

data = [{'Vardas': 'Aleksas', 'Ritinio Nr.': 601},
{'Vardas': 'Bob', 'Ritinio Nr.': 602},
{'Vardas': 'Cataline', 'Ritinio Nr.': 603}]
df = pd. DataFrame (duomenys)
spausdinti (df)

Išvestis:

 Vardinis ritinys Nr.
0 Aleksas 601
1 Bobas 602
2 Katalinas 603

Susijęs: Kaip paversti sąrašą į žodyną „Python“.

Kaip sukurti duomenų rėmelį naudojant zip() funkciją

Naudoti zip () funkcija sujungti Python sąrašus.

Vardas = [Aleksas, Bobas, Katalina]
RollNo = [601, 602, 603]
listOfTuples = sąrašas (zip (pavadinimas, sąrašo numeris))
df = pd. DataFrame (listOfTuples, columns = ['Pavadinimas', 'Ritinio Nr.'])
spausdinti (df)

Išvestis:

 Vardinis ritinys Nr.
0 Aleksas 601
1 Bobas 602
2 Katalinas 603

4. Kaip skaityti CSV duomenis „Pandas“.

„Kableliais atskirtų reikšmių“ (CSV) failas yra atskirtas tekstinis failas, kuriame reikšmės atskiriamos kableliais. CSV failą galite skaityti naudodami skaityti_csv() metodas pandose. Jei norite spausdinti visą DataFrame, naudokite to_string() metodas.

Šiame ir kituose pavyzdžiuose tai CSV failą bus naudojami operacijoms atlikti.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.to_string())

Išvestis:

5. Kaip analizuoti duomenų rėmelius naudojant head(), tail() ir info() metodus

Kaip peržiūrėti duomenis naudojant head() metodą

The galva() metodas yra vienas geriausių būdų greitai apžvelgti DataFrame. Šis metodas grąžina antraštę ir nurodytą eilučių skaičių, pradedant nuo viršaus.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.head (10))

Išvestis:

Jei nenurodysite eilučių skaičiaus, bus grąžintos pirmosios 5 eilutės.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.head())

Išvestis:

Kaip peržiūrėti duomenis naudojant tail() metodą

The uodega () metodas grąžina antraštę ir nurodytą eilučių skaičių, pradedant nuo apačios.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.tail (10))

Išvestis:

Jei nenurodysite eilučių skaičiaus, bus grąžintos paskutinės 5 eilutės.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.tail())

Išvestis:

Kaip gauti informacijos apie duomenis

The informacija () metodai pateikia trumpą DataFrame santrauką, įskaitant indeksą dtype ir stulpelio dtypes, nenulines reikšmes ir atminties naudojimą.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
spausdinti (df.info())

Išvestis:

6. Kaip skaityti JSON duomenis „Pandas“.

JSON (JavaSkripta Oobjektas Notation) yra lengvas duomenų mainų formatas. JSON failą galite skaityti naudodami read_json() metodas pandose. Jei norite spausdinti visą DataFrame, naudokite to_string() metodas.

Žemiau pateiktame pavyzdyje tai JSON failą naudojamas operacijoms atlikti.

Susijęs: Kas yra JSON? Pasauliečių apžvalga

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
spausdinti (df.to_string())

Išvestis:

Atnaujinkite savo Python žinias naudodami integruotas funkcijas ir metodus

Funkcijos padeda sutrumpinti kodą ir pagerinti jo efektyvumą. Funkcijos ir metodai kaip sumažinti (), padalinti (), išvardinti (), eval (), apvalus ()ir kt. gali padaryti jūsų kodą tvirtą ir lengvai suprantamą. Visada naudinga žinoti apie integruotas funkcijas ir metodus, nes jie gali labai supaprastinti jūsų programavimo užduotis.

DalintisTviteryjeEl. paštas
20 Python funkcijų, kurias turėtumėte žinoti

Python standartinėje bibliotekoje yra daug funkcijų, padedančių atlikti programavimo užduotis. Sužinokite apie naudingiausią ir sukurkite patikimesnį kodą.

Skaitykite toliau

Susijusios temos
  • Programavimas
  • Python
  • Interneto kūrimas
  • Programavimas
  • Duomenų analizė
Apie autorių
Yuvraj Chandra (Paskelbta 69 straipsniai)

Yuvraj yra kompiuterių mokslų bakalauro studentas Delio universitete, Indijoje. Jis aistringai vertina „Full Stack“ žiniatinklio kūrimą. Kai jis nerašo, jis tyrinėja įvairių technologijų gelmes.

Daugiau iš Yuvraj Chandra

Prenumeruokite mūsų naujienlaiškį

Prisijunkite prie mūsų naujienlaiškio, kad gautumėte techninių patarimų, apžvalgų, nemokamų el. knygų ir išskirtinių pasiūlymų!

Spauskite čia norėdami užsiprenumeruoti