Mašinų mokymasis šiandien tapo dirbtinio intelekto diskusijų centru. Tai liečia visas sritis, įskaitant inžineriją, mediciną, verslą, socialinius mokslus ir dar daugiau.

Naudojant keletą šiandien prieinamų mašininio mokymosi bibliotekų, mašininis mokymasis naudojant „Python“, „C ++“, „Java“, „Julia“ ir „R“ yra lengvesnis nei bet kada. Štai keletas populiarių mašininio mokymosi bibliotekų, nuo kurių galite pradėti, jei norite žengti į šį perspektyvų karjeros kelią.

1. Keras

Keras yra plačių „TensorFlow“ mašinų mokymosi paslaugų dalis. Tačiau tai skiriasi tuo, kad tai yra aukštesnio lygio API, siunčiama kartu su „TensorFlow“. Be to, tai labiau pritaikyta žmonėms ir parašyta naudojant „Python“. Taigi jis yra labiau įgyvendinamas, nes jame pateikiama glausta dokumentacija, kurią lengva išmokti mašininio mokymosi pradedantiesiems.

Tačiau „Keras“ siūlo platų mašininio mokymosi funkcijų spektrą, puikiai tinkantį struktūrizuotiems duomenims ir neapdorotai žiniasklaidai mokyti. Tačiau biblioteka apima teksto ir vaizdo algoritmus, skirtus mokyti ir išbandyti jūsų duomenų rinkinį.

instagram viewer

Unikalus „Keras“ bruožas yra tai, kad jis sutelkia dėmesį į biblioteką, nes jame yra viskas, ko reikia jūsų projektui. Taigi vargu ar turėsite išsišakoti, kad pasiskolintumėte komunalines paslaugas iš kitų bibliotekų. Hiperparametrų derinimas, funkcijų pasirinkimas, gausus duomenų išankstinio apdorojimo sluoksniai ir duomenų valymas yra keletas įspūdingų integruotų funkcijų.

Naudodami „Keras“ galite skaityti vaizdus ir tekstus tiesiai iš padalintų aplankų pirminiame kataloge ir gauti iš jų pažymėtą duomenų rinkinį. O jei jūsų duomenys yra dideli ir nėra jūsų kompiuterio atmintyje, „Keras“ siūlo didelio našumo duomenų rinkinio objekto parinktį. Jūs visada galite pereiti prie to.

Susijęs: Kaip atnaujinti savo „Python“ ir AI įgūdžius naudojant „Python“ mašinų mokymosi bibliotekas

Be to, ji siūlo įvairius grafinius apdorojimo įrenginius (GPU) dideliam duomenų rinkiniui apdoroti. Taigi tai leidžia vienu metu paleisti procesoriaus skaičiavimus kartu su GPU apdorojimu asinchroniškai.

2. „TensorFlow“

„Google“ pristatė 2015 m. „TensorFlow“ yra daugiau rėmas nei biblioteka. Tai atvirojo kodo biblioteka, sukurta naudojant „C ++“, ir ji veikia stebėdama duomenų srauto diagramas.

„TensorFlow“ yra labai universalus ir platus, jame yra daug kitų integruotų bibliotekų, skirtų mašininio mokymosi skaičiavimams atlikti. Iš esmės „TensorFlow“ siūlo mastelio keitimo platformą, skirtą kurti mašininio mokymosi koncepcijas, tokias kaip dirbtiniai neuroniniai tinklai (ANN), gilūs neuroniniai tinklai ir gilus mokymasis.

Susijęs: Kas yra „TensorFlow Lite“ ir kaip tai yra gilaus mokymosi sistema?

Be „Python“, be kita ko, „Tensorflow“ taip pat palaiko „Java“, „C ++“, „Julia“, „Rust“, „Ruby“ ir „JavaScript“. Naudojant „TensorFlow“ su kitomis nei „Python“ programavimo kalbomis, galima lengvai integruoti projektus, tačiau naudojant jų branduolius su „Python“ yra lengviau, nes jis visiškai palaiko „TensorFlow“ diegimą.

Be to, kūrimo kanalai kitomis kalbomis gali sukelti API versijų suderinamumo problemų, jei vėliau reikės pakeisti versijas. Nors „TensorFlow“ dokumentai yra išsamūs, skirtingai nei „Keras“, jie gali būti pernelyg įvairūs pradedantiesiems, kad jie suprastų. Tai reiškia, kad ji turi tvirtą bendruomenės palaikymą, taip pat rasite daug atvirojo kodo „TensorFlow“ pavyzdžiai ten.

„TensorFlow“ pranašumas prieš „Keras“ yra tas, kad galite naudoti „TensorFlow“ tiesiogiai be „Keras“. Žinoma, negalite to paties pasakyti apie „Keras“, nes tai yra šakota „TensorFlow“ klasė.

3. „Mlib Spark“

Štai kažkas labai patogaus iš „Apache Spark“. Išleistas ir padarytas atviro kodo 2010 m. „Mlib Spark“ naudoja iteracinius skaičiavimus mašinų mokymosi algoritmams vykdyti. Dėl savo pasikartojančio pobūdžio „Mlib“ gali pasinaudoti „Hadoop“ ar vietiniais duomenų šaltiniais ir darbo eiga. Be to, jis gali per trumpą laiką paleisti sudėtingą logiką.

Galų gale, tai vis dar yra viena greičiausių mašinų mokymosi bibliotekų. Jis naudoja platų mašinų mokymosi algoritmų spektrą, įskaitant regresijos, grupavimo, klasifikavimo ir rekomendacijų modelius. Jis taip pat išsiskiria išankstiniu duomenų apdorojimu ir modelių gavimu.

Susijęs: Kas yra mašinų mokymosi algoritmai? Štai kaip jie veikia

Biblioteka yra dinamiška ir siūlo tvirtą API, prijungtą prie „Scala“, „Python“, „R“ ir „Java“. „Mlib Spark“ yra paties „Spark“ įdėklas, todėl jis atnaujinamas su kiekvienu „Spark“ leidimu.

„Mlib Spark“ turi aiškinamąją dokumentaciją, todėl pradedantysis gali lengvai ją pasiimti. Tačiau nedidelis trūkumas yra tai, kad jis integruojamas tik su keliomis programavimo kalbomis, todėl tai gali kilti problema, jei nesate susipažinę su kalbomis, kurias šiuo metu palaiko.

4. ml pakuotė

ml pakuotė buvo išleistas 2008 m. ir sukurtas naudojant „C ++“, naudojant linijinės algebros biblioteką „Armadillo“. Kaip ir „Mlib Spark“, jis leidžia jums pritaikyti daugumą turimų mašininio mokymosi algoritmų ir koncepcijų tiesiai į savo duomenų rinkinį, naudojant glaustas ir įskaitomas kodo eilutes.

Be to, kad jis yra prieinamas programavimo kalbomis, tokiomis kaip „Python“, „C ++“, „Go“ ir „Julia“, jis taip pat palaiko CLI vykdymą, kuris leidžia paleisti kodą ir gauti momentinius atsakymus. Nors „mlpack“ palaiko susiejimą su šiomis kitomis kalbomis, jo paleidimas dideliuose duomenų rinkiniuose, kuriems reikia sudėtingo skaičiavimo, gali būti ne puiki idėja naudojant jį su kita programavimo kalba. Taigi, naudojant „mlpack“ dažnai kyla problemų dėl mastelio keitimo kitomis kalbomis, išskyrus C ++.

Jei esate pradedantysis mokantis mašinų ir žinote apie C ++, vis tiek galite tai išbandyti. Dokumentuose yra lengvai sekamų vadovų ir pavyzdžių, kuriuos galima rasti įvairioms programavimo kalboms. Kadangi „mlpack“ skaičiuoja pagal C ++ sąvokas, jis naudoja žemo lygio kodą, kad greitai atliktų sudėtingas ir paprastas mašininio mokymosi užduotis.

5. Pytorchas

Sukurtas „Facebook“ Pytorchas ir oficialiai išleido 2016 m. „Pytorch“ yra gerai žinoma dėl savo plataus naudojimo kompiuterinėje vizijoje, gilaus mokymosi ir natūralios kalbos apdorojimo. Ji yra atviro kodo biblioteka, sukurta naudojant „Torch“ sistemą.

Kaip ir „Keras“ bei „Tensorflow“, „Pytorch“ palaiko duomenų rinkinių procesoriaus apdorojimą. Ir jei jūsų duomenų rinkinys yra didelis, jame yra GPU procesorius, skirtas jūsų skaičiavimams atlikti. Be to, jis pagrįstas tenzoriumi.

Be „Python“, biblioteka palaiko įrišimą tiek „C ++“, tiek „Java“. „Pytorch“, be kitų paslaugų, siūlo papildomas bibliotekas, įskaitant žibintuvėlis, žibintuvėlis, torchaudio, ir „TorchServe“.

Šios bibliotekos yra „Pytorch“ mašininio mokymosi funkcijų dalis, su kuriomis susidursite rašydami „Pytorch“ modelius. Turėdami išsamią ir išsamią mokymo medžiaga pagrįstą dokumentaciją, „Pytorch“ nesunku suprasti, jei esate susipažinęs su mašininio mokymosi koncepcijomis.

„Pytorch“ taip pat leidžia duomenų rinkinius paversti mašinoms tinkamu formatu. Taigi tai taip pat puiki biblioteka išankstiniam duomenų apdorojimui. Naudojant „Pytorch“, funkcijų išskyrimas, duomenų valymas, duomenų skaidymas ir hiperparametrų derinimas visada yra įmanomi.

6. „Scikit-Learn“

Įspūdingai sukurta naudojant „Python“, scikit-mokytis, taip pat vadinama sklearn, buvo viešai išleistas 2010 m. Tačiau biblioteka siūlo platų mašininio mokymosi programų spektrą, įskaitant siūlomų ir neužtikrintų duomenų rinkinių modeliavimą.

„Scikit-learn“ siūlo pažįstamus prižiūrimus algoritmus, įskaitant linijinius ir logistikos regresijos modelius, paramos vektorių mašina (SVM), naivūs įlankos, sprendimų medžiai, artimiausi kaimynai, be kita ko, tiesiai iš dėžė. Tai taip pat yra gausus neprižiūrimų mokymosi metodų, tokių kaip grupavimas, Gauso modelis, kartu su neuronų tinklo modeliais, šaltinis.

Iš esmės „scikit-learn“ palaiko prižiūrimus ir neprižiūrimus modelius. Tai puikus atspirties taškas, jei vis dar nesate susipažinę su „Python“ ar apskritai mašininiu mokymusi, nes jis visiškai pagrįstas „Python“. Ir jei jūs tik pradedate nuo mašininio mokymosi ar duomenų mokslo, galbūt norėsite pradėti nuo prižiūrimų „scikit-learning“ mokymosi funkcijų.

Apskritai tai labiau tinka pradedantiesiems nei kitos sąraše esančios bibliotekos. Skirtingai nuo kitų anksčiau paminėtų bibliotekų, „scikit-learn“ labai priklauso nuo „Numpy“ ir „Scipy“, kad galėtų atlikti didelio našumo matematinius skaičiavimus. Jis taip pat naudoja „Matplotlib“, kad pateiktų įtikinamas pasakojančias vizualizacijas.

7. Theano

Jei ieškote bibliotekos, kuri padės suskaidyti sudėtingas problemas į lanksčius algoritmus, tada Theano gali būti tai, ko nori. 2007 m. Yoshua Bengio, Monrealyje, Kanadoje, sukurta „Theano“ yra galinga biblioteka, skirta mažiems ir didelio našumo skaičiavimams vykdyti.

Kaip ir „Scikit-Learn“, „Theano“ skaičiavimams atlikti priklauso nuo „Numpy“. Biblioteka palaiko GPU pagrįstus skaičiavimus, be to, ji generuoja žemo lygio C kodą. Tai pagreitina matematinius „Theano“ vertinimus, kad ir kokie jie būtų. Be to, jo gilaus mokymosi modeliai veikia su tenoriais.

Naudodami „Theano“ savo duomenų rinkinį galite paversti skaitomais plūduriuojančiais, dvejetainiais ar sveikais skaičiais, nepriklausomai nuo jo pradinio duomenų tipo. Vis dėlto galbūt nesulauksite pakankamai bendruomenės palaikymo. Taip yra todėl, kad „Theano“ nėra tokia populiari kaip kitos anksčiau minėtos bibliotekos. Tai nepadaro to mažiau draugiško pradedantiesiems.

Dokumentų vadovėlį lengva suprasti. Dėl galimybės supaprastinti sudėtingus masyvus ir optimizuoti begalinius skaičiavimus puikiai tinka kurti keičiamo dydžio mašinų mokymosi modelius.

Kokią biblioteką turėtumėte naudoti kitam mašinų mokymosi projektui?

Nors paminėjome keletą plačiausiai naudojamų mašininio mokymosi bibliotekų, pateikiame geriausias gali būti sunkus, nes jie visi yra labai panašūs, tik turi keletą skirtumų funkcijos.

Žinoma, pradedant nuo labiau pradedantiesiems pritaikytos bibliotekos, tokios kaip „Scikit-Learn“ ar „Keras“, naudinga, jei tik įsiveržiate į lauką. Be to, tikslingai pasirinkę biblioteką projektui, galėsite susiaurinti savo plėtros proceso sudėtingumą. Tačiau tai yra naudinga susipažinti su mašinų mokymosi pagrindais per kursus ir vadovėlius.

Dalintis„Tweet“Paštu
Kas yra mašinų mokymosi algoritmai? Štai kaip jie veikia

Mašinų mokymosi algoritmai yra skirti palengvinti gyvenimą ir patobulinti sistemas, tačiau jie gali suklysti ir sukelti blogų pasekmių.

Skaityti toliau

Susijusios temos
  • Programavimas
  • Mašinų mokymasis
  • Programavimas
Apie autorių
Idowu Omisola (Paskelbti 91 straipsniai)

Idowu aistringai domisi visomis išmaniosiomis technologijomis ir produktyvumu. Laisvalaikiu jis žaidžia koduodamasis ir nuobodžiai persijungia į šachmatų lentą, tačiau taip pat mėgsta retkarčiais atitrūkti nuo rutinos. Jo aistra parodyti žmonėms kelią aplink šiuolaikines technologijas skatina jį daugiau rašyti.

Daugiau iš Idowu Omisola

Prenumeruokite mūsų naujienlaiškį

Prisijunkite prie mūsų naujienlaiškio, kad gautumėte techninių patarimų, apžvalgų, nemokamų el. Knygų ir išskirtinių pasiūlymų!

Norėdami užsiprenumeruoti, spustelėkite čia