Nulinis mokymasis išsprendžia kelias mašininio mokymosi problemas, bet kaip tai veikia ir kaip jis pagerina AI?
Key Takeaways
- Apibendrinimas yra būtinas giliam mokymuisi, siekiant užtikrinti tikslias prognozes naudojant naujus duomenis. Nulinis mokymasis padeda tai pasiekti, nes leidžia AI naudoti turimas žinias, kad būtų galima tiksliai prognozuoti naujas ar nematytas klases be pažymėtų duomenų.
- Nulinis mokymasis imituoja tai, kaip žmonės mokosi ir apdoroja duomenis. Pateikdamas papildomos semantinės informacijos, iš anksto parengtas modelis gali tiksliai identifikuoti naujas klases, kaip ir žmogus gali išmokti atpažinti tuščiavidurę gitarą, suprasdamas jos savybes.
- Nulinis mokymasis pagerina AI, nes pagerina apibendrinimą, mastelio keitimą, sumažina perteklinį pritaikymą ir yra ekonomiškas. Tai leidžia modelius apmokyti naudojant didesnius duomenų rinkinius, įgyti daugiau žinių perkeliant mokymąsi, geriau suprasti kontekstą ir sumažinti didelių žymėtų duomenų poreikį. Tobulėjant dirbtiniam intelektui, mokymasis be pakopų taps dar svarbesnis sprendžiant sudėtingus įvairių sričių iššūkius.
Vienas didžiausių giluminio mokymosi tikslų – ugdyti modelius, įgijusius apibendrintų žinių. Apibendrinimas yra būtinas, nes jis užtikrina, kad modelis išmoko prasmingus modelius ir gali tiksliai prognozuoti arba priimti sprendimus, kai susiduria su naujais ar nematomais duomenimis. Tokiems modeliams mokyti dažnai reikia daug pažymėtų duomenų. Tačiau tokie duomenys gali būti brangūs, daug darbo reikalaujantys ir kartais neįmanomi.
Norint užpildyti šią spragą, įdiegtas nulinis mokymasis, leidžiantis dirbtiniam intelektui panaudoti turimas žinias, kad padarytų gana tikslias prognozes, nepaisant pažymėtų duomenų trūkumo.
Kas yra nulinis mokymasis?
Nulinis mokymasis yra specifinis perkėlimo mokymosi technikos tipas. Jame pagrindinis dėmesys skiriamas iš anksto parengto modelio naudojimui, siekiant nustatyti naujas ar dar nematytas klases, tiesiog pateikiant papildomą informaciją, apibūdinančią naujos klasės duomenis.
Naudodamas bendras modelio žinias apie tam tikras temas ir suteikdamas jam papildomos semantikos, ko ieškoti, jis turėtų galėti gana tiksliai nustatyti, kokį dalyką jam pavesta identifikuoti.
Tarkime, reikia identifikuoti zebrą. Tačiau mes neturime modelio, kuris galėtų identifikuoti tokius gyvūnus. Taigi, gauname jau egzistuojantį modelį, išmokytą atpažinti arklius ir pasakyti modeliui, kad arkliai su juodomis ir baltomis juostelėmis yra zebrai. Kai pradėsime daryti išvadą apie modelį pateikdami zebrų ir arklių vaizdus, yra didelė tikimybė, kad modelis teisingai identifikuos kiekvieną gyvūną.
Kaip ir daugelis gilaus mokymosi metodų, „nulinis mokymasis“ imituoja tai, kaip žmonės mokosi ir apdoroja duomenis. Žinoma, kad žmonės yra natūralūs besimokantieji. Jei jums buvo pavesta surasti tuščiavidurę gitarą muzikos parduotuvėje, jums gali kilti problemų ieškant jos. Bet kai pasakysiu, kad tuščiaviduris korpusas iš esmės yra gitara, kurios vienoje arba abiejose pusėse yra f formos skylė, tikriausiai iš karto ją rasite.
Realiam pavyzdžiui naudokite nulinio kadro klasifikavimo programą pagal atviro kodo LLM prieglobos svetainė Hugging Face naudojant Clip-vit-large modelį.
Šioje nuotraukoje pavaizduotas duonos vaizdas bakalėjos krepšyje, pritvirtintame ant aukštos kėdės. Kadangi modelis buvo apmokytas naudoti didelį vaizdų duomenų rinkinį, modelis greičiausiai gali identifikuoti kiekvieną nuotraukoje esantį elementą, pvz., duoną, bakalėjos prekes, kėdes ir saugos diržus.
Dabar norime, kad modelis klasifikuotų vaizdą naudodamas anksčiau nematytas klases. Šiuo atveju naujos arba nematytos pamokos būtų „Atpalaiduota duona“, „Saugi duona“, „Sėdi duona“, „Maisto prekių vairavimas“ ir „Saugūs maisto produktai“.
Atminkite, kad mes sąmoningai panaudojome neįprastas ir neregėtas klases ir vaizdus, kad parodytume vaizdo klasifikavimo be kadrų efektyvumą.
Nustačius modelį, jis galėjo su maždaug 80 % tikrumu klasifikuoti, kad tinkamiausia klasifikacija vaizdas buvo "Saugi duona". Taip yra todėl, kad modelis mano, kad aukšta kėdė yra labiau saugumas nei sėdėjimas, atsipalaidavimas ar vairuoja.
Nuostabu! Aš asmeniškai sutikčiau su modelio produkcija. Bet kaip tiksliai modelis sugalvojo tokią produkciją? Štai bendras supratimas apie tai, kaip veikia „nulinis mokymasis“.
Kaip veikia „Zero-Shot“ mokymasis
Nulinis mokymasis gali padėti iš anksto parengtam modeliui nustatyti naujas klases, nepateikiant pažymėtų duomenų. Paprasčiausia forma nulinis mokymasis vyksta trimis etapais:
1. Paruošimas
Nulinis mokymasis prasideda ruošiant trijų tipų duomenis
- Matyta klasė: Duomenys, naudojami mokant iš anksto parengtą modelį. Modelis jau pateikia matytas klases. Geriausi nulinio mokymosi modeliai yra modeliai, mokomi klasėse, glaudžiai susijusiose su nauja klase, kurią norite identifikuoti.
- Nematyta / romano klasė: Duomenys, kurie niekada nebuvo naudojami modelio mokymo metu. Turėsite patys kuruoti šiuos duomenis, nes negalite jų gauti iš modelio.
- Semantiniai / pagalbiniai duomenys: Papildomi duomenų bitai, kurie gali padėti modeliui nustatyti naują klasę. Tai gali būti žodžiai, frazės, žodžių įterpimai arba klasių pavadinimai.
2. Semantinis žemėlapių sudarymas
Kitas žingsnis – nustatyti nematomos klasės ypatybes. Tai atliekama sukuriant žodžių įterpimus ir semantinį žemėlapį, susiejantį nematomos klasės atributus ar charakteristikas su pateiktais pagalbiniais duomenimis. AI perdavimo mokymasis žymiai pagreitina procesą, nes daugelis atributų, susijusių su nematyta klase, jau buvo susieti.
3. Išvadų darymas
Išvadų darymas yra modelio naudojimas prognozėms ar išvestims generuoti. Klasifikuojant vaizdus pagal nulinį kadrą, žodžių įterpimai generuojami tam tikroje vaizdo įvestyje, tada nubraižomi ir lyginami su pagalbiniais duomenimis. Apibrėžtumo lygis priklausys nuo įvesties ir pateiktų pagalbinių duomenų panašumo.
Kaip „Zero-Shot“ mokymasis pagerina AI
Nulinis mokymasis pagerina AI modelius spręsdamas keletą mašininio mokymosi iššūkių, įskaitant:
- Patobulintas apibendrinimas: Sumažinus priklausomybę nuo pažymėtų duomenų, modeliai gali būti mokomi didesniuose duomenų rinkiniuose, pagerinamas apibendrinimas ir modelis tampa tvirtesnis ir patikimesnis. Modeliams vis labiau patyrus ir apibendrinant, modeliams netgi gali būti įmanoma išmokti sveiko proto o ne įprastas informacijos analizės būdas.
- Mastelio keitimas: Modeliai gali būti nuolat mokomi ir įgyti daugiau žinių mokantis perkėlimo. Įmonės ir nepriklausomi tyrėjai gali nuolat tobulinti savo modelius, kad ateityje būtų geresni.
- Sumažėjusi permontavimo tikimybė: Pernelyg pritaikymas gali nutikti dėl to, kad modelis mokomas naudojant nedidelį duomenų rinkinį, kuriame nėra pakankamai įvairovės, kad būtų galima pateikti visas įmanomas įvestis. Modelio lavinimas per nulinį mokymąsi sumažina tikimybę persirengti, nes modelis mokomas taip, kad jis geriau suprastų dalykus.
- Taupus: Norint pateikti didelį kiekį pažymėtų duomenų, gali prireikti laiko ir išteklių. Naudojant nulinio perdavimo mokymąsi, parengti tvirtą modelį galima naudojant daug mažiau laiko ir pažymėtų duomenų.
Tobulėjant dirbtiniam intelektui, tokios technikos kaip mokymasis be kadrų taps dar svarbesnės.
Nulinio mokymosi ateitis
Nulinis mokymasis tapo esmine mašininio mokymosi dalimi. Tai leidžia modeliams atpažinti ir klasifikuoti naujas klases be aiškaus mokymo. Nuolat tobulėjant modelių architektūroms, atributais pagrįstiems požiūriams ir multimodalinei integracijai, mokymasis gali labai padeda modelius labiau pritaikyti sprendžiant sudėtingus robotikos, sveikatos priežiūros ir kompiuterių iššūkius regėjimas.