Norite pateikti „ChatGPT“ tinkintus duomenis? Štai žingsnis po žingsnio, kaip tai padaryti!

Teikdamas GPT technologiją galingame ir lengvai naudojamame pokalbių robote, „ChatGPT“ tapo populiariausiu pasaulyje AI įrankiu. Daugelis žmonių naudoja „ChatGPT“, kad palaikytų patrauklius pokalbius, atsakytų į užklausas, siūlytų kūrybingus pasiūlymus ir padėtų koduoti bei rašyti. Tačiau „ChatGPT“ yra apribotas, nes negalite saugoti savo duomenų ilgalaikiam asmeniniam naudojimui ir 2021 m. rugsėjo mėn.

Kaip sprendimą galime naudoti OpenAI API ir „LangChain“, kad pateiktume „ChatGPT“ tinkintus duomenis ir atnaujintą informaciją po 2021 m., kad sukurtume tinkintą „ChatGPT“ egzempliorių.

Kodėl reikia teikti „ChatGPT“ tinkintus duomenis?

„ChatGPT“ tiekimas tinkintais duomenimis ir atnaujintos informacijos pateikimas pasibaigus žinioms, suteikia keletą pranašumų, palyginti su „ChatGPT“ naudojimu įprastai. Štai keletas iš jų:

  • Suasmenintos sąveikos: Pateikdami „ChatGPT“ tinkintus duomenis, vartotojai gali sukurti labiau pritaikytą patirtį. Modelis gali būti apmokytas naudojant konkrečius duomenų rinkinius, susijusius su atskiriems vartotojams ar organizacijoms, todėl atsakymai bus pritaikyti pagal jų unikalius poreikius ir pageidavimus.
    instagram viewer
  • Specializacija su domenu: Pasirinktinis duomenų integravimas leidžia ChatGPT specializuotis tam tikrose srityse ar pramonės šakose. Jis gali būti mokomas atsižvelgiant į konkrečios pramonės šakos žinias, terminiją ir tendencijas, kad būtų galima gauti tikslesnius ir įžvalgesnius atsakymus tose konkrečiose srityse.
  • Dabartinė ir tiksli informacija: Prieiga prie atnaujintos informacijos užtikrina, kad „ChatGPT“ neatsiliks nuo naujausių pokyčių ir žinių. Jis gali pateikti tikslius atsakymus, pagrįstus naujausiais įvykiais, naujienomis ar tyrimais, todėl yra patikimesnis informacijos šaltinis.

Dabar, kai suprantate, kaip svarbu teikti tinkintus duomenis „ChatGPT“, pateikiame nuoseklią informaciją, kaip tai padaryti vietiniame kompiuteryje.

1 veiksmas: įdiekite ir atsisiųskite programinę įrangą bei iš anksto sukurtą scenarijų

Atminkite, kad šios instrukcijos yra skirtos „Windows 10“ arba „Windows 11“ įrenginiui.

Norėdami pateikti pasirinktinius duomenis „ChatGPT“, turėsite įdiegti ir atsisiųsti naujausią „Python3“, „Git“, „Microsoft C++“ ir „ChatGPT“ gavimo scenarijų iš „GitHub“. Jei jūsų kompiuteryje jau įdiegta tam tikra programinė įranga, įsitikinkite, kad jos atnaujinta naujausia versija, kad išvengtumėte trikdžių proceso metu.

Pradėkite diegdami:

  • Parsisiųsti:Python3 (Laisvas)
  • Parsisiųsti:Git (Laisvas)
  • Parsisiųsti:Microsoft Visual Build Tools (Laisvas)

Python3 ir Microsoft C++ diegimo pastabos

Diegdami Python3 įsitikinkite, kad pažymėjote Pridėkite python.exe prie PATH parinktį prieš spustelėdami Įdiegti dabar. Tai svarbu, nes leidžia pasiekti Python bet kuriame kompiuterio kataloge.

Diegdami Microsoft C++, norėsite įdiegti „Microsoft Visual Studio“ kūrimo įrankiai Pirmas. Įdiegę galite pažymėti Darbalaukio kūrimas naudojant C++ parinktį ir spustelėkite Diegti su visais pasirenkamais įrankiais automatiškai pažymėti dešinėje šoninėje juostoje.

Dabar, kai įdiegėte naujausias „Python3“, „Git“ ir „Microsoft C++“ versijas, galite atsisiųsti „Python“ scenarijų, kad galėtumėte lengvai pateikti užklausą dėl pasirinktinių vietinių duomenų.

Parsisiųsti: „ChatGPT“ paieškos scenarijus (Laisvas)

Norėdami atsisiųsti scenarijų, spustelėkite Kodas, tada pasirinkite Parsisiųsti ZIP. Tai turėtų atsisiųsti Python scenarijų į numatytąjį arba pasirinktą katalogą.

Atsisiuntę dabar galime nustatyti vietinę aplinką.

2 veiksmas: nustatykite vietinę aplinką

Norėdami nustatyti aplinką, atsisiųstame aplanke chatgpt-retrieval-main turėsite atidaryti terminalą. Norėdami tai padaryti, atidarykite chatgpt-retrieval-main aplanką, dešiniuoju pelės mygtuku spustelėkite ir pasirinkite Atidaryti terminale.

Kai terminalas bus atidarytas, nukopijuokite ir įklijuokite šią komandą:

pip įdiegti langchain openai chromadb tiktoken unstructured

Ši komanda naudoja Python paketų tvarkyklę sukurti ir valdyti Python virtualią aplinką reikia.

Sukūrę virtualią aplinką, turime pateikti OpenAI API raktą, kad galėtume pasiekti jų paslaugas. Pirmiausia turėsime sugeneruoti API raktą iš OpenAI API raktų svetainė paspaudę ant Sukurkite naują slaptą raktą, pridedant rakto pavadinimą, tada paspausdami Mygtukas Sukurti slaptą raktą.

Jums bus suteikta simbolių eilutė. Tai yra jūsų OpenAI API raktas. Nukopijuokite jį spustelėdami kopijavimo piktogramą API rakto šone. Atminkite, kad šis API raktas turėtų būti laikomas paslaptyje. Nesidalinkite ja su kitais, nebent tikrai ketinate, kad jie naudotųsi su jumis.

Nukopijavę grįžkite į chatgpt-retrieval-pagrindinį aplanką ir atidarykite konstantas naudodami Užrašų knygelė. Dabar pakeiskite rezervuotąją vietą savo API raktu. Nepamirškite išsaugoti failo!

Dabar, kai sėkmingai nustatėte virtualią aplinką ir įtraukėte OpenAI API raktą kaip aplinkos kintamąjį. Dabar galite pateikti savo tinkintus duomenis „ChatGPT“.

3 veiksmas: pridėkite pasirinktinių duomenų

Norėdami pridėti pasirinktinių duomenų, įdėkite visus tinkintus teksto duomenis į duomenis aplanką chatgpt-retrieval-main. Teksto duomenų formatas gali būti PDF, TXT arba DOC.

Kaip matote iš aukščiau esančios ekrano kopijos, pridėjau tekstinį failą su sudarytu asmeniniu grafiku, straipsniu, apie kurį rašiau AMD instinktų greitintuvaiir PDF dokumentą.

4 veiksmas: „ChatGPT“ užklausa per terminalą

Python scenarijus leidžia mums pateikti duomenų užklausą iš tinkintų duomenų, kuriuos įtraukėme į duomenų aplanką ir internetą. Kitaip tariant, turėsite prieigą prie įprastos „ChatGPT“ sistemos ir visų duomenų, saugomų vietoje duomenų aplanke.

Norėdami naudoti scenarijų, paleiskite python chatgpt.py scenarijų ir pridėkite savo klausimą arba užklausą kaip argumentą.

pitonas chatgpt.py "JŪSŲ KLAUSIMAS"

Klausimus būtinai surašykite kabutėse.

Norėdami patikrinti, ar sėkmingai pateikėme ChatGPT savo duomenis, užduosiu asmeninį klausimą dėl Asmeninis Sched.txt failą.

Pavyko! Tai reiškia, kad ChatGPT galėjo perskaityti anksčiau pateiktą asmeninį Sched.txt. Dabar pažiūrėkime, ar sėkmingai pateikėme „ChatGPT“ informaciją, kurios jis nežino dėl savo žinių ribinės datos.

Kaip matote, jis teisingai apibūdino „AMD Instinct MI250x“, kuris buvo išleistas po „ChatGPT -3“ žinių pabaigos datos.

„Custom ChatGPT“ apribojimai

Nors GPT-3.5 padavimas su pasirinktiniais duomenimis atveria daugiau būdų taikyti ir naudoti LLM, yra keletas trūkumų ir apribojimų.

Pirmiausia turite patys pateikti visus duomenis. Vis tiek galite pasiekti visas GPT-3.5 žinias iki jų žinių pabaigos datos; tačiau turite pateikti visus papildomus duomenis. Tai reiškia, kad jei norite, kad jūsų vietinis modelis būtų susipažinęs su tam tikra tema internete, kurios GPT-3.5 dar nežino, turėsite eiti į internetą ir patys iškrapštyti duomenis ir išsaugoti juos kaip tekstą duomenų aplanke chatgpt-retrieval-main.

Kita problema yra ta, kad taip užklausus ChatGPT užtrunka daugiau laiko, nei užklausus tiesiogiai ChatGPT.

Galiausiai vienintelis šiuo metu prieinamas modelis yra GPT-3.5 Turbo. Taigi net jei turite prieigą prie GPT-4, negalėsite jo naudoti tinkintam ChatGPT egzemplioriui maitinti.

Pasirinktinis pokalbių gpt yra nuostabus, bet ribotas

Pasirinktinių duomenų teikimas „ChatGPT“ yra galingas būdas išnaudoti daugiau modelio galimybių. Naudodami šį metodą galite pateikti modelį bet kokiais norimais tekstiniais duomenimis ir raginti juos kaip įprastą ChatGPT, nors ir su tam tikrais apribojimais. Tačiau ateityje tai pasikeis, nes bus lengviau integruoti mūsų duomenis su LLM ir pasiekti naujausią GPT-4 modelį.