„LangChain LLM“ yra karšta miesto kalba. Gaukite apžvalgą, kas tai yra ir kaip su juo pradėti.
Pradėjus naudoti didelius kalbų modelius (LLM), natūralios kalbos apdorojimas buvo plačiai paplitęs internetas. Dėl tokių LLM kaip „ChatGPT“ ir „LangChain“ kasdien kuriamos naujos programos.
LangChain yra atvirojo kodo Python sistema, leidžianti kūrėjams kurti programas, pagrįstas dideliais kalbų modeliais. Jo programos yra pokalbių robotai, apibendrinimas, generatyvus klausinėjimas ir atsakymas bei daugelis kitų.
Šiame straipsnyje bus pristatyta įvadas į „LangChain LLM“. Jame bus aptariamos pagrindinės sąvokos, jos palyginimas su kitų kalbų modeliais ir kaip pradėti ją naudoti.
„LangChain LLM“ supratimas
Prieš paaiškindami, kaip veikia LangChain, pirmiausia turite suprasti kaip veikia dideli kalbos modeliai. Didelis kalbos modelis yra dirbtinio intelekto (AI) tipas naudoja giluminį mokymąsi mokyti mašininio mokymosi modelius naudojant didelius duomenis, kuriuos sudaro tekstiniai, skaitmeniniai ir kodiniai duomenys.
Didelis duomenų kiekis leidžia modeliui išmokti esamus šablonus ir ryšius tarp žodžių, figūrų ir simbolių. Ši funkcija leidžia modeliui atlikti daugybę užduočių, tokių kaip:
- Teksto generavimas, kalbos vertimas, kūrybinio, techninio ir akademinio turinio rašymas bei tikslus ir aktualus atsakymas į klausimus.
- Objektų aptikimas vaizduose.
- Knygų, straipsnių ir mokslinių darbų apibendrinimas.
Svarbiausias LLM apribojimas yra tai, kad modeliai yra labai bendri. Ši funkcija reiškia, kad nepaisant jų gebėjimo efektyviai atlikti keletą užduočių, kartais jie gali suteikti bendri atsakymai į klausimus arba raginimai, reikalaujantys patirties ir gilių srities žinių, o ne konkrečių atsakymai.
2022 m. pabaigoje Harrisono Chase'o sukurta „LangChain“ sistema siūlo novatorišką požiūrį į LLM. Procesas prasideda iš anksto apdorojant duomenų rinkinio tekstus, suskaidant juos į mažesnes dalis arba santraukos. Tada santraukos įterpiamos į vektorinę erdvę. Modelis gauna klausimą, ieško santraukų ir pateikia atitinkamą atsakymą.
„LangChain“ išankstinio apdorojimo metodas yra esminė savybė, kurios neišvengiama, nes LLM tampa galingesni ir reikalauja daug duomenų. Šis metodas daugiausia naudojamas kodo ir semantinės paieškos atvejais, nes jis suteikia rinkimą realiuoju laiku ir sąveiką su LLM.
LangChain LLM vs. Kiti kalbų modeliai
Šioje lyginamojoje apžvalgoje siekiama pabrėžti unikalias savybes ir galimybes, kurios išskiria „LangChain LLM“ iš kitų rinkoje esančių kalbų modelių:
- Atmintis: Kai kurie LLM turi trumpą atmintį, todėl paprastai prarandamas kontekstas, jei raginimai viršija atminties ribą. Tačiau „LangChain“ pateikia ankstesnius pokalbių raginimus ir atsakymus, išspręsdamas atminties apribojimų problemą. Pranešimų istorija leidžia vartotojui pakartoti ankstesnius pranešimus LLM, kad apibendrintų ankstesnį kontekstą.
- LLM perjungimas: Palyginti su kitomis LLM, kurios užrakina jūsų programinę įrangą naudodami vieno modelio API, „LangChain“ suteikia abstrakciją, kuri supaprastina LLM perjungimą arba kelių LLM integravimą į jūsų programą. Tai naudinga, kai norite atnaujinti savo programinės įrangos galimybes naudodami kompaktišką modelį, pvz., „Stability AI“ „StableLM“ iš OpenAI GPT-3.5.
- Integracija: Integruoti „LangChain“ į programą yra paprasta, palyginti su kitais LLM. Tai užtikrina dujotiekio darbo eigą grandines ir agentai, leidžianti greitai įtraukti LangChain į savo programą. Kalbant apie linijinius vamzdynus, grandinės yra objektai, kurie iš esmės jungia daugybę dalių. Agentai yra pažangesni, todėl galite pasirinkti, kaip komponentai turėtų sąveikauti naudojant verslo logiką. Pavyzdžiui, galbūt norėsite naudoti sąlyginę logiką, kad nustatytumėte kitą veiksmų kryptį, pagrįstą LLM rezultatais.
- Duomenų perdavimas: Dėl bendro LLM teksto pobūdžio paprastai yra sudėtinga perduoti duomenis modeliui. LangChain išsprendžia šią problemą naudodamas indeksai. Indeksai leidžia programai importuoti duomenis kintamu formatu ir saugoti juos taip, kad būtų galima pateikti juos LLM po eilutę.
- Atsakymai: LangChain teikia išvesties analizavimo įrankius, kad pateiktų atsakymus tinkamu formatu, priešingai nei kiti LLM, kurių modelio atsakymą sudaro bendras tekstas. Naudojant AI programoje, pageidautina turėti struktūrinį atsakymą, kurį galite užprogramuoti.
Darbo su LangChain LLM pradžia
Dabar sužinosite, kaip įdiegti „LangChain“ realiu naudojimo atveju, kad suprastumėte, kaip tai veikia. Prieš pradėdami kurti, turite nustatyti kūrimo aplinką.
Kūrimo aplinkos nustatymas
Pirmas, sukurti virtualią aplinką ir įdiekite toliau nurodytas priklausomybes:
- OpenAI: Norėdami integruoti GPT-3 API į savo programą.
- LangChain: Integruoti LangChain į savo programą.
Naudodami pip, paleiskite toliau pateiktą komandą, kad įdiegtumėte priklausomybes:
pipenv įdiegti langchain openai
Aukščiau pateikta komanda įdiegia paketus ir sukuria virtualią aplinką.
Importuokite įdiegtas priklausomybes
Pirma, importuokite reikiamas klases, pvz LLMCchain, OpenAI, Pokalbių grandinė, ir PromptTemplate nuo langchain paketą.
iš langchain importuoti „ConversationChain“, „OpenAI“, „PromptTemplate“, „LLMChain“.
iš langchain.atmintis importuoti ConversationBufferWindowMemory
„LangChain“ klasės apibūdina ir vykdo kalbos modelių grandines.
Pasiekite OpenAI API raktą
Tada gaukite OpenAI API raktą. Norėdami pasiekti OpenAI API raktą, turite turėti OpenAI paskyrą, tada pereikite prie OpenAI API platforma.
Prietaisų skydelyje spustelėkite profilio piktogramą. Tada spustelėkite Peržiūrėkite API raktus mygtuką.
Tada spustelėkite Sukurkite naują slaptą raktą mygtuką, kad gautumėte naują API raktą.
Įveskite prašomą API rakto pavadinimą.
Jūs gausite a slaptas raktas paraginti.
Nukopijuokite ir saugokite API raktą saugioje vietoje, kad galėtumėte naudoti ateityje.
Programos kūrimas naudojant „LangChain LLM“.
Dabar pradėsite kurti paprastą pokalbių programą taip:
# Tinkinkite LLM šabloną
šablonas = „Assistant“ yra didelis kalbos modelis, paruoštas OpenAI.{istorija}
Žmogus: {human_input}
Asistentas:
prompt = PromptTemplate (input_variables=["istorija", "žmogaus įvestis"], šablonas=šablonas)
Tada įkelsite ChatGPT grandinę naudodami API raktą, kurį išsaugojote anksčiau.
chatgpt_chain = LLMChain(
llm=OpenAI(openai_api_key=„OPENAI_API_KEY“,temperatūra=0),
prompt=prompt,
žodinis =Tiesa,
memory=ConversationBufferWindowMemory (k=2),
)
# Numatykite sakinį naudodami chatgpt grandinę
output = chatgpt_chain.predict(
human_input="What is MakeUseOf?"
)
# Rodyti modelio atsakymą
spausdinti (išvestis)
Šis kodas įkelia LLM grandinę su OpenAI API raktu ir raginimo šablonu. Tada pateikiama vartotojo įvestis ir rodoma jo išvestis.
Aukščiau yra numatoma produkcija.
Didėjanti LLM įtaka
LLM vartojimas sparčiai auga ir keičia žmonių sąveiką su žinių mašinomis. Tokios sistemos kaip „LangChain“ yra pirmaujantys, suteikdami kūrėjams sklandų ir paprastą būdą teikti LLM programoms. Generatyvūs AI modeliai, tokie kaip ChatGPT, Bard ir Hugging Face, taip pat neatsilieka tobulinant LLM programas.