„OpenAI“ suteikė „ChatGPT“ galimybę kalbėti sintetiniu balsu ir netrukus ji pasirodys jūsų išmaniajame telefone.

„ChatGPT“ turėtų tapti interaktyvia generuojančia AI patirtimi. „OpenAI“ atskleidė, kad pasaulyje pirmaujantis AI pokalbių robotas galės kalbėti ir atsakyti į vartotojų užklausas, naudodamas sintezuotą, greičiausiai dirbtinio intelekto sukurtą balsą.

Kartu su naujai atrastu balsu „ChatGPT“ taip pat galės reaguoti ir aptarti konkrečius vaizdus, ​​įkeltus į jį arba užfiksuotus naudojant „ChatGPT Android“ arba „iOS“ programą. Vaizdo atpažinimo funkcija skamba panašiai kaip „Google Lens“ ir kitos programos, kurios naudoja neuroninius tinklus, kad tiksliai aptiktų duomenis ir informaciją.

OpenAI suteikia ChatGPT balsą

2023 m. rugsėjo 25 d. „ChatGPT“ kūrėjas Atskleidė OpenAI tai suteiktų balsą savo pasaulyje pirmaujančiam generatyviniam AI pokalbių robotui. „ChatGPT“ vartotojai gali kalbėti tiesiogiai su pokalbių robotu ir paprašyti, kad jis atsilieptų, todėl „ChatGPT“ pirmą kartą gali tiesiogiai kalbėtis balsu.

instagram viewer

OpenAI pavyzdiniame klipe rodoma moteris, kuri prašo ChatGPT sukurti unikalią istoriją prieš miegą, į kurią ChatGPT tinkamai atsako moterišku sintezuotu balsu.

Pagal Laidinis, naujasis teksto į kalbą modelis buvo sukurtas įmonės viduje. Jis gali generuoti „žmogišką“ garsą iš teksto ir kelių sekundžių kalbos pavyzdžio (naudojant OpenAI Whisper modelį) ir kalbėti įvairiais tonais bei stiliais. Galite rasti daugybę balso pavyzdžių OpenAI tinklaraštis.

Kai kurios įmonės jau taiko naują OpenAI balso modelį. Pavyzdžiui, „Spotify“ naudoja „OpenAI“ teksto į kalbą modelį, kad išverstų podcast'us į skirtingas kalbas, derindama „ChatGPT“ kalbos vertimo įgūdžius su naujais kalbėjimo gebėjimais.

Naujasis „ChatGPT“ teksto į kalbą modelis pasiekiamas tik „Plus“ ir „Enterprise“ prenumeratoriams, naudojantiems oficialią „Android“ ir „iOS“ programoms ir turėtų būti išleista per artimiausias dvi savaites (nuo rugsėjo 25 d. 2023). Be to, naujoji balso funkcija iš pradžių apsiriboja anglų kalba, nors tikėtume, kad tai greitai pasikeis.

„ChatGPT“ gali atpažinti ir analizuoti vaizdus ir nuotraukas

Antroji „OpenAI“ „ChatGPT“ naujinimo dalis – galimybė analizuoti ir kalbėtis į įrankį įkeltus vaizdus. Vaizdo vaizdų analizės parinktis buvo pateikta GPT-4 atnaujinimo vaizdo įrašuose, tačiau nuo to laiko apie tai nebuvo daug diskutuojama (Šalia „ChatGPT“ kodo vertėjo).

Dabar „ChatGPT“ įgyja panašias funkcijas kaip „Google Lens“. Galite įkelti vaizdą į „ChatGPT“ arba nufotografuoti naudodami savo išmaniojo telefono kamerą „ChatGPT“ programėlėje, ir ji detaliai pateiks vaizdą, prireikus pridėdama daugiau konteksto.

Pavadinus jį „panašiu į Google Lens“, tai iš tikrųjų yra neteisinga. Dėl galimybės kalbėtis pirmyn ir atgal apie vaizdą, kad gautumėte daugiau informacijos ir konteksto, jis ypač naudingas įvairiems nustatymams. Tačiau svarbu atkreipti dėmesį į smulkųjį šriftą, nes OpenAI aiškiai parodo, kad dėl privatumo ir tikslumo ji apribojo ChatGPT „galimybę analizuoti ir daryti tiesioginius pareiškimus apie žmones“. Vis dėlto, ar „OpenAI“ varomas įrankis „Kas tai“ gali būti kuriamas ateityje? (Tikėkimės, kad ne!)

Kaip ir naujasis teksto į kalbą modelis, „OpenAI“ per ateinančias dvi savaites pristatys vaizdo atpažinimo funkciją, nors ji bus pasiekiama visose platformose, ne tik „ChatGPT“ programoje.

Privatumo, saugumo ir kitos problemos

Balso valdomo „ChatGPT“ pasekmės yra akivaizdžios. Žinoma, tai įdomu. Tačiau galimybė sukurti unikaliai sintezuotą balsą naudojant tik trumpą fragmentą kaip pavyzdį turi didelių privatumo ir saugumo problemų. Piktybiškų veikėjų galimybė išnaudoti šiuos įrankius yra didžiulė, ir, kaip ir su bet kuriuo generuojančiu AI įrankiu, džinas, ištrauktas iš butelio, tikrai nebegrįš. Joks vyriausybių ar minčių lyderių AI reglamentas negali atsukti bangos atgal.

Atrodo, kad net OpenAI įspėjimas šia tema yra akivaizdus, ​​nepaisant to, kad minimos problemos:

Tačiau šios galimybės taip pat kelia naujų pavojų, pvz., piktybinių veikėjų galimybė apsimesti viešais asmenimis arba sukčiauti. Štai kodėl mes naudojame šią technologiją tam, kad palaikytume konkretų naudojimo atvejį – balso pokalbį.

Atsižvelgiant į tai, kad tai ledkalnio viršūnė, tikėkitės atmušimo prieš naujai atrastą ChatGPT balsą, ypač vieną kartą Nuspėjamai daugėja nemalonių antraščių, kuriose teigiama, kad ChatGPT naudojamas sukčiavimui ir pan. įjungta.

„OpenAI“ paverčia „ChatGPT“ tiesiogine AI programa

Kuo daugiau „OpenAI“ prideda patogių „ChatGPT“ funkcijų, tuo labiau ji tampa generatyvia AI programa. „ChatGPT“, kaip pirmasis, pasiekęs plačią šlovę pradinio generatyvaus AI bumo metu, vis dar pirmauja ir yra tik kai kuriai naudojama programa, nepaisant konkurencijos su „Google Bard“ (ir galbūt „Google Gemini“) ir „Anthropic“ Klodas.

Kol „OpenAI“ galės toliau pridėti funkcijų, kurios palengvina „ChatGPT“ naudojimą, ji pritrauks žmones ir vis labiau priartins prie tikslo – tikrai daugiarūšio AI įrankio.