OpenAI nodrošina ChatGPT balsi, lai reaģētu uz uzvednēm un komandām

Tādi lasītāji kā jūs palīdz atbalstīt MUO. Veicot pirkumu, izmantojot saites mūsu vietnē, mēs varam nopelnīt filiāles komisiju. Lasīt vairāk.

ChatGPT ir paredzēts kļūt par interaktīvu ģenerējošu AI pieredzi. OpenAI atklāja, ka pasaulē vadošais AI tērzēšanas robots varēs runāt un atbildēt uz lietotāju vaicājumiem, izmantojot sintezētu, domājams, AI ģenerētu balsi.

Līdzās jaunatklātajai balsij ChatGPT varēs arī atbildēt un apspriest konkrētus attēlus, kas tajā augšupielādēti vai uzņemti, izmantojot ChatGPT Android vai iOS lietotni. Attēla atpazīšanas funkcija izklausās līdzīgi Google Lens un citām lietotnēm, kas izmanto neironu tīklus, lai precīzi noteiktu datus un informāciju.

OpenAI nodrošina ChatGPT balsi

2023. gada 25. septembrī ChatGPT izstrādātājs OpenAI atklāja tas sniegtu balsi savam pasaules vadošajam ģeneratīvajam AI tērzēšanas robotam. ChatGPT lietotāji var runāt tieši ar tērzēšanas robotu un pieprasīt tam runāt, tādējādi ļaujot ChatGPT pirmo reizi sarunāties tieši ar balsi.

klēpjdatora logos 10 nav skaņas

OpenAI piemēra klipā ir attēlota sieviete, kura lūdz ChatGPT izveidot unikālu stāstu pirms gulētiešanas, uz kuru ChatGPT pienācīgi atbild ar sievietes sintezētu balsi.

Saskaņā ar Vadu , jaunais teksta pārvēršanas runā modelis tika izstrādāts uzņēmuma iekšienē. Tas var ģenerēt 'cilvēkam līdzīgu' audio no teksta un dažu sekunžu runas parauga ( izmantojot OpenAI Whisper modeli ) un runāt dažādos toņos un stilos. Vietnē varat atrast virkni balss paraugu OpenAI emuārs .

Daži uzņēmumi jau izmanto OpenAI jauno balss modeli. Piemēram, Spotify izmanto OpenAI teksta pārvēršanas runā modeli, lai tulkotu aplādes dažādās valodās, apvienojot ChatGPT valodas tulkošanas spējas ar jauno runas spēju.

ChatGPT jaunais teksta pārvēršanas runā modelis ir pieejams tikai Plus un Enterprise abonentiem, kuri izmanto oficiālās Android un iOS lietotnes, un ir paredzēts, ka tas tiks ieviests nākamo divu nedēļu laikā (sākot no 2023. gada 25. septembra). Turklāt jaunā balss funkcija sākotnēji ir ierobežota ar angļu valodu, lai gan mēs sagaidām, ka tas strauji mainīsies.

ChatGPT var atpazīt un un fotogrāfijas

OpenAI ChatGPT atjauninājuma otrā daļa ir iespēja analizēt un runāt par rīkā augšupielādētajiem attēliem. Vizuālā attēla analīzes opcija tika parādīta GPT-4 atjaunināšanas videoklipos, taču kopš tā laika tā nav daudz apspriesta ( ChatGPT koda tulks malā ).

Tagad ChatGPT iegūst funkcionalitāti, kas ir līdzīga Google Lens. Varat augšupielādēt attēlu pakalpojumā ChatGPT vai nofotografēt, izmantojot viedtālruņa kameru lietotnē ChatGPT, un tas detalizēti attēlos attēlu, vajadzības gadījumā pievienojot papildu kontekstu.

Nosaucot to par 'līdzīgu Google Lens', tas patiešām rada netaisnību. Iespēja tērzēt par attēlu, lai iegūtu vairāk informācijas un kontekstu, padara to ļoti noderīgu dažādiem iestatījumiem. Tomēr ir svarīgi atzīmēt sīko druku, jo OpenAI skaidri norāda, ka tas ir ierobežojis ChatGPT 'spēju analizēt un sniegt tiešus paziņojumus par cilvēkiem' privātuma un precizitātes apsvērumu dēļ. Tomēr vai OpenAI darbināms rīks 'Who Is This' varētu tikt izstrādāts nākotnē? (cerēsim, ka nē!)

Tāpat kā jaunais teksta pārvēršanas runā modelis, OpenAI nākamo divu nedēļu laikā ieviesīs attēlu atpazīšanu, lai gan tas būs pieejams visās platformās, ne tikai ChatGPT lietotnē.

pārvietot lietotnes uz SD kartes sakni

Privātums, drošība un citas problēmas

Ar balsi darbināma ChatGPT sekas ir acīmredzamas. Protams, tas ir aizraujoši. Tomēr iespēja izveidot unikāli sintezētu balsi, izmantojot tikai īsu fragmentu kā piemēru, rada ievērojamas privātuma un drošības problēmas. Ļaunprātīgo dalībnieku potenciāls izmantot šos rīkus ir milzīgs, un, tāpat kā jebkuram ģeneratīvajam mākslīgā intelekta rīkam, tad, kad džins ir ārā no pudeles, tas noteikti vairs neatgriezīsies. Nekāds AI regulējums no valdību vai domu līderu puses nevar atgriezties. paisums.

Pat OpenAI brīdinājums par šo tēmu šķiet acīmredzams, neskatoties uz problēmu pieminēšanu:

Tomēr šīs iespējas rada arī jaunus riskus, piemēram, ļaunprātīgu dalībnieku iespējamību uzdoties par sabiedrībā zināmām personām vai veikt krāpšanu. Tāpēc mēs izmantojam šo tehnoloģiju, lai nodrošinātu konkrētu lietošanas gadījumu — balss tērzēšanu.

Ņemot vērā, ka šī ir aisberga redzamā daļa, sagaidiet atgrūšanos pret ChatGPT jaunatklāto balsi, it īpaši, ja ir paredzams pieaugums nepatīkamajos virsrakstos, kuros apgalvots, ka ChatGPT tiek izmantots krāpšanai un tamlīdzīgi.

OpenAI padara ChatGPT par galveno AI lietotni

Jo vairāk OpenAI pievieno lietotājam draudzīgas funkcijas ChatGPT, jo vairāk tā kļūst par ģeneratīvo AI lietotni. Tā kā ChatGPT ir pirmā, kas sasniegusi plašu slavu sākotnējā ģeneratīvā AI uzplaukuma laikā, tā joprojām ir vadošā un vienīgā lietotne, ko daži izmanto, neskatoties uz konkurenci, ko rada Google Bard (un, iespējams, Google Gemini) un Anthropic's Claude.

Kamēr OpenAI varēs turpināt pievienot funkcijas, kas padara ChatGPT vieglāk lietojamu, tas saglabās cilvēku piesaisti un liks arvien tuvāk savam mērķim — patiesi multimodāla AI rīkam.