OpenAI lanseaza modelul GPT-4o, mai rapid si gratuit noul asistent vocal vorbeste atat de natural incat vei crede ca este trucat

OpenAI lanseaza modelul GPT-4o, mai rapid si gratuit noul asistent vocal vorbeste atat de natural incat vei crede ca este trucat

OpenAI a lansat recent GPT-4o, care, deși nu este mai „inteligent” decât GPT-4, se distinge prin câteva inovații notabile. Modelul poate procesa simultan text, date vizuale și audio, prezintă o latență minimă între întrebare și răspuns și dispune de o voce incredibil de umană.

Deși chatboții de azi sunt printre cei mai avansați creați vreodată, toți se confruntă cu latențe mari. Timpul de răspuns poate varia de la o secundă la câteva secunde, în funcție de interogare. Companii precum Apple încearcă să rezolve această problemă prin procesarea AI pe dispozitiv, dar OpenAI a adoptat o abordare diferită cu Omni.

Demonstrația de luni a arătat că răspunsurile lui Omni sunt rapide, făcând conversația mai fluidă decât în sesiunile tipice cu chatboți. De asemenea, acceptă întreruperile cu grație. Dacă prezentatorul începe să vorbească peste răspunsul lui GPT-4o, acesta își întrerupe vorbirea, în loc să își finalizeze răspunsul.

OpenAI atribuie latența scăzută a lui O capacității modelului de a procesa toate cele trei forme de intrare text, vizual și audio integrându-le într-un răspuns coerent, fără să aștepte output-ul altui model. Deși are „creierul” GPT-4, dispune de modalități suplimentare de procesare a intrărilor, ceea ce Mira Murati, CTO la OpenAI, consideră că ar trebui să devină norma.

Vocea lui Omni a fost aspectul cel mai remarcabil în demonstrație. Când prezentatorul i-a vorbit, a răspuns folosind un limbaj colocvial, cu pauze naturale și chiar a râs, oferindu-i o calitate umană care te face să te întrebi dacă nu cumva este fabricată.

Deși experții vor analiza cu siguranță înregistrarea pentru a o valida sau infirma, am văzut un fenomen similar când Google a prezentat Duplex, care a fost în cele din urmă validat. Așadar, putem aștepta aceeași validare pentru Omni, chiar dacă vocea sa depășește cea a lui Duplex.

Totuși, poate nu avem nevoie de această scrutare suplimentară. OpenAI a permis lui GPT-4o să converseze cu sine pe două telefoane, ceea ce a diminuat oarecum iluzia umanității. Deși vocile masculine și feminine sunau uman, conversația părea mai puțin organică și mai mecanică, ceea ce este de așteptat dacă eliminăm singura voce umană.

La sfârșitul demonstrației, prezentatorul a cerut boților să cânte, ceea ce a creat un moment stânjenitor când a încercat să coordoneze un duet între ei, spulberând din nou iluzia. Tonalitatea ultra-entuziastă a lui Omni ar putea fi ajustată de asemenea.

OpenAI a anunțat de asemenea astăzi lansarea unei aplicații desktop ChatGPT pentru macOS, cu o versiune pentru Windows ce urmează să fie lansată mai târziu în acest an. Utilizatorii plătitori de GPT pot accesa deja aplicația, iar o versiune gratuită va fi oferită la o dată nespecificată. Versiunea web a ChatGPT rulează deja pe modelul GPT-4o și se așteaptă să devină disponibil și pentru utilizatorii gratuiți, cu anumite limitări.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *