OpenAI a lansat recent GPT-4o, care, deși nu este mai „inteligent” decât GPT-4, se distinge prin câteva inovații notabile. Modelul poate procesa simultan text, date vizuale și audio, prezintă o latență minimă între întrebare și răspuns și dispune de o voce incredibil de umană.
Deși chatboții de azi sunt printre cei mai avansați creați vreodată, toți se confruntă cu latențe mari. Timpul de răspuns poate varia de la o secundă la câteva secunde, în funcție de interogare. Companii precum Apple încearcă să rezolve această problemă prin procesarea AI pe dispozitiv, dar OpenAI a adoptat o abordare diferită cu Omni.
Demonstrația de luni a arătat că răspunsurile lui Omni sunt rapide, făcând conversația mai fluidă decât în sesiunile tipice cu chatboți. De asemenea, acceptă întreruperile cu grație. Dacă prezentatorul începe să vorbească peste răspunsul lui GPT-4o, acesta își întrerupe vorbirea, în loc să își finalizeze răspunsul.
OpenAI atribuie latența scăzută a lui O capacității modelului de a procesa toate cele trei forme de intrare text, vizual și audio integrându-le într-un răspuns coerent, fără să aștepte output-ul altui model. Deși are „creierul” GPT-4, dispune de modalități suplimentare de procesare a intrărilor, ceea ce Mira Murati, CTO la OpenAI, consideră că ar trebui să devină norma.
Vocea lui Omni a fost aspectul cel mai remarcabil în demonstrație. Când prezentatorul i-a vorbit, a răspuns folosind un limbaj colocvial, cu pauze naturale și chiar a râs, oferindu-i o calitate umană care te face să te întrebi dacă nu cumva este fabricată.
Deși experții vor analiza cu siguranță înregistrarea pentru a o valida sau infirma, am văzut un fenomen similar când Google a prezentat Duplex, care a fost în cele din urmă validat. Așadar, putem aștepta aceeași validare pentru Omni, chiar dacă vocea sa depășește cea a lui Duplex.
Totuși, poate nu avem nevoie de această scrutare suplimentară. OpenAI a permis lui GPT-4o să converseze cu sine pe două telefoane, ceea ce a diminuat oarecum iluzia umanității. Deși vocile masculine și feminine sunau uman, conversația părea mai puțin organică și mai mecanică, ceea ce este de așteptat dacă eliminăm singura voce umană.
La sfârșitul demonstrației, prezentatorul a cerut boților să cânte, ceea ce a creat un moment stânjenitor când a încercat să coordoneze un duet între ei, spulberând din nou iluzia. Tonalitatea ultra-entuziastă a lui Omni ar putea fi ajustată de asemenea.
OpenAI a anunțat de asemenea astăzi lansarea unei aplicații desktop ChatGPT pentru macOS, cu o versiune pentru Windows ce urmează să fie lansată mai târziu în acest an. Utilizatorii plătitori de GPT pot accesa deja aplicația, iar o versiune gratuită va fi oferită la o dată nespecificată. Versiunea web a ChatGPT rulează deja pe modelul GPT-4o și se așteaptă să devină disponibil și pentru utilizatorii gratuiți, cu anumite limitări.
You actually make it seem really easy along with your presentation however I to find this matter to be really one thing which I feel I
would by no means understand. It sort of feels too complex and extremely huge
for me. I’m having a look forward for your next post, I will attempt to get the
hold of it! Escape room
I am in fact pleased to read this website posts which includes lots of valuable facts, thanks for providing
these kinds of data.
I like this blog it’s a master piece! Glad I detected this on google.
Travel guide
Thank you for your sharing. I am worried that I lack creative ideas. It is your article that makes me full of hope. Thank you. But, I have a question, can you help me?
Thank you for your sharing. I am worried that I lack creative ideas. It is your article that makes me full of hope. Thank you. But, I have a question, can you help me?