A ChatGPT alkalmazás a napokban izgalmas újításokat mutatott be. A frissítések a hangfelismerési és képelemzési képességeket érintik, amelyekkel a felhasználói élmény tovább gazdagodhat.
Nemrég a mobilalkalmazás egy hangvisszajelzési funkciót kapott, és most további hangos és képes jellemzőkkel bővült. Ezen újítások között szerepelnek azok a lehetőségek, amelyekkel a felhasználók hangalapú beszélgetésbe kezdhetnek a chatbottal, és egyszerűbben tölthetnek fel képeket az alkalmazásba.
Amikor a felhasználók képet töltenek fel, a ChatGPT elemzi azt, így részletesebb információt kínálva róla. Az iOS és Android platformokon futó alkalmazásban hamarosan elérhetővé válik a hangalapú chat funkció. Ezt a beállítások menüjében találják meg, ahol az “Új funkciók” szekció alatt választhatják ki a hangalapú beszélgetést. Összesen öt különböző hang közül választhatnak, amelyeket egy fülhallgató ikonon keresztül érhetnek el.
Ez az új lehetőség egy korszerű szövegből beszédbe átalakító lapkán alapszik, amely pár másodperc alatt képes emberi hangot létrehozni. Az OpenAI ezen a területen hangszínészekkel működött együtt, hogy minél valósághűbb hangokat hozzanak létre. Emellett a Whisper nevű nyílt forrású hangfelismerő rendszert is integrálták, amely a beszélt szavakat szöveggé alakítja.
Nemsokára a mobilalkalmazásban egy “Fotó” gombot is bevezetnek, melynek segítségével a felhasználók készíthetnek fényképet vagy kiválaszthatnak egy már létezőt. Ezt követően a ChatGPT elemzi a képet és válaszol a felhasználói kérdésekre, például egy adott grafikonra vagy egy nem működő eszközre vonatkozó tanácsok formájában. Az új funkciók hamarosan mindenki számára elérhetővé válnak, kezdve a ChatGPT Plus és Enterprise felhasználókkal.