OpenAI 首席技術官穆里?穆拉蒂 (Muri Murati) 表示,GPT-4o 將提供與 GPT-4 同等水平的智能,但在文本、圖像以及語音處理方面均取得了進一步提升。
GPT-4o 可以綜合利用語音、文本和視覺信息進行推理,穆拉蒂在 OpenAI 公司總部舉行的主題演講中表示。GPT-4 是 OpenAI 此前的旗艦模型,可以處理由圖像和文本混合而成的信息,并能完成諸如從圖像中提取文字或描述圖像內容等任務,GPT-4o 則在此基礎上新增了語音處理能力。
GPT-4o 的運行速度將大大提升,最大亮點在于其語音交互模式采用了新技術。OpenAI 一直致力于讓用戶通過語音與 ChatGPT 進行交流,仿佛與真人對話一般。然而,之前的版本由于延遲問題,嚴重影響了對話的沉浸感。GPT-4o 則采用了全新的技術,讓聊天機器人對話的響應速度大幅提升。