IT之家3月15日消息,Open-AI剛剛公布了其大型語言模型的最新版本——GPT-4(API候補申請點此)。
GPT-4可以更準確地解決你的難題,多模態的GPT-4還可以生成、編輯具有創意性或技術性的文章,在高級推理方面的表現超過其前輩(當前公開版ChatGPT基于GPT-3.5)。當然,正如大家所猜測的那樣,微軟New Bing的聊天功能確實基于GPT-4。
此外,該公司正在與合作伙伴Be My Eyes一起測試GPT-4的圖像輸入能力(注:Be My Eyes是一款即將推出的智能手機App,可以識別場景并對其進行描述,類似于大家常見的AI識圖的加強版)。

除了介紹網站,OpenAI還提供了描述GPT-4功能的技術性論文,以及詳細描述其局限性的系統模型Card。
OpenAI計劃通過ChatGPT及其商業API為用戶提供GPT-4的文本功能支持,但目前還需要等待。IT之家這里需要提醒一下,GPT4目前僅ChatGPT plus賬號可用,可選GPT4模式進行對話,每4小時限制發送100條消息。
收費方面,大約750個單詞的提示收取約3美分的費用,約750個單詞的響應則收取6美分(就是問和答的區別)。
據介紹,GPT-4比以前的版本“更大”,這意味著它已經借助比前輩更多的數據進行了訓練,并且在模型文件中有更多的權重,從而使得它的運行成本更高。
就任務而言,GPT-4的表現比前輩更好,它可以遵循自然語言的復雜指令并生成技術或創意內容,而且它可以還更深入地做到這一點:它支持生成和處理多達32768個標記(約25000個文本單詞),從而實現比前輩更長的內容創建或文本分析。
OpenAI表示,GPT-4錯誤答案更少,而且也會減少偏離話題的可能,也盡可能不會再談論禁忌話題,甚至在許多標準化測試中比人類表現得都要更好一些。
例如,GPT-4在模擬律師考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數學考試中排名前11%左右。相比之下,GPT-3.5在律師考試中的得分一般都是倒數10%左右。當然,它們考個研究生還是沒問題的。
當然,AI畢竟是AI,OpenAI也表示目前GPT-4并不完美,它在很多場景下的能力都不如人類。
據稱,該模型仍然存在“幻覺”或編造事實的問題,并且在事實方面也不一定總是可靠的,“它傾向于堅持認為它是正確的,即使它錯了”。OpenAI表示,GPT-4正在努力解決其局限性,例如社會偏見、幻覺和對抗性提示。







