8月6日消息,OpenAI宣布推出兩款開(kāi)源模型GPT-oss-120b和GPT-oss-20b,這是自2020年發(fā)布GPT-2以來(lái),OpenAI首次推出開(kāi)源語(yǔ)言模型。這兩款模型均可在Hugging Face在線開(kāi)發(fā)者平臺(tái)上免費(fèi)下載,OpenAI稱(chēng)其在多個(gè)用于比較開(kāi)源模型的基準(zhǔn)測(cè)試中表現(xiàn)“處于前沿水平”。
兩款開(kāi)源模型亮相,性能與兼容性兼具?
據(jù)每日經(jīng)濟(jì)新聞援引OpenAI介紹,兩款gpt-oss模型采用了其最先進(jìn)的預(yù)訓(xùn)練和后訓(xùn)練技術(shù),特別注重推理、效率和跨部署環(huán)境的實(shí)用性。它們都是使用專(zhuān)家混合(MoE)架構(gòu)的Transformer,以減少處理輸入所需的活躍參數(shù)數(shù)量。
gpt-oss-120b每個(gè)token激活5.1億參數(shù),總參數(shù)量為1170億;gpt-oss-20b激活3.6B參數(shù),總參數(shù)量為210億。模型使用交替的密集和局部帶狀稀疏注意力模式,支持高達(dá)128k的上下文長(zhǎng)度。OpenAI稱(chēng)gpt-oss-20b是一款中型開(kāi)放模型,gpt-oss-120b則是可在“大多數(shù)臺(tái)式機(jī)和筆記本電腦”上運(yùn)行的大型開(kāi)放模型。
OpenAI表示,較小的模型至少需要16GB顯存或統(tǒng)一內(nèi)存才能發(fā)揮最佳性能,并且“非常適合高端消費(fèi)級(jí)GPU和搭載蘋(píng)果芯片的Mac電腦”。較大的全尺寸模型則需要至少60GB顯存或統(tǒng)一內(nèi)存。
從性能上看,gpt-oss-120b在核心推理基準(zhǔn)測(cè)試中表現(xiàn)接近OpenAI o4-mini,在競(jìng)賽編碼(Codeforces)、通用問(wèn)題求解(MMLU和HLE)以及工具調(diào)用(TauBench)等方面超越了o3-mini,甚至在健康相關(guān)查詢(xún)(HealthBench)和競(jìng)賽數(shù)學(xué)(AIME 2024和2025)的表現(xiàn)上優(yōu)于o4-mini。而gpt-oss-20b雖規(guī)模較小,但在相同評(píng)估中達(dá)到或超過(guò)了o3-mini的性能,尤其在競(jìng)賽數(shù)學(xué)和健康領(lǐng)域表現(xiàn)突出。
開(kāi)源戰(zhàn)略轉(zhuǎn)變,應(yīng)對(duì)市場(chǎng)競(jìng)爭(zhēng)壓力
此次OpenAI重新推出開(kāi)源模型,源于其在開(kāi)源技術(shù)方面態(tài)度的轉(zhuǎn)變。今年1月,DeepSeek引發(fā)了開(kāi)源AI熱潮,奧爾特曼隨后承認(rèn)OpenAI在開(kāi)源技術(shù)上“站在了歷史的錯(cuò)誤一邊”。此次發(fā)布開(kāi)源模型,正是OpenAI對(duì)市場(chǎng)趨勢(shì)的回應(yīng),旨在重新融入開(kāi)源生態(tài),增強(qiáng)自身在AI領(lǐng)域的競(jìng)爭(zhēng)力。
市場(chǎng)競(jìng)爭(zhēng)的加劇無(wú)疑是OpenAI此舉的重要驅(qū)動(dòng)力。近年來(lái),眾多科技公司和研究機(jī)構(gòu)在開(kāi)源AI領(lǐng)域積極布局,推出了一系列具有競(jìng)爭(zhēng)力的模型。谷歌DeepMind于8月4日宣布推出第三代通用世界模型Genie 3,能夠生成多樣化的交互式環(huán)境,在模擬環(huán)境領(lǐng)域展現(xiàn)出強(qiáng)大的技術(shù)實(shí)力。面對(duì)競(jìng)爭(zhēng)對(duì)手的不斷發(fā)力,OpenAI通過(guò)開(kāi)源模型,有望吸引更多開(kāi)發(fā)者和企業(yè)參與其生態(tài)系統(tǒng),鞏固自身的市場(chǎng)地位。
此外,OpenAI與英偉達(dá)、AMD、Cerebras和Groq等芯片制造商展開(kāi)合作,確保模型在各種芯片上能夠良好運(yùn)行。英偉達(dá)CEO黃仁勛表示,OpenAI在英偉達(dá)AI平臺(tái)上推動(dòng)了開(kāi)源軟件的創(chuàng)新。這一系列合作將進(jìn)一步提升OpenAI模型的性能和適用性,為用戶(hù)提供更優(yōu)質(zhì)的體驗(yàn)。
模型安全性引關(guān)注,市場(chǎng)期待GPT-5?
盡管OpenAI的開(kāi)源模型在性能上表現(xiàn)出色,但相較o3和o4-mini模型,兩款開(kāi)放模型更容易出現(xiàn)“幻覺(jué)”現(xiàn)象。OpenAI解釋稱(chēng),由于較小的模型所擁有的世界知識(shí)相對(duì)較少,因此更容易產(chǎn)生幻覺(jué)。在OpenAI內(nèi)部用于衡量模型對(duì)人物知識(shí)準(zhǔn)確性的PersonQA基準(zhǔn)測(cè)試中,gpt-oss-120b和gpt-oss-20b分別對(duì)49%和53%的問(wèn)題產(chǎn)生幻覺(jué),顯著高于o4-mini模型的36%。
針對(duì)開(kāi)放權(quán)重模型可能面臨的安全風(fēng)險(xiǎn),OpenAI給予了特別關(guān)注。在預(yù)訓(xùn)練期間,公司過(guò)濾了與化學(xué)、生物、放射性和核(CBRN)相關(guān)的有害數(shù)據(jù),并對(duì)模型進(jìn)行了專(zhuān)門(mén)的生物學(xué)和網(wǎng)絡(luò)安全數(shù)據(jù)微調(diào),以評(píng)估潛在風(fēng)險(xiǎn)。經(jīng)過(guò)內(nèi)部和外部測(cè)試,這些惡意微調(diào)的模型無(wú)法達(dá)到其準(zhǔn)備框架中的“高能力”閾值。
隨著OpenAI此次開(kāi)源模型的發(fā)布,市場(chǎng)對(duì)其下一個(gè)重磅產(chǎn)品的期待愈發(fā)高漲。鑒于公司近期不斷釋放的新消息,市場(chǎng)普遍預(yù)期OpenAI的下一個(gè)重大更新將是推出GPT-5。
浙商證券7月27日發(fā)布的報(bào)告指出,GPT-5的模型思路圍繞“簡(jiǎn)化、統(tǒng)一、多模態(tài)”展開(kāi),它將整合GPT系列基礎(chǔ)模型、o系列推理模型以及GPT-4o全模態(tài)模型的三方能力。奧特曼早在2025年2月就曾透露,GPT-5將簡(jiǎn)化產(chǎn)品線,實(shí)現(xiàn)更強(qiáng)更統(tǒng)一的功能;6月的播客中,他再次強(qiáng)調(diào)了GPT-5的融合能力。
中信證券8月1日發(fā)布的研究報(bào)告預(yù)計(jì),相較于GPT-4單次激活2770億的規(guī)模,新一代模型GPT-5單次推理的算力消耗不會(huì)大幅增加,API價(jià)格或較GPT-4o僅小幅增長(zhǎng)甚至維持不變,推理性?xún)r(jià)比有望提升一倍以上,這將顯著改善AI應(yīng)用的盈利能力。