12月23日消息,布傅敗的不存經(jīng)歷了拖拖拉拉的盛擊12天技術(shù)分享直播活動(dòng),OPenAI終于在最后一天放出了大招。程序
當(dāng)?shù)貢r(shí)間上周五,員程OpenAI發(fā)布了下一代的布傅敗的不存推理模型o3,這是盛擊今年早些時(shí)候發(fā)布的o1推理模型的升級(jí)版本。ps.那為什么不叫o2呢,程序該公司發(fā)言人表示,員程“是布傅敗的不存出于對(duì)同名英國(guó)電信運(yùn)營(yíng)商o2的尊重”。
更準(zhǔn)確地說(shuō),盛擊o3是程序一個(gè)模型系列——就像o1一樣,同時(shí)有o3和o3-mini兩個(gè)版本,員程后者是布傅敗的不存一款更小的精簡(jiǎn)版模型,針對(duì)特定任務(wù)進(jìn)行了微調(diào)。盛擊
OpenAI聲稱(chēng),程序至少在某些條件下,o3模型可以接近實(shí)現(xiàn)AGI。
所謂AGI,即“通用人工智能”(artificial general intelligence)的縮寫(xiě),泛指能完成人類(lèi)所能完成的任何任務(wù)的人工智能。OpenAI對(duì)此有著自己的定義:“在最具經(jīng)濟(jì)價(jià)值的工作上勝過(guò)人類(lèi)的高度自主系統(tǒng)”。
那o3有多強(qiáng)大呢?按照OpenAI的說(shuō)法,o3模型在ARC-AGI圖形邏輯推理基準(zhǔn)上獲得了破紀(jì)錄的分?jǐn)?shù),低計(jì)算場(chǎng)景中,o3得分為75.7%,而在高計(jì)算測(cè)試中,它達(dá)到了87.5%——超過(guò)了標(biāo)志著達(dá)到人類(lèi)水平的門(mén)檻85%。
作為對(duì)比,o1模型的得分僅在25%到32%之間。o3的表現(xiàn)幾乎是o1三倍。
最值得關(guān)注的是,在全球著名的編碼競(jìng)賽平臺(tái)odeforces評(píng)分中,o3取得了2727的評(píng)分,而o1評(píng)分僅為1891。
獵豹移動(dòng)&獵戶(hù)星空董事長(zhǎng)傅盛表示,伴隨著OpenAI o3的發(fā)布,人人都是程序員的時(shí)代馬上就要帶來(lái)了,你再也不要因?yàn)椴粫?huì)Python、不會(huì)C++就不敢寫(xiě)程序,只要說(shuō)出你的需求,大預(yù)言模型幫你寫(xiě)程序。
“看完o3的發(fā)布,我的一個(gè)感慨就是程序員可能不存在了”,傅盛認(rèn)為,這次o3的發(fā)布,標(biāo)志著大語(yǔ)言模型的編程能力超越了99.9%的程序員。
在Codeforces世界級(jí)編程比賽中,OpenAI o3取得了175名的頂尖成績(jī),要知道這是17萬(wàn)程序員里的排名。o1大概也只戰(zhàn)勝90%多的程序員,之前GPT-4o只戰(zhàn)勝11%的程序員。
據(jù)悉,OpenAI o3明年1月底就會(huì)正式發(fā)布。傅盛稱(chēng),可以負(fù)責(zé)任的說(shuō),人類(lèi)程序員這次真的危險(xiǎn)了,說(shuō)不存在了可能稍微有點(diǎn)夸張,程序員會(huì)存在,但更多的是比拼對(duì)用戶(hù)需求的理解、大邏輯的構(gòu)建,而真正把它變成代碼的工作應(yīng)該是大幅度的讓AI去完成。