黄色网站va,欧美一区综合,91九色成人,亚洲午夜视频,综合激情久久,伊人成网站222综合网,三级在线观看视频

設(shè)為首頁(yè) - 加入收藏   
您的當(dāng)前位置:首頁(yè) > 休閑 > Kimi視覺(jué)思考模型k1發(fā)布:數(shù)理化超越OpenAI o1、GPT 正文

Kimi視覺(jué)思考模型k1發(fā)布:數(shù)理化超越OpenAI o1、GPT

來(lái)源:下愚不移網(wǎng) 編輯:休閑 時(shí)間:2024-12-22 21:57:43

12月16日消息,視覺(jué)思考今日,模型月之暗面國(guó)產(chǎn)大模型Kimi發(fā)布視覺(jué)思考模型k1,布數(shù)k1基于強(qiáng)化學(xué)習(xí)技術(shù)打造,理化原生支持端到端圖像理解和思維鏈技術(shù),視覺(jué)思考并將能力擴(kuò)展到數(shù)學(xué)之外的模型更多基礎(chǔ)科學(xué)領(lǐng)域。

k1已陸續(xù)上線(xiàn)最新版Kimi智能助手的布數(shù)Android和iPhone APP以及網(wǎng)頁(yè)版kimi.com。

Kimi視覺(jué)思考模型k1發(fā)布:數(shù)理化超越OpenAI o1、GPT

在最新版手機(jī)APP或網(wǎng)頁(yè)版Kimi+頁(yè)面找到Kimi視覺(jué)思考版,理化即可拍照或傳圖體驗(yàn)。視覺(jué)思考

據(jù)了解,模型在數(shù)學(xué)、布數(shù)物理、理化化學(xué)等基礎(chǔ)科學(xué)學(xué)科的視覺(jué)思考基準(zhǔn)能力測(cè)試中,初代k1模型的模型表現(xiàn)超過(guò)了全球標(biāo)桿模型OpenAI o1、GPT-4o以及Claude 3.5 Sonnet。布數(shù)

官方表示,K1模型真正意義上實(shí)現(xiàn)了端到端的圖像理解和思考能力,模型可以直接處理用戶(hù)輸入的圖像信息并進(jìn)行思考得出答案,不需要借助外部的OCR或額外視覺(jué)模型進(jìn)行信息處理。

從模型訓(xùn)練的角度看,k1的訓(xùn)練分為兩個(gè)階段,先通過(guò)預(yù)訓(xùn)練得到基礎(chǔ)模型,再在基礎(chǔ)模型上進(jìn)行強(qiáng)化學(xué)習(xí)后訓(xùn)練。

k1的基礎(chǔ)模型重點(diǎn)優(yōu)化了字符識(shí)別能力,在OCRBench上得到903分的當(dāng)前最好(state-of-the-art)結(jié)果,在MathVista-testmini、MMMU-val 和DocVQA基準(zhǔn)測(cè)試集上分?jǐn)?shù)分別為69.1、66.7和96.9,處于全球第一梯隊(duì)水平。

據(jù)介紹,k1的強(qiáng)化學(xué)習(xí)后訓(xùn)練在數(shù)據(jù)質(zhì)量和學(xué)習(xí)效率方面做了進(jìn)一步優(yōu)化,在強(qiáng)化學(xué)習(xí)的規(guī)?;╯caling)上取得了新的突破,這是k1視覺(jué)推理模型在基準(zhǔn)測(cè)試中取得行業(yè)領(lǐng)先成績(jī)的最關(guān)鍵原因。

月之暗面坦言,在內(nèi)部測(cè)試中也發(fā)現(xiàn)了一些k1視覺(jué)思考模型存在的局限性,例如在分布外(out-of-distribution)的泛化、在更復(fù)雜問(wèn)題上的成功率、在更多噪聲場(chǎng)景的準(zhǔn)確率、多輪問(wèn)答效果等方面,有很大提升空間。

在一些場(chǎng)景和泛化能力上,k1模型與OpenAI的o1系列模型相比仍有差距。

熱門(mén)文章

0.1494s , 9790.78125 kb

Copyright © 2024 Powered by Kimi視覺(jué)思考模型k1發(fā)布:數(shù)理化超越OpenAI o1、GPT,下愚不移網(wǎng)  

sitemap

Top