黄色网站va,欧美一区综合,91九色成人,亚洲午夜视频,综合激情久久,伊人成网站222综合网,三级在线观看视频

游客發(fā)表

阿里云百煉上線Qwen2.5

發(fā)帖時間:2024-12-22 21:28:23

11月20日消息,阿里阿里云百煉宣布,云百最新的煉上Qwen2.5-Turbo模型已在平臺上線,即日起所有用戶可在阿里云百煉調用Qwen2.5-Turbo API,阿里百萬tokens僅需0.3元,云百同時還免費為用戶贈送1000萬tokens額度。煉上

阿里云百煉上線Qwen2.5

該模型支持100萬超長上下文,阿里相當于100萬個英文單詞或150萬個漢字,云百并且在多個長文本評測集中的煉上性能表現(xiàn)超越GPT-4。

據(jù)介紹,阿里Qwen2.5-Turbo可應用于長篇小說深入理解、云百倉庫級別代碼助手、煉上多篇論文閱讀等場景,阿里可一次性處理10本長篇小說,云百150小時的煉上演講稿,3萬行代碼。

具體來看,Qwen2.5-Turbo在1M長度的超長文本檢索(Passkey Retrieval)任務中的準確率可達到100%,在長文本評測集RULER上獲得93.1分,超越GPT-4。

在LV-Eval、LongBench-Chat等更加接近真實場景的長文本任務中,Qwen2.5-Turbo在多數(shù)維度超越了GPT-4o-mini。

不僅是長文本,在MMU、LiveBench等短文本基準上Qwen2.5-Turbo的表現(xiàn)也非常優(yōu)秀,在大部分任務上的表現(xiàn)顯著超越之前上下文長度為1M tokens的開源模型。

在推理速度方面,團隊利用稀疏注意力機制將注意力部分的計算量壓縮了約12.5倍,將處理1M tokens上下文時的首字返回時間從4.9分鐘降低到68秒,速度大幅提升了4.3倍。

不過通義千問團隊也表示,長文本任務處理依然存在諸多挑戰(zhàn),未來將進一步探索長序列人類偏好對齊,優(yōu)化推理效率以減少運算時間,并繼續(xù)研發(fā)更大、更強的長文本模型。

    熱門排行

    友情鏈接