豆包1.5與商湯日日新V6并列國內(nèi)第一

2025-05-30 18:16:08 來源: 科技日報點擊數(shù)：

科技日報記者羅云鵬

5月28日，SuperCLUE《中文大模型基準(zhǔn)測評2025年5月報告》出爐，豆包1.5·深度思考模型（Doubao-1.5-thinking-pro）和商湯日日新V6多模態(tài)模型（SenseNova-V6 Reasoner）共同摘金，超越Gemini 2.5 Flash Preview，在國內(nèi)大模型第一梯隊領(lǐng)跑。

位居第二梯隊的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

報告指出，國內(nèi)外第一梯隊大模型在中文領(lǐng)域的通用能力差距正在縮小。在國產(chǎn)大模型中，Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表現(xiàn)最為亮眼。國內(nèi)推理模型競爭格局初露端倪。

該報告聚焦通用能力測評，涵蓋數(shù)學(xué)推理、科學(xué)推理、代碼生成、智能體Agent、精確指令遵循、文本理解與創(chuàng)作六大任務(wù)，總量為1579道多輪簡答題。

責(zé)任編輯：冷媚

豆包1.5與商湯日日新V6并列國內(nèi)第一

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標(biāo)升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

豆包1.5與商湯日日新V6并列國內(nèi)第一

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標(biāo)升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁