豆包深度思考和文生圖3.0模型正式對企業(yè)客戶開放

豆包深度思考文生圖3.0模型

豆包 | 2025-04-18 14:30

【數(shù)據(jù)猿導(dǎo)讀】最近，豆包大模型發(fā)布了系列更新。其中，豆包1.5·深度思考模型在推理任務(wù)和通用任務(wù)的綜合表現(xiàn)達(dá)到業(yè)界前沿水平，并擁有視覺推理能力；豆包文生圖模型3.0登上權(quán)威競技場Artificial Analysis文生圖榜單第一梯隊。今天，這兩款模型已通過火山引擎正式開放API，供開發(fā)者和企業(yè)客戶使用...

最近，豆包大模型發(fā)布了系列更新。

其中，豆包1.5·深度思考模型在推理任務(wù)和通用任務(wù)的綜合表現(xiàn)達(dá)到業(yè)界前沿水平，并擁有視覺推理能力；豆包文生圖模型3.0登上權(quán)威競技場Artificial Analysis文生圖榜單第一梯隊。

今天，這兩款模型已通過火山引擎正式開放API，供開發(fā)者和企業(yè)客戶使用。

豆包1.5·深度思考模型：推理更高效、更通用

該模型在專業(yè)領(lǐng)域推理任務(wù)中表現(xiàn)出色，數(shù)學(xué)推理AIME 2024 測試得分追平OpenAI o3-mini-high、編程競賽Codeforces pass@8得分接近 OpenAI o1、科學(xué)推理GPQA 得分接近 o3-mini-high，均達(dá)到或接近全球第一梯隊。

豆包_深度思考_文生圖3.0模型-1

在創(chuàng)意寫作等非推理任務(wù)中，模型也展示出優(yōu)秀的泛化能力，能勝任更廣泛和復(fù)雜的使用場景。

數(shù)據(jù)、算法和基礎(chǔ)設(shè)施創(chuàng)新

為提升模型的通用能力，團(tuán)隊優(yōu)化了數(shù)據(jù)處理策略，融合可驗證與創(chuàng)意性數(shù)據(jù)，滿足各類任務(wù)需求。

大規(guī)模強(qiáng)化學(xué)習(xí)是訓(xùn)練推理模型的關(guān)鍵技術(shù)，團(tuán)隊創(chuàng)新性提出雙軌獎勵機(jī)制，兼顧“對錯分明”和“見仁見智”任務(wù)，并有效實現(xiàn)了算法的可靠優(yōu)化。

強(qiáng)化學(xué)習(xí)訓(xùn)練的穩(wěn)定性至關(guān)重要，團(tuán)隊為此優(yōu)化了底層架構(gòu)，保障可擴(kuò)展性、可重復(fù)性和計算效率。

性能與成本的極致優(yōu)化

模型采用MoE架構(gòu)，總參數(shù)為200B，激活參數(shù)僅20B，具備顯著的訓(xùn)練和推理成本優(yōu)勢。

基于高效算法和高性能推理系統(tǒng)，模型在提供極高并發(fā)承載能力的同時，實現(xiàn)20毫秒極低延遲。

視覺推理拓展應(yīng)用邊界

豆包深度思考模型還推出視覺版，具備視覺推理能力，能像人類一樣對自己看到的事物進(jìn)行聯(lián)想、思考，極大拓展了智能推理的應(yīng)用邊界。

豆包深度思考模型稍早之前已接入字節(jié)跳動旗下豆包等產(chǎn)品。

豆包文生圖模型躋身全球第一梯隊

豆包文生圖模型Seedream3.0是一個原生高分辨率、支持中英雙語的圖像生成基礎(chǔ)模型，整體性能相比上一代有較大提升，尤其在分辨率、生圖結(jié)構(gòu)準(zhǔn)確性、數(shù)量準(zhǔn)確性、多物體屬性關(guān)系、小字生成與排版、美感效果、真實度等方面有所突破。

豆包_深度思考_文生圖3.0模型-2