Step Image Edit 2 – 階躍星辰推出的圖像生成編輯模型

AI工具2周前發佈新公告 AI管理員
0 0

Step Image Edit 2是什麼

Step Image Edit 2 是階躍星辰推出的新一代輕量級圖像生成編輯模型,參數量僅 3.5B,能在實際表現中超越 12B-20B 級開源大模型。模型單次生圖耗時 0.5-2 秒,主打極速響應與高質量輸出。模型覆蓋圖像生成與編輯,支持中英文渲染、局部編輯、視覺推理、主體一致性保持及風格遷移,可應用於 IP 創作、海報設計、漫畫生成、人像美顏、旅遊修圖與寫真生成等場景。

Step Image Edit 2 – 階躍星辰推出的圖像生成編輯模型

Step Image Edit 2的主要功能

  • 圖像生成:基於文本描述快速生成高質量圖像,單次生圖僅需 0.5-2 秒。
  • 圖像編輯:支持對現有圖像進行局部編輯、主體替換、風格遷移等操作。
  • 中英文渲染:針對文字編輯場景專項優化,可精準生成和修改圖像中的中英文內容。
  • 局部重繪:支持對圖像特定區域進行精細化修改,保持非編輯區域不變。
  • 視覺推理:具備理解圖像內容關係並進行合理編輯推理的能力。
  • 主體一致性:在多輪編輯或風格遷移中保持主體特徵穩定。
  • 風格遷移:將指定藝術風格應用到圖像或局部區域。

Step Image Edit 2的技術原理

  • 多專家驅動的自演化學習:採用”分頭探索、集中聚合”的兩階段訓練框架。從基座模型衍生多個細分任務專家分支,在複雜高噪聲數據中捕捉高質量編輯軌跡;通過迭代式自蒸餾,將專家知識聚合回基座模型,在不增加參數規模的前提下突破能力上限,實現輕量級模型逼近大模型表現。
  • 分佈匹配強化學習(DARL):將強化學習目標重新定義爲讓模型輸出分佈與參考分佈對齊,非依賴傳統單點獎勵信號。通過對比模型整體輸出與參考輸出的分佈差距作爲稠密獎勵,避免少量樣本評估偏差,使複雜任務訓練更平穩、泛化能力更強。
  • 數據質量與規模突破:投入超五千萬規模專項訓練數據,融合真實場景挖掘、定向合成與高質量開源數據三路來源。針對文字編輯難點自研排版系統生成兩千萬條專項數據,構建”智能體自動清洗—大模型全局評估—人工精細篩選”三級質控體系。

如何使用Step Image Edit 2

  • 訪問階躍星辰開放平台:訪問階躍星辰開放平台 https://platform.stepfun.com/docs/zh/guides/models/step-image-edit-2。
  • 獲取 API 接入:註冊並登錄平台賬號,獲取 Step Image Edit 2 的 API 調用權限。
  • 調用圖像生成/編輯接口:根據文檔指引,通過 API 傳入文本提示詞或待編輯圖像及編輯指令。
  • 查看 Step Plan 集成方案:訪問 https://platform.stepfun.com/docs/zh/step-plan/integrations/image-api 瞭解更詳細的集成方式。

Step Image Edit 2的關鍵信息和使用要求

  • 開發團隊:階躍星辰(StepFun)
  • 模型規模:3.5B 參數(輕量級)
  • 生成速度:單次生圖 0.5-2 秒
  • 上線平台:階躍星辰開放平台、Step Plan
  • 限時免費期:2026 年 4 月 29 日—5 月 5 日
  • 學術排名:KRIS-Bench 輕量級圖像編輯模型綜合排名第一
  • 使用門檻:需註冊階躍星辰開放平台賬號獲取 API 權限
  • 支持語言:中英文提示詞與圖像內文字渲染

Step Image Edit 2的核心優勢

  • 跨量級性能:3.5B 參數實現超越 12B-20B 級開源大模型的編輯效果。
  • 極速響應:單次生圖耗時 0.5-2 秒,滿足實時交互需求。
  • 文字編輯專項強化:自研排版系統生成兩千萬條文字編輯數據,解決行業文字渲染難點。
  • 訓練機制創新:多專家自演化學習與分佈匹配強化學習結合,實現能力非線性跨越。
  • 數據質量保障:三級質控體系確保訓練數據高標準,生成結果貼合真實需求。

Step Image Edit 2的同類競品對比

對比維度 Step Image Edit 2 JoyAI-Image-Edit Qwen-Image-Edit-2511
開發團隊 階躍星辰 京東 阿里通義
模型規模 3.5B(輕量) 約 12B-20B 級 約 12B-20B 級
KRIS-Bench 總分 66.16(第一) 63.44 62.03
生成速度 0.5-2 秒 未明確 未明確
核心定位 極速輕量編輯 電商圖像編輯 通用圖像編輯
文字渲染 專項強化(2000萬條數據) 支持 支持
訓練創新 多專家自演化 + DARL 未公開 未公開

Step Image Edit 2的核心優勢

  • IP 創作:模型能快速生成角色概念圖、場景設定圖,支持多輪風格化調整與主體一致性保持,加速動漫、遊戲等 IP 資產的視覺開發流程。
  • 海報設計:根據營銷文案一鍵生成商業海報,精準渲染中英文標題與 Slogan,支持局部元素替換和風格遷移,降低專業設計門檻。
  • 漫畫生成:批量產出漫畫分鏡與角色形象,在多次編輯中維持人物外貌、服飾等主體特徵穩定,提升連載內容的生產效率。
  • 人像美顏:對照片進行智能磨皮、妝容添加、背景替換或路人移除等局部精細化處理,實現寫真級後期修圖效果。
  • 旅遊修圖:自動識別並替換天空、移除雜物、調整整體色調與光影,將普通旅行快照快速升級爲質感大片。
© 版權聲明

相關文章

暫無評論

暫無評論...