Step Image Edit 2 – 階躍星辰推出的圖像生成編輯模型

AI工具2周前發佈新公告 AI管理員

0 0 0

Step Image Edit 2是什麼

Step Image Edit 2 是階躍星辰推出的新一代輕量級圖像生成編輯模型，參數量僅 3.5B，能在實際表現中超越 12B-20B 級開源大模型。模型單次生圖耗時 0.5-2 秒，主打極速響應與高質量輸出。模型覆蓋圖像生成與編輯，支持中英文渲染、局部編輯、視覺推理、主體一致性保持及風格遷移，可應用於 IP 創作、海報設計、漫畫生成、人像美顏、旅遊修圖與寫真生成等場景。

Step Image Edit 2 – 階躍星辰推出的圖像生成編輯模型

Step Image Edit 2的主要功能

圖像生成：基於文本描述快速生成高質量圖像，單次生圖僅需 0.5-2 秒。
圖像編輯：支持對現有圖像進行局部編輯、主體替換、風格遷移等操作。
中英文渲染：針對文字編輯場景專項優化，可精準生成和修改圖像中的中英文內容。
局部重繪：支持對圖像特定區域進行精細化修改，保持非編輯區域不變。
視覺推理：具備理解圖像內容關係並進行合理編輯推理的能力。
主體一致性：在多輪編輯或風格遷移中保持主體特徵穩定。
風格遷移：將指定藝術風格應用到圖像或局部區域。

Step Image Edit 2的技術原理

多專家驅動的自演化學習：採用”分頭探索、集中聚合”的兩階段訓練框架。從基座模型衍生多個細分任務專家分支，在複雜高噪聲數據中捕捉高質量編輯軌跡；通過迭代式自蒸餾，將專家知識聚合回基座模型，在不增加參數規模的前提下突破能力上限，實現輕量級模型逼近大模型表現。
分佈匹配強化學習（DARL）：將強化學習目標重新定義爲讓模型輸出分佈與參考分佈對齊，非依賴傳統單點獎勵信號。通過對比模型整體輸出與參考輸出的分佈差距作爲稠密獎勵，避免少量樣本評估偏差，使複雜任務訓練更平穩、泛化能力更強。
數據質量與規模突破：投入超五千萬規模專項訓練數據，融合真實場景挖掘、定向合成與高質量開源數據三路來源。針對文字編輯難點自研排版系統生成兩千萬條專項數據，構建”智能體自動清洗—大模型全局評估—人工精細篩選”三級質控體系。

如何使用Step Image Edit 2

訪問階躍星辰開放平台：訪問階躍星辰開放平台 https://platform.stepfun.com/docs/zh/guides/models/step-image-edit-2。
獲取 API 接入：註冊並登錄平台賬號，獲取 Step Image Edit 2 的 API 調用權限。
調用圖像生成/編輯接口：根據文檔指引，通過 API 傳入文本提示詞或待編輯圖像及編輯指令。
查看 Step Plan 集成方案：訪問 https://platform.stepfun.com/docs/zh/step-plan/integrations/image-api 瞭解更詳細的集成方式。

Step Image Edit 2的關鍵信息和使用要求

開發團隊：階躍星辰（StepFun）
模型規模：3.5B 參數（輕量級）
生成速度：單次生圖 0.5-2 秒
上線平台：階躍星辰開放平台、Step Plan
限時免費期：2026 年 4 月 29 日—5 月 5 日
學術排名：KRIS-Bench 輕量級圖像編輯模型綜合排名第一
使用門檻：需註冊階躍星辰開放平台賬號獲取 API 權限
支持語言：中英文提示詞與圖像內文字渲染

Step Image Edit 2的核心優勢

跨量級性能：3.5B 參數實現超越 12B-20B 級開源大模型的編輯效果。
極速響應：單次生圖耗時 0.5-2 秒，滿足實時交互需求。
文字編輯專項強化：自研排版系統生成兩千萬條文字編輯數據，解決行業文字渲染難點。
訓練機制創新：多專家自演化學習與分佈匹配強化學習結合，實現能力非線性跨越。
數據質量保障：三級質控體系確保訓練數據高標準，生成結果貼合真實需求。

Step Image Edit 2的同類競品對比

對比維度	Step Image Edit 2	JoyAI-Image-Edit	Qwen-Image-Edit-2511
開發團隊	階躍星辰	京東	阿里通義
模型規模	3.5B（輕量）	約 12B-20B 級	約 12B-20B 級
KRIS-Bench 總分	66.16（第一）	63.44	62.03
生成速度	0.5-2 秒	未明確	未明確
核心定位	極速輕量編輯	電商圖像編輯	通用圖像編輯
文字渲染	專項強化（2000萬條數據）	支持	支持
訓練創新	多專家自演化 + DARL	未公開	未公開

Step Image Edit 2的核心優勢

IP 創作：模型能快速生成角色概念圖、場景設定圖，支持多輪風格化調整與主體一致性保持，加速動漫、遊戲等 IP 資產的視覺開發流程。
海報設計：根據營銷文案一鍵生成商業海報，精準渲染中英文標題與 Slogan，支持局部元素替換和風格遷移，降低專業設計門檻。
漫畫生成：批量產出漫畫分鏡與角色形象，在多次編輯中維持人物外貌、服飾等主體特徵穩定，提升連載內容的生產效率。
人像美顏：對照片進行智能磨皮、妝容添加、背景替換或路人移除等局部精細化處理，實現寫真級後期修圖效果。
旅遊修圖：自動識別並替換天空、移除雜物、調整整體色調與光影，將普通旅行快照快速升級爲質感大片。

© 版權聲明

文章版权归作者所有，未经允许请勿转载。

相關文章

QLIP – 英偉達推出的視覺標記化方法

earnbyshare2016

1 0

Oasis – Decart聯合Etched推出首個實時生成交互式視頻內容的AI模型

earnbyshare2016

21 0

PixArt-Σ – 華爲推出的可生成4K高清圖像的文生圖模型

earnbyshare2016

55 0

Clapper – 免費開源的可視化AI視頻編輯工具

earnbyshare2016

49 0

林間聊愈室 – 懂你情緒的24小時AI心靈夥伴

earnbyshare2016

42 0

Gemma 4 – 谷歌開源的多模態大模型系列

earnbyshare2016

0 0

暫無評論

暫無評論...