Grok 4.3 – xAI 推出的最新旗艦推理模型

AI工具6天前發佈新公告 AI管理員
0 0

Grok 4.3是什麼

Grok 4.3 是 xAI 推出的最新旗艦推理模型,主打 Agentic 工作流與極致性價比。模型約 5000 億參數,API 支持 100 萬 token 上下文及原生視頻理解,可生成 PDF、PPT 等結構化文檔。評測中其 Intelligence Index 達 53 分,GDPval-AA 暴漲 321 分,IFBench 以 81% 登頂全榜。API 定價極具競爭力,輸入 $1.25、輸出 $2.50 每百萬 token,較上一代降低約六成,測評成本僅爲 Claude Opus 4.7 的 1/12。

Grok 4.3 – xAI 推出的最新旗艦推理模型

Grok 4.3的主要功能

  • Agentic 推理引擎:推理模式始終開啓,專爲多步 Agent 任務設計,支持複雜工作流自動化與長文檔分析,無輸出 token 上限。
  • 超長上下文處理:API 端支持 100 萬 token 上下文窗口,消費者端保留 200 萬 token,可一次性處理整本書或海量代碼庫。
  • 原生多模態理解:支持文本、圖像及視頻輸入,可識別視頻中的物體、描述事件序列並回答特定時間戳問題。
  • 結構化文檔生成:可直接生成並下載原生 PDF、PowerPoint 和 Excel 文件,無需藉助外部插件或轉換工具。
  • 內置代碼執行環境:支持編寫、運行代碼並直接產出可下載文件,適合數據分析、腳本自動化等開發場景。
  • 網絡與 X 平台搜索:內置實時聯網搜索能力,可調用 X 平台數據,確保回答基於最新信息。
  • 語音克隆與合成:同步上線 Custom Voices API,支持 25+ 語言的語音克隆、語音識別(STT)與語音合成(TTS)。
  • 桌面自動化 Agent(Grok Computer):可跨應用執行多步任務鏈,實現桌面級自動化操作。
  • 開發者工具鏈:支持函數調用、結構化輸出、Prompt 緩存、MCP 遠程工具接入,兼容 OpenRouter 等第三方網關。

如何使用Grok 4.3

  • 消費者網頁/APP 端使用:訂閱 SuperGrok Heavy($300/月)後,在 Grok 聊天界麪點擊模型切換菜單,選擇「Grok 4.3 (beta)」即可開始對話,支持文本、圖片上傳及實時聯網搜索。
  • API 官方接入:前往 xAI 開發者平台,註冊賬號並獲取 API Key,調用模型名稱 grok-4.3grok-4.3-latest,按標準 OpenAI 兼容格式發送請求,支持 us-east-1 和 eu-west-1 兩個區域。
  • 第三方網關調用:通過 OpenRouter、Vercel AI Gateway 或 Puter.js 等平台接入,無需直接管理 xAI 官方接口,適合已有第三方 AI 網關集成的開發者。
  • 長文檔分析:利用 100 萬 token(API)或 200 萬 token(消費者端)的上下文窗口,直接上傳整份 PDF、代碼庫或長文,讓模型進行全文摘要、提取關鍵信息或多輪深度追問。
  • 視頻內容理解:上傳視頻文件或提供視頻鏈接,Grok 4.3 可自動識別畫面物體、描述事件時間線並回答特定時間戳的問題。
  • 代碼執行與文件生成:在對話中要求模型編寫代碼並運行,或指定生成 PDF、PPT、Excel 等結構化文檔,模型會直接返回可下載的文件。
  • Agent 自動化任務:通過 Grok Computer 功能或 API 的函數調用 / MCP 工具接入,設置多步任務鏈,讓模型跨應用執行自動化操作,如數據抓取、報表生成、郵件處理等。
  • 語音克隆與合成:調用同步上線的 Custom Voices API,上傳音頻樣本克隆聲音,或使用 25+ 語言的 TTS/STT 能力進行語音交互。
  • Prompt 緩存降本:在 API 調用中啓用 Prompt 緩存功能,對重複使用的長上下文進行緩存,緩存費率僅 $0.20/百萬 token,大幅降低長文本處理成本。

Grok 4.3的關鍵信息和使用要求

  • 發佈時間與版本狀態:Beta 版率先上線,目前 API 已全面開放,消費者端仍處於早期測試階段
  • 參數規模:約 5000 億參數(0.5T),馬斯克確認 1T 參數的 Grok 4.4 正在訓練中,預計 5 月初發布
  • 上下文窗口:API 端支持 100 萬 token,消費者端支持 200 萬 token;請求超過 20 萬總 token 後觸發更高上下文定價
  • 知識截止:2025 年 12 月,訓練數據覆蓋至該時間點
  • 推理模式特性:始終開啓(Always-on),無法手動關閉或調節,所有請求均經過深度推理,適合複雜任務但響應速度相對較慢
  • API 定價:輸入 $1.25 / 百萬 token,輸出 $2.50 / 百萬 token,緩存 $0.20 / 百萬 token;跑完整套 benchmark 測評成本僅約 $395
  • 速率與區域限制:每分鐘 1800 請求、1000 萬 token;當前僅開放 us-east-1 和 eu-west-1 兩個區域
  • 模型別名:API 調用時模型名稱爲 grok-4.3grok-4.3-latest
  • 消費者端訂閱門檻:目前僅限 SuperGrok Heavy($300/月)付費會員使用,預計 5 月中下旬向標準訂閱者開放
  • API 接入渠道:需 xAI 官方 API Key,也可通過 OpenRouter、Vercel AI Gateway、Puter.js 等第三方平台調用
  • 多模態輸入要求:支持文本、圖像、視頻輸入,但視頻理解功能需通過 API 或最新客戶端使用
  • 輸出能力:支持文本、代碼及原生 PDF/PPT/Excel 文件生成,無輸出 token 上限
  • 企業功能要求:如需函數調用、結構化輸出、Prompt 緩存、MCP 遠程工具等高級功能,需通過官方 API 接入而非僅使用消費者端

Grok 4.3的核心優勢

  • 極致性價比:API 輸入 $1.25、輸出 $2.50 / 百萬 token,較上一代便宜約六成;跑完整套 benchmark 測評成本僅 $395,是 Claude Opus 4.7 的 1/12,被 Artificial Analysis 評價爲「帕累託前沿」上的模型。
  • 超長上下文:API 支持 100 萬 token、消費者端支持 200 萬 token,可一次性吞入整本書、海量代碼庫或長視頻,且不設輸出 token 上限。
  • Agentic 推理能力:推理模式始終開啓,GDPval-AA 真實工作評測暴漲 321 分至 1500 分,對上一代勝率超 87%,擅長營銷文案、財務模型、PPT 等實際經濟任務。
  • 頂尖指令跟隨:IFBench 以 81% 準確率登頂全榜第一,τ²-Bench Telecom 客服 Agent 任務達 98% 並列第一,對複雜指令的理解與執行能力極強。
  • 原生多模態與文檔生成:首次支持視頻輸入理解,可直接生成原生 PDF、PPT、Excel 文件,無需插件轉換,打通「分析→產出」閉環。

Grok 4.3的同類競品對比

對比維度 Grok 4.3 Claude Opus 4.7 GPT-5.5 (xhigh)
所屬公司 xAI (馬斯克) Anthropic OpenAI
參數規模 ~0.5T (500B) 未公開 未公開
Intelligence Index 53 分 (第10名) 57 分 (第4名) 60 分 (第1名)
GDPval-AA (Agent任務) 1500 Elo / ~50% ~63% ~64% (榜首)
IFBench (指令跟隨) 81% (全榜第1) ~76% ~77%
Terminal-Bench Hard 38% ~58% ~61%
上下文窗口 1M (API) / 2M (消費者) 200K 256K
API 輸入價格 $1.25 / 百萬 token $5 / 百萬 token $5 / 百萬 token
API 輸出價格 $2.50 / 百萬 token $25 / 百萬 token $30 / 百萬 token

Grok 4.3的應用場景

  • 超長文檔深度分析:基於 100 萬(API)/ 200 萬(消費者端)token 的超長上下文,一次性上傳整本書、法律合同、學術論文或海量代碼庫,進行全文摘要、關鍵信息提取、跨章節關聯分析或多輪深度追問。
  • 視頻內容智能解析:上傳視頻文件後,模型可自動識別畫面中的物體與場景、按時間線描述事件序列,並精準回答「第 3 分鐘出現了什麼」這類帶時間戳的細粒度問題,適用於安防監控、課程學習、媒體素材審閱。
  • Agentic 商業任務自動化:基於 GDPval-AA 評測中暴漲 321 分的 Agent 能力,可自動完成營銷文案撰寫、財務模型搭建、商業 PPT 製作、競品調研報告生成等真實經濟活動任務,串聯多步推理直接產出可用成果。
  • 代碼開發與環境執行:通過內置代碼執行環境,讓模型編寫 Python/SQL 等代碼並直接運行,輸出數據分析結果、可視化圖表或可下載腳本文件,適合快速原型驗證、數據清洗、自動化腳本開發。
  • 原生結構化文檔生成:直接生成可下載的 PDF、PowerPoint、Excel 文件,無需藉助外部插件,適用於一鍵生成彙報材料、數據報表、合同模板、培訓手冊等正式文檔。
  • 智能客服與工具調用:可部署爲高複雜度客服 Agent,結合函數調用與 MCP 工具接入,自動查詢數據庫、調用 API、處理工單並給出精準回覆。
© 版權聲明

相關文章

暫無評論

暫無評論...