騰訊研究院推出《AI Coding 觀察報告 2.0》

0 0 0

《豐饒之後：AI Coding 觀察報告 2.0》是騰訊研究院推出的AI透鏡系列深度研究報告，由曹士圯、餘一、袁曉輝執筆，覆蓋2025下半年至2026第一季度。報告站在首版《AI Coding非共識報告》發佈9個月後，系統驗證7條非共識的落地情況，提煉6個結構性洞察。核心命題是：當AI Coding跨越”輔助補全”與”自主協作”兩道能力門檻後，代碼生成進入豐饒時代，稀缺性從”如何編寫”遷移到”如何驗證、如何定義規格、如何持續運營”。

報告背景與定位

研究脈絡：2025年7月首版報告提出”AI Coding是通用Agent的先驗戰場”等7條非共識。9個月後，多數判斷已成共識，新的結構性問題浮現。二版不再爭論”AI能否編程”，是追問”豐饒之後，什麼變得稀缺”。
時間跨度：聚焦2025H2至2026Q1，涵蓋Claude Opus 4.5發佈（第二道門檻）、METR實驗結論逆轉、Cursor估值躍升、Skills生態爆發、三場”Anthropic Day”等關鍵事件。
研究方法：基於實驗室技術報告、第三方基準（SWE-bench/Vellum）、行業調研（a16z/Pragmatic Engineer/GitClear）、企業實踐（Anthropic/OpenAI/Cursor）及安全事件分析，採用”AI透鏡”穿透噪聲，提取可驗證的結構性趨勢。

6個結構性洞察

模型加速趨同，前沿差距不減：六大商業模型在SWE-bench Verified上壓縮至1個百分點區間，開源Qwen3-Coder追至80%段位，”選哪家模型”對多數企業已非核心決策。但Anthropic 2026年4月9天內連發Mythos Preview（93.9%，不公開）與Opus 4.7（87.6%，公開），”內部能力持續突破+階段性差異化降權公開”的雙軌機制表明，前沿實驗室的能力儲備與公開模型之間正在拉開新差距。
Agent原生成爲工具演化的收斂方向：形態層面，Cursor 3、Codex App、Google Antigravity將IDE從”代碼編輯器+AI插件”升級爲”Agent編排平台+代碼視圖”。接口層面，CLI贏得Agent內循環（gh命令約200 tokens vs GitHub MCP服務器55,000 tokens，差275倍），MCP退守企業外循環，Skills用SOP封裝成爲非開發者首選接口。給Agent最好的工作環境是編排平台，最好的能力接口是代碼與SOP。
代碼生成規模化，驗證成新瓶頸：SWE-bench 87.6%意味着”如何實現”退出核心瓶頸。新瓶頸出現在兩端：向前是規格定義（KTH實驗顯示AI可從926字英文規格完整自舉代碼），向後是驗證維護（Veracode發現45%AI代碼任務含已知漏洞，GitClear分析2.11億行代碼後技術債務增30-41%）。下一波價值創造不在更好的代碼生成，而在更好的規格、驗證、維護基礎設施。
產品構建零門檻，品味、運營逐漸稀缺：YC W2025批次25%創業公司95%+代碼由AI生成，Solo founder比例從23.7%升至36.3%，Base44單人6個月被Wix以8000萬美元收購。”原型牆”普遍存在：AI快速生成MVP後，安全、擴展性、邊緣情況浮現，維護成本從20美元/月升至200美元/月。AI消除”從零到原型”門檻，但分發、運維、合規、品味成爲新稀缺。
SaaS沒有死去，它正在被重新分配：三場”Anthropic Day”定點打擊中間層SaaS：Cowork發佈致FactSet跌10%，COBOL博客致IBM跌13.2%（25年最大單日跌幅），Claude Design致Figma跌6.89%。受害者全是”把API包成帶收費UI”的單功能中間層。同一時期，Cursor估值從293億躍至500億美元，Skills目錄超2600個，平台層與自建層兩極壯大。計價單位從”按座位”遷向”按產出”。
做什麼和誰能做，開發者被雙向重定義：”做什麼”在變：開發者從”編寫者”轉爲”編排者”，Staff+工程師63.5%是最重度Agent用戶，判斷力與系統理解力成核心技能。”誰能做”也在變：非開發者首次以”構建者”身份進入，Epic Games超50%Claude Code使用來自非開發者，Skills讓非開發者10分鐘內用markdown寫出第一個Agent能力。就業在三層流動：底層初級編碼被壓縮，中層技術項目經理新增（LinkedIn+250%），高層架構與產品定義被槓桿化放大。

報告內容詳解

第一章質變時刻：兩道能力門檻與五維證據

第一道門檻（2024年中，Claude 3.5 Sonnet）：AI從輔助補全躍升爲可靠代碼生成助手，能力邊界從Copilot式行內補全擴展到Cursor式全棧寫作。
第二道門檻（2025年末-2026上半年，Opus 4.5/4.7）：從簡單任務輔助跨越到穩定自主協作，Opus 4.5首次在SWE-bench Verified突破80%（達80.9%），token消耗較上一代下降約65%。
五維證據匯聚：技術（SWE-bench突破）、產品（Plan Mode/多Agent/1M context）、用戶體驗（”Claude Christmas”現象）、意見領袖（Karpathy從”模型就是垃圾”轉爲”Opus 4.5強了10倍”）、商業（Claude Code ARR從零到25億美元，Anthropic估值3800億美元）。
METR逆轉：2025年初首次RCT顯示AI讓開發者慢19%，2026年2月後續實驗逆轉爲快18%（CI -38%到+9%），30-50%開發者拒絕”無AI”條件。

第二章模型與駕馭工程：趨同、分化與協同進化

商業趨同：六家頭部模型（Opus 4.5/4.6、Gemini 3.1 Pro、MiniMax M2.5、Kimi K2.6、GPT-5.4）在SWE-bench Verified上壓縮至1個百分點區間。
前沿分化：Opus 4.7一次性跳升6.8pp至87.6%，打破5個月趨同區間；Mythos Preview達93.9%但不公開，雙軌機制形成。
駕馭工程（Harness Engineering）：當模型趨同時，競爭力轉向駕馭框架。SWE-bench Pro上，scaffold變化導致的分數波動是模型更換的22倍。技能演進路徑從提示詞工程（2022-24）到上下文工程（2025）再到駕馭工程（2026）。
多Agent編排：從Sub-agents（一個大腦指揮手腳）到Agent Teams（一個團隊各司其職），Kimi K2.6推至300個sub-agents並行、12小時連續執行。
源碼泄漏啓發：2026年3月Claude Code意外暴露51.2萬行TypeScript源碼，揭示40+離散能力Tool System、KAIROS守護進程、autoDream記憶整合等設計。

第三章工具生態的重塑：Agent-First、CLI與Skills

Agent-First轉型：IDE定位從”代碼編輯器+AI插件”升級爲”Agent編排平台+代碼視圖”。Cursor 3.0推出Agents Window支持跨倉庫並行運行多Agent；OpenAI Codex App上線兩個半月周活達400萬。
CLI vs MCP：CLI對Agent是原生語言（訓練數據含海量shell命令），MCP需要額外抽象層。行業收斂到分層路由：CLI贏本地快速迭代（內循環），MCP贏企業跨系統協調（外循環）。
Skills生態：Agent Skills以文件夾（SKILL.md+可選腳本）作爲Agent”入職手冊”，採用漸進式披露按需加載。三層架構：Skills（SOP層，何時做/怎麼做）封裝MCP（集成層，連外部系統）與CLI（執行層，基礎設施操作）。Skills讓非開發者首次直接成爲Agent作者，生態一個季度翻倍至2600+ curated目錄。

第四章當構建不再稀缺：瓶頸遷移、原型牆與賽道消融

瓶頸遷移：過去瓶頸在”編寫實現”，AI消除後，瓶頸遷移到”定義規格”與”驗證維護”兩端。Karpathy提出Software 1.0（Code）→2.0（Weights）→3.0（Prompts/Specs）範式演進。
原型牆（Prototype Wall）：第一週興奮（AI快速生成MVP）→第三週擔憂（安全、擴展性浮現）→第二月放棄（維護成本超預期）。Addy Osmani提出”70%問題”：AI代碼看似70%正確，完成剩餘30%代價可能超過從頭手寫。
賽道消融：AI Coding作爲獨立品類邊界開始消融，編程能力（讀寫文件+執行命令+迭代修復）天然等於通用Agent能力棧。Claude Code→Agent SDK→Cowork→Channels路徑清晰，多入口（IDE/終端/IM/Web/桌面）匯聚。

第五章格局與安全：SaaS重新分配與三種新攻擊面

SaaS重新分配：中間層”複雜度封裝層”SaaS被衝擊，平台層（Cursor/Anthropic）與極簡自建層（Skills生態）兩極壯大。IDC預測純座位計費2028年前作廢，計價單位從”per seat”向”per outcome/consumption”遷移。
三種新攻擊面：LiteLLM供應鏈攻擊（AI工具本身成攻擊目標）、Axios npm供應鏈事件（舊範式+AI加速）、Vercel/Context.ai身份劫持（AI工具OAuth被入侵，攻擊者被AI顯著加速）。
攻防對稱下降：Nicholas Carlini用Claude Code發現Linux內核23年漏洞；Mythos Preview發現數千個零日漏洞（OpenBSD 27年TCP SACK漏洞發現成本不到50美元）。前沿實驗室採用”雙軌降權+身份驗證准入”新範式。

第六章面向未來：角色轉型、非開發者入場與就業流動

角色轉型：開發者從”編寫者”轉向”編排者”，時間分配向上游遷移（定義規格、設計約束、評估產出、管理協作）。Amjad Masad三象限：往下走（系統編程/嵌入式/安全關鍵）、留在中間（全棧/CRUD，最危險）、往上走（產品設計/商業策略）。
教育體系響應：Stanford開設”The Modern Software Developer”課程鼓勵學生不寫代碼；MIT開設”No Code and Agentic AI”專業課；62%美國大學CS招生下降但AI專業湧流。
非開發者入場：Epic Games超50%Claude Code使用來自非開發者；Block非工程師員工自建MCP服務器；Bolt.new 60-70%用戶非傳統開發者。
一人公司主流化：YC solo founder比例升至36.3%，”10人做100人的事”從預言變常態。Cursor 20人做到1億ARR，Bolt.new 15人2個月做到2000萬ARR。
就業三層流動：高層（架構/判斷力）價值上升，中層（管理Agent的技術項目經理）新增，底層（初級編碼）被壓縮。

報告結論

騰訊研究院《豐饒之後：AI Coding 觀察報告 2.0》指出，隨着Claude Opus 4.7等模型跨越自主協作門檻，AI Coding已進入代碼生成的豐饒時代，稀缺性從”如何編寫”遷移至”如何定義規格、驗證維護與持續運營”；開發者從編寫者轉爲編排者，非開發者借Skills首次以構建者身份入場，工具形態全面Agent-First化，SaaS中間層被重新分配爲平台層與極簡自建層兩極，而AI同時拉低攻防門檻使供應鏈安全面臨全新挑戰。