【技術解析】Google Jules:非副駕駛的異步 AI 程式碼特工
深入解析 Google Labs 推出的 Jules 編碼 Agent:與 Copilot、Claude Code、Cursor 的核心差異,異步執行、Cloud VM 隔離、Audio Changelog 等特色,以及它對未來軟體開發的意義。
這篇文章在說什麼
2025 年中,Google Labs 正式向公眾推出了一款命名致敬漫畫《洞穴》的編碼 Agent:Jules。這不是一個傳統意義上的副駕駛(Copilot),也不是一個簡單的程式碼補完工具,而是一個能夠異步接管整個代碼庫、獨立執行多步任務、完成後主動呈現計劃與 diff 的自主 Agent。
本文的核心命題是:Jules 的「異步、自主、隔離 VM」這三個設計決策,讓它與 GitHub Copilot、Claude Code、Cursor 等產品走向了截然不同的路線。適合深入分析這三個設計抉擇背後的權衡與它對開發者工作流的實際影響。
為什麼重要
Copilot 與 Agent 是兩條不同的路線
過去兩年,AI 輔助程式設計的主流是「副駕駛」模式:工具即時在編輯器中提供建議,人類主導,AI 輔助。但 Agent 路線(以 Claude Code、Cursor 為代表)已經走向了另一個方向:AI 獲得更多自主權,人類退居審批者。
Jules 是 Google 對這個路線的正式回應。它的核心差異不是能力強不強,而是工作模式:Jules 是完全異步的,運行在隔離的 Google Cloud VM 裡,你可以在它工作的同時繼續寫代碼,任務完成後才來審批。
為什麼「異步」是關鍵突破
傳統的 Copilot 體驗有一個根本限制:你在等 AI。每一個建議都要立刻呈現,這限制了 AI 能夠進行的推理深度。
Jules 的解法是:把任務丟進雲端 VM,AI 在雲端運算,你去做其他事,結束後回來看 diff。這改變了「人機協作」的時間結構。
技術細節
架構:隔離 VM + Gemini 2.5 Pro
Jules 背後的核心架構是:
- 運行環境:Google Cloud 虛擬機,完全隔離,不會拿你的代碼訓練模型
- 模型:Gemini 2.5 Pro,處理複雜的多檔案變更推理
- 整合方式:直接接入 GitHub,創建 branch,提交 PR,全程不需要 clone 本地
核心能力
| 能力 | 說明 |
|---|---|
| 異步執行 | 任務在雲端 VM 運行,不影響本地開發流程 |
| 完整上下文 | 不是片段補完,而是理解整個代碼庫再行動 |
| 多線程並發 | 可同時處理多個任務請求 |
| 音頻 Changelog | 將提交歷史轉化為可聆聽的音頻摘要 |
| PR 生成 | 直接在 GitHub 上創建 branch 和 PR |
| 隱私隔離 | 默認不拿私人代碼訓練,數據在 VM 內隔離 |
與主要競品的功能對比
| 維度 | Jules | Claude Code | Cursor | Copilot |
|---|---|---|---|---|
| 運行模式 | 雲端 VM 異步 | 本地/遠端 | 本地 IDE | 編輯器內嵌 |
| 上下文範圍 | 整個代碼庫 | 整個代碼庫 | 聊天上下文 | 當前檔案 |
| 任務類型 | 多檔案變更 | 多檔案變更 | 多檔案變更 | 片段補完 |
| 模型 | Gemini 2.5 Pro | Claude | GPT-4o/Claude | GPT-4o |
| 隱私模式 | ✅ 完全隔離 | ✅ | ✅ | ⚠️ 訓練爭議 |
| 定價 | Beta 免費,未來收費 | $20/月 | $20/月 | $10/月 |
我的觀點
異步模式的長期價值被低估
市場上對 Jules 的討論大多集中在「能力強不強」,但我認為它真正的價值在於改變了人機協作的本質。過去所有的 AI 工具——Copilot、Cursor、Claude Code——本質上都是「你做一步,AI 做一步」的同步模式。你仍然要不斷回應 AI 的請求,你的注意力仍然是稀缺資源。
Jules 把 AI 變成了一個「你派任務的員工」——你描述需求,AI 在雲端幹活,你審批結果。這在某種意義上更接近傳統軟體外包,只是這個外包商不會忘記你的代碼庫上下文。
Gemini 2.5 Pro 的選擇是低調的關鍵
Jules 沒有選擇最強的旗艦模型,而是用 Gemini 2.5 Pro,這個決策背後是有道理的:這個模型在長上下文推理」和代碼生成」之間取得了更好的平衡,而且成本比旗艦模型低,對一個要承擔後台計算的商業產品來說,這是合理的工程決策。
需要觀望的地方
- Beta 後的定價策略:如果收費高於 Claude Code 和 Cursor,而能力沒有顯著碾壓,用戶為什麼要轉移?
- GitHub 整合深度:目前 Jules 的整合主要在 PR 等環節,但開發者日常更多在本地 IDE,如果不能無縫接入日常編碼體驗,採用摩擦會很大。
- 音頻 Changelog 的實用性:這是一個新穎的功能,但多數開發者是否真的需要「聽」代碼變更而不是「看」diff,還需要市場驗證。