你可能在找的答案
- 蘋果 WWDC26 發布了什麼 AI 新功能?
- Siri Agent 和過去的 Siri 有什麼本質區別?
- Apple Intelligence 為什麼說「重新出發」而不是「升級」?
- Foundation Models 2.0 開發者能用它做什麼?
- 蘋果的隱私 AI 路線能在商業上打贏 OpenAI / Google 嗎?
2022 年 11 月,ChatGPT 上線。接下來整整三年,科技圈都在問同一個問題:蘋果在哪裡?
Siri 還是在問你「我可以幫你搜尋嗎?」,Bing Chat 已經能幫你寫週報;Google Gemini 深度整合進 Android,而 iPhone 用戶打開 Siri 依然是那顆熟悉的彩色球——然後它說「抱歉,我沒聽清楚」。
2024 年,蘋果發布 Apple Intelligence,承諾要「重新定義 Siri」。然後——延期。再延期。一些功能悄悄在 iOS 18.4 出現,再悄悄在 iOS 18.5 消失。
蘋果沒有贏下 AI 的上半場,這是事實。但 WWDC26,Tim Cook 和 Craig Federighi 站在台上,發布的不是一個補丁,而是一個完整的反擊宣言——Siri Agent、Foundation Models 2.0、Apple Intelligence 全面鋪開,以及一個關於隱私 AI 的長期主義押注。
這篇文章,我們從頭捋清楚:蘋果為何輸掉上半場,WWDC26 具體發布了什麼,以及它下一個十年想走的那條路,究竟是縮減戰線的保守主義,還是一場更大的賭注。
1 · 上半場:蘋果為何落後?
1.1 Siri 的結構性困境
Siri 在 2011 年就已推出,比 ChatGPT 早了整整 11 年。但早發布不等於早領先——Siri 的底層架構是「規則引擎 + 語音辨識 + API 橋接」的組合,而不是語言模型。這意味著它能做的事被事先寫死了:設鬧鐘、播音樂、查天氣。一旦你偏離這些場景,它就交出答案——「我在網頁上找到了一些結果」。
而 GPT-4 展示的是完全不同的能力:它能理解意圖、能推理、能跨上下文工作。這不是 Siri「落後一代」的問題,這是兩種根本不同的系統設計——一個是狀態機,一個是語言模型。
1.2 Apple Intelligence 的延期之謎
2024 WWDC 上,蘋果宣布 Apple Intelligence——設備端智慧、重寫的 Siri、ChatGPT 整合、Private Cloud Compute。發布會現場掌聲雷動。然後,大多數功能要等到 iOS 18.1、18.2、18.4……
延期的背後,還有一個結構性原因很少被討論:蘋果做 AI 的方式,天然比 OpenAI 慢。OpenAI 可以在伺服器端偷偷把模型換掉,用戶感受不到任何中斷;蘋果的每一次更新都必須通過 App Store 審查,都必須在 iOS 新版本裡出貨,都必須在四十億裝置上穩定運行——這是世界上最嚴苛的 AI 部署條件。
1.3 感知落差:輸掉了敘事,不一定輸掉了技術
這裡有一個容易被忽略的細節:蘋果的 Neural Engine 從 2017 年的 A11 就開始內建,比大多數 AI 玩家更早佈局邊緣 AI 硬體。M 系列晶片的 NPU 效能在業界處於頂尖水準。Foundation Models 的裝置端 3B 參數模型,能做的事情已經超過很多人的預期。
蘋果輸的,更多是「可見的 AI 產品體驗」——那些讓媒體截圖分享、讓用戶在朋友面前炫耀的時刻。輸掉上半場,不代表輸掉了未來的牌面。
2 · WWDC26 全解析:它實際發布了什麼?
2.1 Siri Agent:終於能「做事」而不只是「說話」
這是 WWDC26 最重要的一個轉變。過去的 Siri 是一個問答介面——你問,它答。新的 Siri Agent 是一個行動執行者——你說目標,它去完成。
核心能力的差距在於兩點:App 間行動串接,以及多步驟任務規劃。
| 能力 | 舊版 Siri | Siri Agent(WWDC26) |
|---|---|---|
| 任務類型 | 單一指令,結果即答 | 多步驟任務,自動拆解執行 |
| App 整合 | 限定 SiriKit 支援的 App | 透過 App Intents 跨 App 行動 |
| 個人上下文 | 基本:姓名、行事曆 | 深度:郵件、訊息、照片、健康資料 |
| 錯誤處理 | 失敗則放棄,建議用戶手動 | 中途卡住時詢問確認後繼續 |
| 推理引擎 | 規則樹 + 語音辨識 | 語言模型 + 計畫執行圖 |
具體的例子:你對著 Siri Agent 說「把昨天開會的錄音整理成待辦清單,發到工作群組,然後在日曆上幫我排明天的跟進會議」——這是一個跨越備忘錄、訊息、日曆三個 App 的四步驟任務。舊 Siri 面對這句話只能說「我幫你搜尋看看」;Siri Agent 會真的去執行它。
實現這個的底層機制是 App Intents 2.0——蘋果把系統內建 App 的幾百個「意圖」開放給 Siri Agent 呼叫,第三方開發者也可以透過 AppIntent 協定把自己 App 的核心動作暴露出來。Siri Agent 本質上是一個 LLM 驅動的 Intent 路由引擎,而 Intent 是它操作世界的手。
2.2 Apple Intelligence 全面鋪開:從「預覽」到「正式」
WWDC26 最直白的一個信號,是蘋果終於去掉了 Apple Intelligence 旁邊那個「Beta」標籤。這不只是一個詞的變化——這意味著蘋果認為它已經足夠穩定、足夠完整、足夠自信對外宣稱這是一個產品而非一個承諾。
具體落地的能力包括:
- Writing Tools 全語言支援:改寫、摘要、調整語氣,擴展到包括繁體中文、日文、韓文在內的 20+ 語言
- Image Playground 升級:從卡通風格擴展到更多畫風,新增「個人化 Genmoji」可基於你的聯絡人生成貼圖
- Photo Intelligence 增強:搜尋「去年夏天在海邊的照片」這種自然語言查詢,準確率大幅提升
- 通知摘要優化:解決了去年被廣泛批評的「摘要把新聞誤讀成標題黨」問題,新增重要度分層顯示
- 螢幕感知(Screen Awareness):Siri 現在能看懂你正在看什麼,並基於當前畫面回答問題或執行操作
2.3 Foundation Models 2.0:開發者的真正彈藥
去年的 Foundation Models 框架已經相當驚艷——零 token 費、無需 API Key、資料不離裝置。WWDC26 的 Foundation Models 2.0,在此基礎上走得更遠:
import FoundationModels
let session = LanguageModelSession()
// 新增:視覺理解(傳入圖片直接推理)
let image = UIImage(named: "receipt.jpg")!
let result = try await session.respond(
to: "幫我把這張發票的項目整理成 JSON",
including: [.image(image)]
)
// 新增:結構化輸出(直接返回 Swift Codable 物件)
struct Invoice: Codable {
let vendor: String
let total: Double
let items: [InvoiceItem]
}
let invoice = try await session.respond(
to: "解析發票",
including: [.image(image)],
generating: Invoice.self
)
核心升級點:
- 多模態支援:可直接傳入圖片,模型在裝置端完成視覺 + 語言聯合推理
- 結構化輸出:直接生成 Swift Codable 物件,不再需要手動解析 JSON 字串
- Streaming 回應:逐字流式輸出,適合需要即時顯示的對話場景
- 工具呼叫(Tool Calling):模型可在推理過程中呼叫你定義的函式,完成 Agent 式任務
- Python SDK + fm CLI:開放非 Swift 語言接入,腳本、後端工具都可調用
- 框架開源:Foundation Models 框架本身在 GitHub 開源,社群可貢獻
| 能力 | Foundation Models(2025) | Foundation Models 2.0(WWDC26) |
|---|---|---|
| 語言理解 | ✓ 文字輸入 | ✓ 文字 + 圖片輸入 |
| 輸出格式 | 純文字字串 | 文字 / JSON / Swift Codable |
| 輸出方式 | 等待完成後返回 | Streaming 逐字輸出 |
| Agent 能力 | 無 | Tool Calling 框架 |
| 語言支援 | Swift only | Swift + Python SDK + CLI |
| 開源狀態 | 閉源 | 框架開源 |
2.4 Private Cloud Compute 2.0:雲端推論也能做到隱私可驗證
對需要比裝置端 3B 模型更強能力的任務,蘋果的答案不是「就送給 OpenAI 吧」,而是 Private Cloud Compute(PCC)——一個蘋果自己運營的雲端推論叢集,專為 AI 任務設計,但對隱私的承諾與裝置端相同。
PCC 2.0 的關鍵改進:Security Research Virtual Machine——任何安全研究者都可以申請啟動一個 PCC 節點的虛擬機器複製,用於驗證蘋果的隱私聲明是否屬實。這是對外說「trust but verify」的最強表達:不要相信我的說法,自己去驗證我的程式碼。
2.5 macOS 26 Tahoe × iOS 26:AI 滲透系統每一層
WWDC26 還宣布了 macOS 26 Tahoe 和 iOS 26,AI 不再是一個獨立的「功能模組」,而是滲透進作業系統的每一層:
- Xcode 27 本機補全:多行程式補全在 Apple Silicon 本機執行,不走雲端
- Safari 智慧摘要:網頁摘要在裝置端生成,不上傳給任何伺服器
- Finder 語意搜尋:「找上個月那個和財報有關的 Excel」——自然語言查本機檔案
- 郵件智慧起草:基於你的歷史郵件風格生成回覆,完全離線
- 健康 App AI 教練:基於你的健康資料給出個人化建議,資料一律不離裝置
圖 1 · Apple Intelligence 架構分層:從裝置端到 PCC,再到第三方 AI
3 · 戰略解析:蘋果在押注什麼?
3.1 隱私作為護城河,而不是行銷口號
理解蘋果 AI 戰略的關鍵,是把「隱私」從一個品牌標語還原成一個商業壁壘。
OpenAI 和 Google 在 AI 賽道的優勢是:大量資料、大量算力、快速迭代。蘋果沒有辦法在前兩項上追上——它沒有那麼多 AI 用戶資料,也沒有那麼多 A100 / H100。它選擇的是另一條曲線:把最強的 AI 能力搬到裝置端,讓「資料不需要上雲」本身成為特性,而不是限制。
這個選擇的副產品,是一個 OpenAI 很難複製的護城河:你無法在租用的伺服器上做到真正的「用戶資料不離裝置」。這個架構優勢,隨著 AI 法規(GDPR 執行、各國資料主權法)的收緊,只會變得越來越值錢。
3.2 生態鎖定:AI 功能 × Apple Silicon × App 生態
WWDC26 的一個精心設計:幾乎所有新 AI 功能都需要 A17 Pro 以上或 M 系列晶片才能完整運行。這是一個清晰的升級換機驅動力——想用 Siri Agent?換 iPhone 17。想在 Mac 上跑 Foundation Models 2.0 本機推理?M 系列的效能優勢非常明顯。
同時,App Intents 的深度整合,讓整個 iOS / macOS 生態的 App 開發者都必須跟上——接入 App Intents 的 App 獲得 Siri Agent 的自然曝光,不接入的 App 逐漸被邊緣化。這是蘋果慣常的生態治理手法:用功能引導開發者,而不是強制命令。
3.3 長期主義的賭注:OS-level AI vs API-level AI
OpenAI、Anthropic、Google DeepMind 的路線,本質上是提供「AI 即服務」——你呼叫它們的 API,支付每百萬 token 的費用,享受最強的模型能力。這個模式在 2025~2026 年的商業化非常成功,但它有一個根本性的脆弱點:任何人都可以替換 API——包括蘋果。
蘋果的賭注是:把 AI 做成作業系統的一部分,而不是一個可替換的服務。Siri Agent 對裝置上下文的感知,Foundation Models 對 NPU 的深度整合,PCC 對 Secure Enclave 的架構依賴——這些都在讓「蘋果的 AI」越來越難被第三方替換。
4 · 開發者視角:WWDC26 改變了什麼?
4.1 App Intents 從「可選」到「必選」
如果你在維護一個 iOS App,WWDC26 之後有一件事值得立刻排進 backlog:審查你的核心功能,哪些可以暴露為 App Intent。
Siri Agent 的能力邊界 = 已接入 App Intents 的動作集合。每一個你暴露的 Intent,都是一個 Siri Agent 可以幫用戶完成的動作。用戶說「幫我在 [你的 App] 裡做 X」,如果你沒有 Intent,Siri 只能說「抱歉,這個 App 還不支援」。
import AppIntents
struct CreateNoteIntent: AppIntent {
static var title: LocalizedStringResource = "建立新筆記"
static var description = IntentDescription("在 App 中建立一則新筆記")
@Parameter(title: "內容") var content: String
func perform() async throws -> some IntentResult {
// 你的業務邏輯
let note = NoteService.create(content: content)
return .result(value: note.id)
}
}
4.2 Foundation Models 2.0 的實際使用場景
有了多模態、結構化輸出和 Tool Calling,Foundation Models 2.0 的可用場景大幅擴展:
| 場景 | 實作方式 | 適合層級 |
|---|---|---|
| 發票 / 收據解析 | 拍照 → 圖片輸入 → 結構化 JSON 輸出 | 裝置端完成,零 API 費 |
| 本地文件摘要 | PDF 文字 → 裝置端摘要 → Streaming 顯示 | 裝置端完成,隱私可保 |
| 智慧表單填寫 | 自然語言輸入 → 解析為 Codable 物件填表 | 裝置端完成,UX 大幅提升 |
| 醫療 / 健康資料分析 | HealthKit 資料 → 裝置端推理 → 個人化建議 | 必須裝置端,法規要求 |
| 企業內部文件搜尋 | 語意搜尋 + Tool Calling 查詢本地資料庫 | 裝置端 + PCC,資料不出企業 |
4.3 開發環境的新挑戰:Xcode 27 + iOS 26 SDK 的版本釘定
所有這些新功能,都依賴 Xcode 27 和 iOS 26 SDK。這意味著你的建置環境需要跟上——而這是真正麻煩的地方。
Foundation Models 2.0 的 API 在模擬器和真機上行為不同;Siri Agent 的 App Intent 整合需要特定版本的 Xcode 才能正確索引;PCC 的整合測試需要特定的 entitlement。如果你的 CI 環境跑在 GitHub hosted runner 上,你正在等待一個不確定的 Xcode 27 支援時間表——而如果你的 CI 跑在 Cloud Mac 上,你可以在 WWDC26 結束後幾小時內就把環境更新到 Xcode 27 beta。
5 · 未來十年的棋局
5.1 監管的順風:隱私法規讓蘋果的架構越來越值錢
2026 年,全球 AI 監管正在加速:歐盟 AI Act 進入執行期,美國多州相繼通過 AI 透明度法案,中國的 AI 生成內容管理辦法持續更新。在這個監管環境裡,「能通過審計的隱私架構」越來越稀缺,越來越值錢。
蘋果的 PCC 可驗證架構、Foundation Models 的裝置端設計、Differential Privacy 在健康資料上的應用——這些在消費市場可能只是品牌加分項,但在企業市場、醫療市場、金融市場,這些是合規採購的門票。
5.2 硬體 × 軟體協同:其他人很難複製的飛輪
一個很少被討論的現實:蘋果是這個星球上唯一同時設計 AI 晶片、AI 作業系統、AI 應用框架和 AI 終端裝置的公司。Google 設計 TPU 但 Pixel 不是主流裝置;Qualcomm 設計 NPU 但它不做軟體;Microsoft 做 AI 軟體但依賴第三方硬體。
這個垂直整合,讓蘋果可以做很多其他人做不到的優化:Foundation Models 的推理路徑可以直接針對 Neural Engine 的指令集調優;Siri Agent 的回應延遲可以壓到 50ms 以內,因為底層硬體和軟體是同一個團隊設計的。
5.3 開源訊號:Framework 開源是信任建設,也是生態引力
Foundation Models 框架開源,是 WWDC26 被低估的一個訊號。蘋果不是一個習慣開源的公司——它的核心優勢一直是封閉生態的高品質控制。選擇在這個時機開源 Foundation Models,更多是一個信任建設動作:讓外部研究者、企業客戶的安全團隊可以審計它,而不只是相信它的說法。
這也是一個生態引力建設:開源的框架吸引研究者,研究者發表論文,論文引用帶來更多開發者採用,更多採用帶來更豐富的第三方 App,更豐富的 App 讓 Siri Agent 變得更強大。這是 Apple Silicon + Swift 生態的重演,只是這次在 AI 層面。
6 · 客觀評估:蘋果真的贏得了下半場嗎?
我不想在這裡給出一個過度樂觀或過度悲觀的結論。讓我們看幾個真實的挑戰:
6.1 蘋果面對的真實挑戰
- 裝置端模型的天花板很真實:3B 參數模型在複雜推理、程式生成、長上下文任務上,和 GPT-5.5 / Claude Opus 4 的差距是結構性的。Siri Agent 做得了「把會議紀錄整理成待辦清單」,做不了「幫我重構這個 Swift 專案的架構」。
- 第三方 App 整合需要時間:App Intents 的生態建設,依賴第三方開發者配合。WWDC26 發布後,要等到有足夠多的 App 支援 Siri Agent 的深度整合,可能需要 6~18 個月。
- 非英語市場的體驗仍有差距:繁體中文、日語、韓語的自然語言理解在 WWDC26 有改進,但對話流暢度和英語版本的差距仍然明顯。
- 用戶習慣的遷移需要教育:大多數用戶已經習慣去 ChatGPT 或其他 AI 應用完成複雜任務。讓他們轉而信任 Siri Agent,需要一段時間的行為改變。
6.2 蘋果可能贏的地方
然而,有幾個維度蘋果確實建立了真實優勢:
隱私敏感場景:醫療、法務、財務、企業內部資料——這些場景的用戶寧願用能力弱一點、但確保資料不離裝置的 AI,也不願意把敏感資料送到 OpenAI 的伺服器。隨著這類場景的 AI 採用率提升,蘋果的市場份額會自然增長。
日常高頻低複雜度任務:摘要、翻譯、改寫、分類——這些任務佔 AI 使用量的大頭,但不需要 GPT-5.5 等級的智慧。裝置端 Foundation Models 完全夠用,且延遲更低、費用為零。對日常使用者,「足夠好且免費」往往比「最強但按量計費」更有吸引力。
作業系統整合的深度:Siri Agent 讀取你的日曆、郵件、訊息、照片的能力,任何第三方 AI App 都做不到——蘋果不開放這些 API 給競爭對手。這個系統整合的護城河,短期內無人能複製。
7 · FAQ
Siri Agent 現在能做 ChatGPT 能做的事嗎?
不能完全替代,但目標場景不同。ChatGPT 的強項是「開放域推理、程式生成、複雜創作」;Siri Agent 的強項是「深度整合裝置上下文、跨 App 執行任務、隱私敏感操作」。理想的用法是配合使用,而不是二選一:Siri Agent 管理你的裝置和生活,ChatGPT 幫你做複雜的思考和創作工作。
Foundation Models 2.0 適合我的 App 嗎?
如果你的 App 有以下任何需求,非常適合:需要處理用戶隱私資料(健康、財務、個人文件)、需要高頻低延遲的 AI 功能(每次用戶輸入都觸發)、希望 AI 功能在離線狀態也可用、想控制 AI 功能的邊際成本(規模擴大後零費用)。不適合的場景是:需要即時聯網搜尋、需要生成超長文件、需要頂尖的程式碼生成能力。
沒有 Apple Silicon 的裝置還能用 Apple Intelligence 嗎?
部分功能可以。完整的 Foundation Models 2.0 裝置端推理需要 A17 Pro(iPhone 15 Pro)以上或 M1 以上 Mac / iPad。較老裝置可以透過 PCC 享受部分 Apple Intelligence 功能,但需要網路連線,且功能集合較少。Fallback 策略對支援舊裝置的 App 來說是必須實作的。
WWDC26 之後我該立刻動 App 嗎?
不必恐慌,但有幾件事值得現在就開始排期:(1)評估哪些功能可以接入 App Intents——這是 Siri Agent 時代的流量入口;(2)規劃 Foundation Models 2.0 的 PoC——找一個邊際成本高、隱私要求高的功能做試驗;(3)更新 CI 環境到 Xcode 27——建議用 Cloud Mac 確保環境版本釘定,避免 GitHub hosted runner 的版本不確定性。
和 VPSSpark Cloud Mac 有什麼關係?
WWDC26 發布的這些功能需要 Xcode 27 + iOS 26 SDK 才能完整開發和測試。Cloud Mac 提供固定版本的 macOS + Xcode 環境,讓你的 CI 在 WWDC 後的頭幾週就能穩定跑在最新 SDK 上,而不是等待 GitHub hosted runner 不確定的更新時程。Siri Agent 的 App Intent 整合、Foundation Models 2.0 的多模態 API,都可以在 Cloud Mac 的 Xcode 27 環境裡立刻開始實驗。
收束:蘋果想贏的那場戰爭,和你想的不一樣
上半場,蘋果輸掉的是一場「誰的聊天機器人最聰明」的競賽。這場競賽,它沒有辦法贏,也選擇了不去贏。
它想贏的下半場,問題是:當 AI 無處不在、能力已經足夠,誰的 AI 最值得信任、最深度融入你的生活?
這個問題沒有一個快速的答案,也沒有一個明確的評分指標——不像「誰的 MMLU 分數更高」那樣一目瞭然。但這恰恰是蘋果選擇這個戰場的原因:在一個沒有快速評分指標的競爭裡,先發優勢讓位於長期信任的積累,而信任是它最擅長建立的東西。
蘋果沒有贏下 AI 的上半場,但 WWDC26 顯示它至少弄清楚了自己想打的是什麼球。接下來五年,這個押注是否成立——歡迎再來聊。
WWDC26 之後:先釘住 Xcode 27 環境,再談 AI 功能開發
若你正在把 Siri Agent App Intents 或 Foundation Models 2.0 接進 App,同時需要固定 Xcode 27 / iOS 26 建置環境,VPSSpark Cloud Mac 可作為開發與 CI 的 macOS 執行底座——在 WWDC26 後幾小時內更新到最新 beta SDK,讓你領先隊友一個身位。
了解 Cloud Mac 方案,讓 Apple Intelligence 開發從第一天就跑在穩定環境上。