蘋果沒有贏下 AI 上半場，但它想贏下未來十年

你可能在找的答案

蘋果 WWDC26 發布了什麼 AI 新功能？
Siri Agent 和過去的 Siri 有什麼本質區別？
Apple Intelligence 為什麼說「重新出發」而不是「升級」？
Foundation Models 2.0 開發者能用它做什麼？
蘋果的隱私 AI 路線能在商業上打贏 OpenAI / Google 嗎？

2022 年 11 月，ChatGPT 上線。接下來整整三年，科技圈都在問同一個問題：蘋果在哪裡？

Siri 還是在問你「我可以幫你搜尋嗎？」，Bing Chat 已經能幫你寫週報；Google Gemini 深度整合進 Android，而 iPhone 用戶打開 Siri 依然是那顆熟悉的彩色球——然後它說「抱歉，我沒聽清楚」。

2024 年，蘋果發布 Apple Intelligence，承諾要「重新定義 Siri」。然後——延期。再延期。一些功能悄悄在 iOS 18.4 出現，再悄悄在 iOS 18.5 消失。

蘋果沒有贏下 AI 的上半場，這是事實。但 WWDC26，Tim Cook 和 Craig Federighi 站在台上，發布的不是一個補丁，而是一個完整的反擊宣言——Siri Agent、Foundation Models 2.0、Apple Intelligence 全面鋪開，以及一個關於隱私 AI 的長期主義押注。

這篇文章，我們從頭捋清楚：蘋果為何輸掉上半場，WWDC26 具體發布了什麼，以及它下一個十年想走的那條路，究竟是縮減戰線的保守主義，還是一場更大的賭注。

1 · 上半場：蘋果為何落後？

1.1 Siri 的結構性困境

Siri 在 2011 年就已推出，比 ChatGPT 早了整整 11 年。但早發布不等於早領先——Siri 的底層架構是「規則引擎 + 語音辨識 + API 橋接」的組合，而不是語言模型。這意味著它能做的事被事先寫死了：設鬧鐘、播音樂、查天氣。一旦你偏離這些場景，它就交出答案——「我在網頁上找到了一些結果」。

而 GPT-4 展示的是完全不同的能力：它能理解意圖、能推理、能跨上下文工作。這不是 Siri「落後一代」的問題，這是兩種根本不同的系統設計——一個是狀態機，一個是語言模型。

1.2 Apple Intelligence 的延期之謎

2024 WWDC 上，蘋果宣布 Apple Intelligence——設備端智慧、重寫的 Siri、ChatGPT 整合、Private Cloud Compute。發布會現場掌聲雷動。然後，大多數功能要等到 iOS 18.1、18.2、18.4……

為什麼會一再延期？

三個原因疊加：（1）硬體門檻——只有 A17 Pro 以上才能在裝置端跑模型，需要等待足夠的設備滲透率；（2）隱私審查——Private Cloud Compute 的安全架構需要通過外部審計，不能急；（3）多語言難題——非英語市場的自然語言理解是真正的難題，中文、日語、韓語的複雜性遠超預期。

延期的背後，還有一個結構性原因很少被討論：蘋果做 AI 的方式，天然比 OpenAI 慢。OpenAI 可以在伺服器端偷偷把模型換掉，用戶感受不到任何中斷；蘋果的每一次更新都必須通過 App Store 審查，都必須在 iOS 新版本裡出貨，都必須在四十億裝置上穩定運行——這是世界上最嚴苛的 AI 部署條件。

1.3 感知落差：輸掉了敘事，不一定輸掉了技術

這裡有一個容易被忽略的細節：蘋果的 Neural Engine 從 2017 年的 A11 就開始內建，比大多數 AI 玩家更早佈局邊緣 AI 硬體。M 系列晶片的 NPU 效能在業界處於頂尖水準。Foundation Models 的裝置端 3B 參數模型，能做的事情已經超過很多人的預期。

蘋果輸的，更多是「可見的 AI 產品體驗」——那些讓媒體截圖分享、讓用戶在朋友面前炫耀的時刻。輸掉上半場，不代表輸掉了未來的牌面。

2017

A11 首搭 Neural Engine

40億+

Apple 活躍裝置數

裝置端模型參數量

2 · WWDC26 全解析：它實際發布了什麼？

2.1 Siri Agent：終於能「做事」而不只是「說話」

這是 WWDC26 最重要的一個轉變。過去的 Siri 是一個問答介面——你問，它答。新的 Siri Agent 是一個行動執行者——你說目標，它去完成。

核心能力的差距在於兩點：App 間行動串接，以及多步驟任務規劃。

能力	舊版 Siri	Siri Agent（WWDC26）
任務類型	單一指令，結果即答	多步驟任務，自動拆解執行
App 整合	限定 SiriKit 支援的 App	透過 App Intents 跨 App 行動
個人上下文	基本：姓名、行事曆	深度：郵件、訊息、照片、健康資料
錯誤處理	失敗則放棄，建議用戶手動	中途卡住時詢問確認後繼續
推理引擎	規則樹 + 語音辨識	語言模型 + 計畫執行圖

具體的例子：你對著 Siri Agent 說「把昨天開會的錄音整理成待辦清單，發到工作群組，然後在日曆上幫我排明天的跟進會議」——這是一個跨越備忘錄、訊息、日曆三個 App 的四步驟任務。舊 Siri 面對這句話只能說「我幫你搜尋看看」；Siri Agent 會真的去執行它。

實現這個的底層機制是 App Intents 2.0——蘋果把系統內建 App 的幾百個「意圖」開放給 Siri Agent 呼叫，第三方開發者也可以透過 AppIntent 協定把自己 App 的核心動作暴露出來。Siri Agent 本質上是一個 LLM 驅動的 Intent 路由引擎，而 Intent 是它操作世界的手。

開發者視角：App Intents 是護城河

Siri Agent 的能力邊界，直接等於「已接入 App Intents 的 App 的能力總和」。這意味著接入 App Intents 的 App，將在 Siri Agent 的使用中獲得自然的曝光和調用——對 iOS 開發者來說，適配 App Intents 不再是錦上添花，而是不能缺席的流量入口。

2.2 Apple Intelligence 全面鋪開：從「預覽」到「正式」

WWDC26 最直白的一個信號，是蘋果終於去掉了 Apple Intelligence 旁邊那個「Beta」標籤。這不只是一個詞的變化——這意味著蘋果認為它已經足夠穩定、足夠完整、足夠自信對外宣稱這是一個產品而非一個承諾。

具體落地的能力包括：

Writing Tools 全語言支援：改寫、摘要、調整語氣，擴展到包括繁體中文、日文、韓文在內的 20+ 語言
Image Playground 升級：從卡通風格擴展到更多畫風，新增「個人化 Genmoji」可基於你的聯絡人生成貼圖
Photo Intelligence 增強：搜尋「去年夏天在海邊的照片」這種自然語言查詢，準確率大幅提升
通知摘要優化：解決了去年被廣泛批評的「摘要把新聞誤讀成標題黨」問題，新增重要度分層顯示
螢幕感知（Screen Awareness）：Siri 現在能看懂你正在看什麼，並基於當前畫面回答問題或執行操作

2.3 Foundation Models 2.0：開發者的真正彈藥

去年的 Foundation Models 框架已經相當驚艷——零 token 費、無需 API Key、資料不離裝置。WWDC26 的 Foundation Models 2.0，在此基礎上走得更遠：

Swift · Foundation Models 2.0 多模態

import FoundationModels

let session = LanguageModelSession()

// 新增：視覺理解（傳入圖片直接推理）
let image = UIImage(named: "receipt.jpg")!
let result = try await session.respond(
    to: "幫我把這張發票的項目整理成 JSON",
    including: [.image(image)]
)

// 新增：結構化輸出（直接返回 Swift Codable 物件）
struct Invoice: Codable {
    let vendor: String
    let total: Double
    let items: [InvoiceItem]
}

let invoice = try await session.respond(
    to: "解析發票",
    including: [.image(image)],
    generating: Invoice.self
)

核心升級點：

多模態支援：可直接傳入圖片，模型在裝置端完成視覺 + 語言聯合推理
結構化輸出：直接生成 Swift Codable 物件，不再需要手動解析 JSON 字串
Streaming 回應：逐字流式輸出，適合需要即時顯示的對話場景
工具呼叫（Tool Calling）：模型可在推理過程中呼叫你定義的函式，完成 Agent 式任務
Python SDK + fm CLI：開放非 Swift 語言接入，腳本、後端工具都可調用
框架開源：Foundation Models 框架本身在 GitHub 開源，社群可貢獻

能力	Foundation Models（2025）	Foundation Models 2.0（WWDC26）
語言理解	✓ 文字輸入	✓ 文字 + 圖片輸入
輸出格式	純文字字串	文字 / JSON / Swift Codable
輸出方式	等待完成後返回	Streaming 逐字輸出
Agent 能力	無	Tool Calling 框架
語言支援	Swift only	Swift + Python SDK + CLI
開源狀態	閉源	框架開源

2.4 Private Cloud Compute 2.0：雲端推論也能做到隱私可驗證

對需要比裝置端 3B 模型更強能力的任務，蘋果的答案不是「就送給 OpenAI 吧」，而是 Private Cloud Compute（PCC）——一個蘋果自己運營的雲端推論叢集，專為 AI 任務設計，但對隱私的承諾與裝置端相同。

PCC 2.0 的關鍵改進：Security Research Virtual Machine——任何安全研究者都可以申請啟動一個 PCC 節點的虛擬機器複製，用於驗證蘋果的隱私聲明是否屬實。這是對外說「trust but verify」的最強表達：不要相信我的說法，自己去驗證我的程式碼。

這為什麼是一個競爭優勢而不只是功能點

OpenAI / Google 的雲端 AI 從設計上就無法做到「不保留用戶輸入」——他們的商業模式依賴資料。蘋果的 PCC 是讓「不留資料」這件事在技術架構上可驗證，而不只是在隱私政策裡承諾。對企業客戶、醫療、法務、金融場景，這是真正有價值的差異。

2.5 macOS 26 Tahoe × iOS 26：AI 滲透系統每一層

WWDC26 還宣布了 macOS 26 Tahoe 和 iOS 26，AI 不再是一個獨立的「功能模組」，而是滲透進作業系統的每一層：

Xcode 27 本機補全：多行程式補全在 Apple Silicon 本機執行，不走雲端
Safari 智慧摘要：網頁摘要在裝置端生成，不上傳給任何伺服器
Finder 語意搜尋：「找上個月那個和財報有關的 Excel」——自然語言查本機檔案
郵件智慧起草：基於你的歷史郵件風格生成回覆，完全離線
健康 App AI 教練：基於你的健康資料給出個人化建議，資料一律不離裝置

圖 1 · Apple Intelligence 架構分層：從裝置端到 PCC，再到第三方 AI

裝置端 Foundation Models 2.03B 參數 · 零邊際費 · 資料不離裝置

Private Cloud Compute 2.0蘋果自有雲 · 可驗證隱私承諾 · 不保留用戶輸入

第三方 AI（ChatGPT / 其他）需用戶明確授權 · 顯示明確隱私提示

3 · 戰略解析：蘋果在押注什麼？

3.1 隱私作為護城河，而不是行銷口號

理解蘋果 AI 戰略的關鍵，是把「隱私」從一個品牌標語還原成一個商業壁壘。

OpenAI 和 Google 在 AI 賽道的優勢是：大量資料、大量算力、快速迭代。蘋果沒有辦法在前兩項上追上——它沒有那麼多 AI 用戶資料，也沒有那麼多 A100 / H100。它選擇的是另一條曲線：把最強的 AI 能力搬到裝置端，讓「資料不需要上雲」本身成為特性，而不是限制。

這個選擇的副產品，是一個 OpenAI 很難複製的護城河：你無法在租用的伺服器上做到真正的「用戶資料不離裝置」。這個架構優勢，隨著 AI 法規（GDPR 執行、各國資料主權法）的收緊，只會變得越來越值錢。

3.2 生態鎖定：AI 功能 × Apple Silicon × App 生態

WWDC26 的一個精心設計：幾乎所有新 AI 功能都需要 A17 Pro 以上或 M 系列晶片才能完整運行。這是一個清晰的升級換機驅動力——想用 Siri Agent？換 iPhone 17。想在 Mac 上跑 Foundation Models 2.0 本機推理？M 系列的效能優勢非常明顯。

同時，App Intents 的深度整合，讓整個 iOS / macOS 生態的 App 開發者都必須跟上——接入 App Intents 的 App 獲得 Siri Agent 的自然曝光，不接入的 App 逐漸被邊緣化。這是蘋果慣常的生態治理手法：用功能引導開發者，而不是強制命令。

3.3 長期主義的賭注：OS-level AI vs API-level AI

OpenAI、Anthropic、Google DeepMind 的路線，本質上是提供「AI 即服務」——你呼叫它們的 API，支付每百萬 token 的費用，享受最強的模型能力。這個模式在 2025～2026 年的商業化非常成功，但它有一個根本性的脆弱點：任何人都可以替換 API——包括蘋果。

蘋果的賭注是：把 AI 做成作業系統的一部分，而不是一個可替換的服務。Siri Agent 對裝置上下文的感知，Foundation Models 對 NPU 的深度整合，PCC 對 Secure Enclave 的架構依賴——這些都在讓「蘋果的 AI」越來越難被第三方替換。

核心觀點

蘋果輸掉的是「誰的模型最強」的競賽。但它押注的問題是：當 AI 能力足夠好，「隱私可驗證的 OS 級 AI」是否比「最強但需要上雲的 API 級 AI」更有長期價值？這個問題，在 2026 年還沒有答案，但五年後可能清晰得多。

4 · 開發者視角：WWDC26 改變了什麼？

4.1 App Intents 從「可選」到「必選」

如果你在維護一個 iOS App，WWDC26 之後有一件事值得立刻排進 backlog：審查你的核心功能，哪些可以暴露為 App Intent。

Siri Agent 的能力邊界 = 已接入 App Intents 的動作集合。每一個你暴露的 Intent，都是一個 Siri Agent 可以幫用戶完成的動作。用戶說「幫我在 [你的 App] 裡做 X」，如果你沒有 Intent，Siri 只能說「抱歉，這個 App 還不支援」。

Swift · 定義一個 App Intent（最小範例）

import AppIntents

struct CreateNoteIntent: AppIntent {
    static var title: LocalizedStringResource = "建立新筆記"
    static var description = IntentDescription("在 App 中建立一則新筆記")

    @Parameter(title: "內容") var content: String

    func perform() async throws -> some IntentResult {
        // 你的業務邏輯
        let note = NoteService.create(content: content)
        return .result(value: note.id)
    }
}

4.2 Foundation Models 2.0 的實際使用場景

有了多模態、結構化輸出和 Tool Calling，Foundation Models 2.0 的可用場景大幅擴展：

場景	實作方式	適合層級
發票 / 收據解析	拍照 → 圖片輸入 → 結構化 JSON 輸出	裝置端完成，零 API 費
本地文件摘要	PDF 文字 → 裝置端摘要 → Streaming 顯示	裝置端完成，隱私可保
智慧表單填寫	自然語言輸入 → 解析為 Codable 物件填表	裝置端完成，UX 大幅提升
醫療 / 健康資料分析	HealthKit 資料 → 裝置端推理 → 個人化建議	必須裝置端，法規要求
企業內部文件搜尋	語意搜尋 + Tool Calling 查詢本地資料庫	裝置端 + PCC，資料不出企業

4.3 開發環境的新挑戰：Xcode 27 + iOS 26 SDK 的版本釘定

所有這些新功能，都依賴 Xcode 27 和 iOS 26 SDK。這意味著你的建置環境需要跟上——而這是真正麻煩的地方。

Foundation Models 2.0 的 API 在模擬器和真機上行為不同；Siri Agent 的 App Intent 整合需要特定版本的 Xcode 才能正確索引；PCC 的整合測試需要特定的 entitlement。如果你的 CI 環境跑在 GitHub hosted runner 上，你正在等待一個不確定的 Xcode 27 支援時間表——而如果你的 CI 跑在 Cloud Mac 上，你可以在 WWDC26 結束後幾小時內就把環境更新到 Xcode 27 beta。

5 · 未來十年的棋局

5.1 監管的順風：隱私法規讓蘋果的架構越來越值錢

2026 年，全球 AI 監管正在加速：歐盟 AI Act 進入執行期，美國多州相繼通過 AI 透明度法案，中國的 AI 生成內容管理辦法持續更新。在這個監管環境裡，「能通過審計的隱私架構」越來越稀缺，越來越值錢。

蘋果的 PCC 可驗證架構、Foundation Models 的裝置端設計、Differential Privacy 在健康資料上的應用——這些在消費市場可能只是品牌加分項，但在企業市場、醫療市場、金融市場，這些是合規採購的門票。

5.2 硬體 × 軟體協同：其他人很難複製的飛輪

一個很少被討論的現實：蘋果是這個星球上唯一同時設計 AI 晶片、AI 作業系統、AI 應用框架和 AI 終端裝置的公司。Google 設計 TPU 但 Pixel 不是主流裝置；Qualcomm 設計 NPU 但它不做軟體；Microsoft 做 AI 軟體但依賴第三方硬體。

這個垂直整合，讓蘋果可以做很多其他人做不到的優化：Foundation Models 的推理路徑可以直接針對 Neural Engine 的指令集調優；Siri Agent 的回應延遲可以壓到 50ms 以內，因為底層硬體和軟體是同一個團隊設計的。

5.3 開源訊號：Framework 開源是信任建設，也是生態引力

Foundation Models 框架開源，是 WWDC26 被低估的一個訊號。蘋果不是一個習慣開源的公司——它的核心優勢一直是封閉生態的高品質控制。選擇在這個時機開源 Foundation Models，更多是一個信任建設動作：讓外部研究者、企業客戶的安全團隊可以審計它，而不只是相信它的說法。

這也是一個生態引力建設：開源的框架吸引研究者，研究者發表論文，論文引用帶來更多開發者採用，更多採用帶來更豐富的第三方 App，更豐富的 App 讓 Siri Agent 變得更強大。這是 Apple Silicon + Swift 生態的重演，只是這次在 AI 層面。

6 · 客觀評估：蘋果真的贏得了下半場嗎？

我不想在這裡給出一個過度樂觀或過度悲觀的結論。讓我們看幾個真實的挑戰：

6.1 蘋果面對的真實挑戰

裝置端模型的天花板很真實：3B 參數模型在複雜推理、程式生成、長上下文任務上，和 GPT-5.5 / Claude Opus 4 的差距是結構性的。Siri Agent 做得了「把會議紀錄整理成待辦清單」，做不了「幫我重構這個 Swift 專案的架構」。
第三方 App 整合需要時間：App Intents 的生態建設，依賴第三方開發者配合。WWDC26 發布後，要等到有足夠多的 App 支援 Siri Agent 的深度整合，可能需要 6～18 個月。
非英語市場的體驗仍有差距：繁體中文、日語、韓語的自然語言理解在 WWDC26 有改進，但對話流暢度和英語版本的差距仍然明顯。
用戶習慣的遷移需要教育：大多數用戶已經習慣去 ChatGPT 或其他 AI 應用完成複雜任務。讓他們轉而信任 Siri Agent，需要一段時間的行為改變。

50ms

裝置端推理目標延遲

20+

Apple Intelligence 支援語言數

裝置端推理邊際費用

6.2 蘋果可能贏的地方

然而，有幾個維度蘋果確實建立了真實優勢：

隱私敏感場景：醫療、法務、財務、企業內部資料——這些場景的用戶寧願用能力弱一點、但確保資料不離裝置的 AI，也不願意把敏感資料送到 OpenAI 的伺服器。隨著這類場景的 AI 採用率提升，蘋果的市場份額會自然增長。

日常高頻低複雜度任務：摘要、翻譯、改寫、分類——這些任務佔 AI 使用量的大頭，但不需要 GPT-5.5 等級的智慧。裝置端 Foundation Models 完全夠用，且延遲更低、費用為零。對日常使用者，「足夠好且免費」往往比「最強但按量計費」更有吸引力。

作業系統整合的深度：Siri Agent 讀取你的日曆、郵件、訊息、照片的能力，任何第三方 AI App 都做不到——蘋果不開放這些 API 給競爭對手。這個系統整合的護城河，短期內無人能複製。

7 · FAQ

Siri Agent 現在能做 ChatGPT 能做的事嗎？

不能完全替代，但目標場景不同。ChatGPT 的強項是「開放域推理、程式生成、複雜創作」；Siri Agent 的強項是「深度整合裝置上下文、跨 App 執行任務、隱私敏感操作」。理想的用法是配合使用，而不是二選一：Siri Agent 管理你的裝置和生活，ChatGPT 幫你做複雜的思考和創作工作。

Foundation Models 2.0 適合我的 App 嗎？

如果你的 App 有以下任何需求，非常適合：需要處理用戶隱私資料（健康、財務、個人文件）、需要高頻低延遲的 AI 功能（每次用戶輸入都觸發）、希望 AI 功能在離線狀態也可用、想控制 AI 功能的邊際成本（規模擴大後零費用）。不適合的場景是：需要即時聯網搜尋、需要生成超長文件、需要頂尖的程式碼生成能力。

沒有 Apple Silicon 的裝置還能用 Apple Intelligence 嗎？

部分功能可以。完整的 Foundation Models 2.0 裝置端推理需要 A17 Pro（iPhone 15 Pro）以上或 M1 以上 Mac / iPad。較老裝置可以透過 PCC 享受部分 Apple Intelligence 功能，但需要網路連線，且功能集合較少。Fallback 策略對支援舊裝置的 App 來說是必須實作的。

WWDC26 之後我該立刻動 App 嗎？

不必恐慌，但有幾件事值得現在就開始排期：（1）評估哪些功能可以接入 App Intents——這是 Siri Agent 時代的流量入口；（2）規劃 Foundation Models 2.0 的 PoC——找一個邊際成本高、隱私要求高的功能做試驗；（3）更新 CI 環境到 Xcode 27——建議用 Cloud Mac 確保環境版本釘定，避免 GitHub hosted runner 的版本不確定性。

和 VPSSpark Cloud Mac 有什麼關係？

WWDC26 發布的這些功能需要 Xcode 27 + iOS 26 SDK 才能完整開發和測試。Cloud Mac 提供固定版本的 macOS + Xcode 環境，讓你的 CI 在 WWDC 後的頭幾週就能穩定跑在最新 SDK 上，而不是等待 GitHub hosted runner 不確定的更新時程。Siri Agent 的 App Intent 整合、Foundation Models 2.0 的多模態 API，都可以在 Cloud Mac 的 Xcode 27 環境裡立刻開始實驗。

收束：蘋果想贏的那場戰爭，和你想的不一樣

上半場，蘋果輸掉的是一場「誰的聊天機器人最聰明」的競賽。這場競賽，它沒有辦法贏，也選擇了不去贏。

它想贏的下半場，問題是：當 AI 無處不在、能力已經足夠，誰的 AI 最值得信任、最深度融入你的生活？

這個問題沒有一個快速的答案，也沒有一個明確的評分指標——不像「誰的 MMLU 分數更高」那樣一目瞭然。但這恰恰是蘋果選擇這個戰場的原因：在一個沒有快速評分指標的競爭裡，先發優勢讓位於長期信任的積累，而信任是它最擅長建立的東西。

蘋果沒有贏下 AI 的上半場，但 WWDC26 顯示它至少弄清楚了自己想打的是什麼球。接下來五年，這個押注是否成立——歡迎再來聊。