VPSSpark 部落格
← 返回開發日記

蘋果沒有贏下 AI 上半場,但它想贏下未來十年

機房手記 · AI 觀察 #2 · 2026.06.10 · 約 18 分鐘閱讀

常見搜尋:WWDC26 Siri Agent · Apple Intelligence 2026 · Foundation Models 2.0 · 蘋果 AI 戰略

WWDC26 Siri Agent、Apple Intelligence 與蘋果 AI 反擊戰全解析
WWDC26:蘋果不追求「最強模型」,而是押注「最懂你的作業系統」——隱私、生態、硬體三位一體的未來十年棋局。

你可能在找的答案

  • 蘋果 WWDC26 發布了什麼 AI 新功能?
  • Siri Agent 和過去的 Siri 有什麼本質區別?
  • Apple Intelligence 為什麼說「重新出發」而不是「升級」?
  • Foundation Models 2.0 開發者能用它做什麼?
  • 蘋果的隱私 AI 路線能在商業上打贏 OpenAI / Google 嗎?

2022 年 11 月,ChatGPT 上線。接下來整整三年,科技圈都在問同一個問題:蘋果在哪裡?

Siri 還是在問你「我可以幫你搜尋嗎?」,Bing Chat 已經能幫你寫週報;Google Gemini 深度整合進 Android,而 iPhone 用戶打開 Siri 依然是那顆熟悉的彩色球——然後它說「抱歉,我沒聽清楚」。

2024 年,蘋果發布 Apple Intelligence,承諾要「重新定義 Siri」。然後——延期。再延期。一些功能悄悄在 iOS 18.4 出現,再悄悄在 iOS 18.5 消失。

蘋果沒有贏下 AI 的上半場,這是事實。但 WWDC26,Tim Cook 和 Craig Federighi 站在台上,發布的不是一個補丁,而是一個完整的反擊宣言——Siri Agent、Foundation Models 2.0、Apple Intelligence 全面鋪開,以及一個關於隱私 AI 的長期主義押注。

這篇文章,我們從頭捋清楚:蘋果為何輸掉上半場,WWDC26 具體發布了什麼,以及它下一個十年想走的那條路,究竟是縮減戰線的保守主義,還是一場更大的賭注。

1 · 上半場:蘋果為何落後?

1.1 Siri 的結構性困境

Siri 在 2011 年就已推出,比 ChatGPT 早了整整 11 年。但早發布不等於早領先——Siri 的底層架構是「規則引擎 + 語音辨識 + API 橋接」的組合,而不是語言模型。這意味著它能做的事被事先寫死了:設鬧鐘、播音樂、查天氣。一旦你偏離這些場景,它就交出答案——「我在網頁上找到了一些結果」。

而 GPT-4 展示的是完全不同的能力:它能理解意圖、能推理、能跨上下文工作。這不是 Siri「落後一代」的問題,這是兩種根本不同的系統設計——一個是狀態機,一個是語言模型。

1.2 Apple Intelligence 的延期之謎

2024 WWDC 上,蘋果宣布 Apple Intelligence——設備端智慧、重寫的 Siri、ChatGPT 整合、Private Cloud Compute。發布會現場掌聲雷動。然後,大多數功能要等到 iOS 18.1、18.2、18.4……

為什麼會一再延期?
三個原因疊加:(1)硬體門檻——只有 A17 Pro 以上才能在裝置端跑模型,需要等待足夠的設備滲透率;(2)隱私審查——Private Cloud Compute 的安全架構需要通過外部審計,不能急;(3)多語言難題——非英語市場的自然語言理解是真正的難題,中文、日語、韓語的複雜性遠超預期。

延期的背後,還有一個結構性原因很少被討論:蘋果做 AI 的方式,天然比 OpenAI 慢。OpenAI 可以在伺服器端偷偷把模型換掉,用戶感受不到任何中斷;蘋果的每一次更新都必須通過 App Store 審查,都必須在 iOS 新版本裡出貨,都必須在四十億裝置上穩定運行——這是世界上最嚴苛的 AI 部署條件

1.3 感知落差:輸掉了敘事,不一定輸掉了技術

這裡有一個容易被忽略的細節:蘋果的 Neural Engine 從 2017 年的 A11 就開始內建,比大多數 AI 玩家更早佈局邊緣 AI 硬體。M 系列晶片的 NPU 效能在業界處於頂尖水準。Foundation Models 的裝置端 3B 參數模型,能做的事情已經超過很多人的預期。

蘋果輸的,更多是「可見的 AI 產品體驗」——那些讓媒體截圖分享、讓用戶在朋友面前炫耀的時刻。輸掉上半場,不代表輸掉了未來的牌面。

2017
A11 首搭 Neural Engine
40億+
Apple 活躍裝置數
3B
裝置端模型參數量

2 · WWDC26 全解析:它實際發布了什麼?

2.1 Siri Agent:終於能「做事」而不只是「說話」

這是 WWDC26 最重要的一個轉變。過去的 Siri 是一個問答介面——你問,它答。新的 Siri Agent 是一個行動執行者——你說目標,它去完成。

核心能力的差距在於兩點:App 間行動串接,以及多步驟任務規劃

能力 舊版 Siri Siri Agent(WWDC26)
任務類型 單一指令,結果即答 多步驟任務,自動拆解執行
App 整合 限定 SiriKit 支援的 App 透過 App Intents 跨 App 行動
個人上下文 基本:姓名、行事曆 深度:郵件、訊息、照片、健康資料
錯誤處理 失敗則放棄,建議用戶手動 中途卡住時詢問確認後繼續
推理引擎 規則樹 + 語音辨識 語言模型 + 計畫執行圖

具體的例子:你對著 Siri Agent 說「把昨天開會的錄音整理成待辦清單,發到工作群組,然後在日曆上幫我排明天的跟進會議」——這是一個跨越備忘錄、訊息、日曆三個 App 的四步驟任務。舊 Siri 面對這句話只能說「我幫你搜尋看看」;Siri Agent 會真的去執行它。

實現這個的底層機制是 App Intents 2.0——蘋果把系統內建 App 的幾百個「意圖」開放給 Siri Agent 呼叫,第三方開發者也可以透過 AppIntent 協定把自己 App 的核心動作暴露出來。Siri Agent 本質上是一個 LLM 驅動的 Intent 路由引擎,而 Intent 是它操作世界的手。

開發者視角:App Intents 是護城河
Siri Agent 的能力邊界,直接等於「已接入 App Intents 的 App 的能力總和」。這意味著接入 App Intents 的 App,將在 Siri Agent 的使用中獲得自然的曝光和調用——對 iOS 開發者來說,適配 App Intents 不再是錦上添花,而是不能缺席的流量入口。

2.2 Apple Intelligence 全面鋪開:從「預覽」到「正式」

WWDC26 最直白的一個信號,是蘋果終於去掉了 Apple Intelligence 旁邊那個「Beta」標籤。這不只是一個詞的變化——這意味著蘋果認為它已經足夠穩定、足夠完整、足夠自信對外宣稱這是一個產品而非一個承諾

具體落地的能力包括:

  • Writing Tools 全語言支援:改寫、摘要、調整語氣,擴展到包括繁體中文、日文、韓文在內的 20+ 語言
  • Image Playground 升級:從卡通風格擴展到更多畫風,新增「個人化 Genmoji」可基於你的聯絡人生成貼圖
  • Photo Intelligence 增強:搜尋「去年夏天在海邊的照片」這種自然語言查詢,準確率大幅提升
  • 通知摘要優化:解決了去年被廣泛批評的「摘要把新聞誤讀成標題黨」問題,新增重要度分層顯示
  • 螢幕感知(Screen Awareness):Siri 現在能看懂你正在看什麼,並基於當前畫面回答問題或執行操作

2.3 Foundation Models 2.0:開發者的真正彈藥

去年的 Foundation Models 框架已經相當驚艷——零 token 費、無需 API Key、資料不離裝置。WWDC26 的 Foundation Models 2.0,在此基礎上走得更遠:

Swift · Foundation Models 2.0 多模態
import FoundationModels

let session = LanguageModelSession()

// 新增:視覺理解(傳入圖片直接推理)
let image = UIImage(named: "receipt.jpg")!
let result = try await session.respond(
    to: "幫我把這張發票的項目整理成 JSON",
    including: [.image(image)]
)

// 新增:結構化輸出(直接返回 Swift Codable 物件)
struct Invoice: Codable {
    let vendor: String
    let total: Double
    let items: [InvoiceItem]
}

let invoice = try await session.respond(
    to: "解析發票",
    including: [.image(image)],
    generating: Invoice.self
)

核心升級點:

  • 多模態支援:可直接傳入圖片,模型在裝置端完成視覺 + 語言聯合推理
  • 結構化輸出:直接生成 Swift Codable 物件,不再需要手動解析 JSON 字串
  • Streaming 回應:逐字流式輸出,適合需要即時顯示的對話場景
  • 工具呼叫(Tool Calling):模型可在推理過程中呼叫你定義的函式,完成 Agent 式任務
  • Python SDK + fm CLI:開放非 Swift 語言接入,腳本、後端工具都可調用
  • 框架開源:Foundation Models 框架本身在 GitHub 開源,社群可貢獻
能力 Foundation Models(2025) Foundation Models 2.0(WWDC26)
語言理解 ✓ 文字輸入 ✓ 文字 + 圖片輸入
輸出格式 純文字字串 文字 / JSON / Swift Codable
輸出方式 等待完成後返回 Streaming 逐字輸出
Agent 能力 Tool Calling 框架
語言支援 Swift only Swift + Python SDK + CLI
開源狀態 閉源 框架開源

2.4 Private Cloud Compute 2.0:雲端推論也能做到隱私可驗證

對需要比裝置端 3B 模型更強能力的任務,蘋果的答案不是「就送給 OpenAI 吧」,而是 Private Cloud Compute(PCC)——一個蘋果自己運營的雲端推論叢集,專為 AI 任務設計,但對隱私的承諾與裝置端相同。

PCC 2.0 的關鍵改進:Security Research Virtual Machine——任何安全研究者都可以申請啟動一個 PCC 節點的虛擬機器複製,用於驗證蘋果的隱私聲明是否屬實。這是對外說「trust but verify」的最強表達:不要相信我的說法,自己去驗證我的程式碼

這為什麼是一個競爭優勢而不只是功能點
OpenAI / Google 的雲端 AI 從設計上就無法做到「不保留用戶輸入」——他們的商業模式依賴資料。蘋果的 PCC 是讓「不留資料」這件事在技術架構上可驗證,而不只是在隱私政策裡承諾。對企業客戶、醫療、法務、金融場景,這是真正有價值的差異。

2.5 macOS 26 Tahoe × iOS 26:AI 滲透系統每一層

WWDC26 還宣布了 macOS 26 Tahoe 和 iOS 26,AI 不再是一個獨立的「功能模組」,而是滲透進作業系統的每一層:

  • Xcode 27 本機補全:多行程式補全在 Apple Silicon 本機執行,不走雲端
  • Safari 智慧摘要:網頁摘要在裝置端生成,不上傳給任何伺服器
  • Finder 語意搜尋:「找上個月那個和財報有關的 Excel」——自然語言查本機檔案
  • 郵件智慧起草:基於你的歷史郵件風格生成回覆,完全離線
  • 健康 App AI 教練:基於你的健康資料給出個人化建議,資料一律不離裝置

圖 1 · Apple Intelligence 架構分層:從裝置端到 PCC,再到第三方 AI

裝置端 Foundation Models 2.03B 參數 · 零邊際費 · 資料不離裝置
Private Cloud Compute 2.0蘋果自有雲 · 可驗證隱私承諾 · 不保留用戶輸入
第三方 AI(ChatGPT / 其他)需用戶明確授權 · 顯示明確隱私提示

3 · 戰略解析:蘋果在押注什麼?

3.1 隱私作為護城河,而不是行銷口號

理解蘋果 AI 戰略的關鍵,是把「隱私」從一個品牌標語還原成一個商業壁壘

OpenAI 和 Google 在 AI 賽道的優勢是:大量資料、大量算力、快速迭代。蘋果沒有辦法在前兩項上追上——它沒有那麼多 AI 用戶資料,也沒有那麼多 A100 / H100。它選擇的是另一條曲線:把最強的 AI 能力搬到裝置端,讓「資料不需要上雲」本身成為特性,而不是限制。

這個選擇的副產品,是一個 OpenAI 很難複製的護城河:你無法在租用的伺服器上做到真正的「用戶資料不離裝置」。這個架構優勢,隨著 AI 法規(GDPR 執行、各國資料主權法)的收緊,只會變得越來越值錢。

3.2 生態鎖定:AI 功能 × Apple Silicon × App 生態

WWDC26 的一個精心設計:幾乎所有新 AI 功能都需要 A17 Pro 以上或 M 系列晶片才能完整運行。這是一個清晰的升級換機驅動力——想用 Siri Agent?換 iPhone 17。想在 Mac 上跑 Foundation Models 2.0 本機推理?M 系列的效能優勢非常明顯。

同時,App Intents 的深度整合,讓整個 iOS / macOS 生態的 App 開發者都必須跟上——接入 App Intents 的 App 獲得 Siri Agent 的自然曝光,不接入的 App 逐漸被邊緣化。這是蘋果慣常的生態治理手法:用功能引導開發者,而不是強制命令。

3.3 長期主義的賭注:OS-level AI vs API-level AI

OpenAI、Anthropic、Google DeepMind 的路線,本質上是提供「AI 即服務」——你呼叫它們的 API,支付每百萬 token 的費用,享受最強的模型能力。這個模式在 2025~2026 年的商業化非常成功,但它有一個根本性的脆弱點:任何人都可以替換 API——包括蘋果。

蘋果的賭注是:把 AI 做成作業系統的一部分,而不是一個可替換的服務。Siri Agent 對裝置上下文的感知,Foundation Models 對 NPU 的深度整合,PCC 對 Secure Enclave 的架構依賴——這些都在讓「蘋果的 AI」越來越難被第三方替換。

核心觀點
蘋果輸掉的是「誰的模型最強」的競賽。但它押注的問題是:當 AI 能力足夠好,「隱私可驗證的 OS 級 AI」是否比「最強但需要上雲的 API 級 AI」更有長期價值?這個問題,在 2026 年還沒有答案,但五年後可能清晰得多。

4 · 開發者視角:WWDC26 改變了什麼?

4.1 App Intents 從「可選」到「必選」

如果你在維護一個 iOS App,WWDC26 之後有一件事值得立刻排進 backlog:審查你的核心功能,哪些可以暴露為 App Intent。

Siri Agent 的能力邊界 = 已接入 App Intents 的動作集合。每一個你暴露的 Intent,都是一個 Siri Agent 可以幫用戶完成的動作。用戶說「幫我在 [你的 App] 裡做 X」,如果你沒有 Intent,Siri 只能說「抱歉,這個 App 還不支援」。

Swift · 定義一個 App Intent(最小範例)
import AppIntents

struct CreateNoteIntent: AppIntent {
    static var title: LocalizedStringResource = "建立新筆記"
    static var description = IntentDescription("在 App 中建立一則新筆記")

    @Parameter(title: "內容") var content: String

    func perform() async throws -> some IntentResult {
        // 你的業務邏輯
        let note = NoteService.create(content: content)
        return .result(value: note.id)
    }
}

4.2 Foundation Models 2.0 的實際使用場景

有了多模態、結構化輸出和 Tool Calling,Foundation Models 2.0 的可用場景大幅擴展:

場景 實作方式 適合層級
發票 / 收據解析 拍照 → 圖片輸入 → 結構化 JSON 輸出 裝置端完成,零 API 費
本地文件摘要 PDF 文字 → 裝置端摘要 → Streaming 顯示 裝置端完成,隱私可保
智慧表單填寫 自然語言輸入 → 解析為 Codable 物件填表 裝置端完成,UX 大幅提升
醫療 / 健康資料分析 HealthKit 資料 → 裝置端推理 → 個人化建議 必須裝置端,法規要求
企業內部文件搜尋 語意搜尋 + Tool Calling 查詢本地資料庫 裝置端 + PCC,資料不出企業

4.3 開發環境的新挑戰:Xcode 27 + iOS 26 SDK 的版本釘定

所有這些新功能,都依賴 Xcode 27 和 iOS 26 SDK。這意味著你的建置環境需要跟上——而這是真正麻煩的地方。

Foundation Models 2.0 的 API 在模擬器和真機上行為不同;Siri Agent 的 App Intent 整合需要特定版本的 Xcode 才能正確索引;PCC 的整合測試需要特定的 entitlement。如果你的 CI 環境跑在 GitHub hosted runner 上,你正在等待一個不確定的 Xcode 27 支援時間表——而如果你的 CI 跑在 Cloud Mac 上,你可以在 WWDC26 結束後幾小時內就把環境更新到 Xcode 27 beta。

5 · 未來十年的棋局

5.1 監管的順風:隱私法規讓蘋果的架構越來越值錢

2026 年,全球 AI 監管正在加速:歐盟 AI Act 進入執行期,美國多州相繼通過 AI 透明度法案,中國的 AI 生成內容管理辦法持續更新。在這個監管環境裡,「能通過審計的隱私架構」越來越稀缺,越來越值錢。

蘋果的 PCC 可驗證架構、Foundation Models 的裝置端設計、Differential Privacy 在健康資料上的應用——這些在消費市場可能只是品牌加分項,但在企業市場、醫療市場、金融市場,這些是合規採購的門票。

5.2 硬體 × 軟體協同:其他人很難複製的飛輪

一個很少被討論的現實:蘋果是這個星球上唯一同時設計 AI 晶片、AI 作業系統、AI 應用框架和 AI 終端裝置的公司。Google 設計 TPU 但 Pixel 不是主流裝置;Qualcomm 設計 NPU 但它不做軟體;Microsoft 做 AI 軟體但依賴第三方硬體。

這個垂直整合,讓蘋果可以做很多其他人做不到的優化:Foundation Models 的推理路徑可以直接針對 Neural Engine 的指令集調優;Siri Agent 的回應延遲可以壓到 50ms 以內,因為底層硬體和軟體是同一個團隊設計的。

5.3 開源訊號:Framework 開源是信任建設,也是生態引力

Foundation Models 框架開源,是 WWDC26 被低估的一個訊號。蘋果不是一個習慣開源的公司——它的核心優勢一直是封閉生態的高品質控制。選擇在這個時機開源 Foundation Models,更多是一個信任建設動作:讓外部研究者、企業客戶的安全團隊可以審計它,而不只是相信它的說法。

這也是一個生態引力建設:開源的框架吸引研究者,研究者發表論文,論文引用帶來更多開發者採用,更多採用帶來更豐富的第三方 App,更豐富的 App 讓 Siri Agent 變得更強大。這是 Apple Silicon + Swift 生態的重演,只是這次在 AI 層面。

6 · 客觀評估:蘋果真的贏得了下半場嗎?

我不想在這裡給出一個過度樂觀或過度悲觀的結論。讓我們看幾個真實的挑戰:

6.1 蘋果面對的真實挑戰

  • 裝置端模型的天花板很真實:3B 參數模型在複雜推理、程式生成、長上下文任務上,和 GPT-5.5 / Claude Opus 4 的差距是結構性的。Siri Agent 做得了「把會議紀錄整理成待辦清單」,做不了「幫我重構這個 Swift 專案的架構」。
  • 第三方 App 整合需要時間:App Intents 的生態建設,依賴第三方開發者配合。WWDC26 發布後,要等到有足夠多的 App 支援 Siri Agent 的深度整合,可能需要 6~18 個月。
  • 非英語市場的體驗仍有差距:繁體中文、日語、韓語的自然語言理解在 WWDC26 有改進,但對話流暢度和英語版本的差距仍然明顯。
  • 用戶習慣的遷移需要教育:大多數用戶已經習慣去 ChatGPT 或其他 AI 應用完成複雜任務。讓他們轉而信任 Siri Agent,需要一段時間的行為改變。
50ms
裝置端推理目標延遲
20+
Apple Intelligence 支援語言數
$0
裝置端推理邊際費用

6.2 蘋果可能贏的地方

然而,有幾個維度蘋果確實建立了真實優勢:

隱私敏感場景:醫療、法務、財務、企業內部資料——這些場景的用戶寧願用能力弱一點、但確保資料不離裝置的 AI,也不願意把敏感資料送到 OpenAI 的伺服器。隨著這類場景的 AI 採用率提升,蘋果的市場份額會自然增長。

日常高頻低複雜度任務:摘要、翻譯、改寫、分類——這些任務佔 AI 使用量的大頭,但不需要 GPT-5.5 等級的智慧。裝置端 Foundation Models 完全夠用,且延遲更低、費用為零。對日常使用者,「足夠好且免費」往往比「最強但按量計費」更有吸引力。

作業系統整合的深度:Siri Agent 讀取你的日曆、郵件、訊息、照片的能力,任何第三方 AI App 都做不到——蘋果不開放這些 API 給競爭對手。這個系統整合的護城河,短期內無人能複製。

7 · FAQ

Siri Agent 現在能做 ChatGPT 能做的事嗎?

不能完全替代,但目標場景不同。ChatGPT 的強項是「開放域推理、程式生成、複雜創作」;Siri Agent 的強項是「深度整合裝置上下文、跨 App 執行任務、隱私敏感操作」。理想的用法是配合使用,而不是二選一:Siri Agent 管理你的裝置和生活,ChatGPT 幫你做複雜的思考和創作工作。

Foundation Models 2.0 適合我的 App 嗎?

如果你的 App 有以下任何需求,非常適合:需要處理用戶隱私資料(健康、財務、個人文件)需要高頻低延遲的 AI 功能(每次用戶輸入都觸發)希望 AI 功能在離線狀態也可用想控制 AI 功能的邊際成本(規模擴大後零費用)。不適合的場景是:需要即時聯網搜尋、需要生成超長文件、需要頂尖的程式碼生成能力。

沒有 Apple Silicon 的裝置還能用 Apple Intelligence 嗎?

部分功能可以。完整的 Foundation Models 2.0 裝置端推理需要 A17 Pro(iPhone 15 Pro)以上或 M1 以上 Mac / iPad。較老裝置可以透過 PCC 享受部分 Apple Intelligence 功能,但需要網路連線,且功能集合較少。Fallback 策略對支援舊裝置的 App 來說是必須實作的

WWDC26 之後我該立刻動 App 嗎?

不必恐慌,但有幾件事值得現在就開始排期:(1)評估哪些功能可以接入 App Intents——這是 Siri Agent 時代的流量入口;(2)規劃 Foundation Models 2.0 的 PoC——找一個邊際成本高、隱私要求高的功能做試驗;(3)更新 CI 環境到 Xcode 27——建議用 Cloud Mac 確保環境版本釘定,避免 GitHub hosted runner 的版本不確定性。

和 VPSSpark Cloud Mac 有什麼關係?

WWDC26 發布的這些功能需要 Xcode 27 + iOS 26 SDK 才能完整開發和測試。Cloud Mac 提供固定版本的 macOS + Xcode 環境,讓你的 CI 在 WWDC 後的頭幾週就能穩定跑在最新 SDK 上,而不是等待 GitHub hosted runner 不確定的更新時程。Siri Agent 的 App Intent 整合、Foundation Models 2.0 的多模態 API,都可以在 Cloud Mac 的 Xcode 27 環境裡立刻開始實驗。

收束:蘋果想贏的那場戰爭,和你想的不一樣

上半場,蘋果輸掉的是一場「誰的聊天機器人最聰明」的競賽。這場競賽,它沒有辦法贏,也選擇了不去贏。

它想贏的下半場,問題是:當 AI 無處不在、能力已經足夠,誰的 AI 最值得信任、最深度融入你的生活?

這個問題沒有一個快速的答案,也沒有一個明確的評分指標——不像「誰的 MMLU 分數更高」那樣一目瞭然。但這恰恰是蘋果選擇這個戰場的原因:在一個沒有快速評分指標的競爭裡,先發優勢讓位於長期信任的積累,而信任是它最擅長建立的東西。

蘋果沒有贏下 AI 的上半場,但 WWDC26 顯示它至少弄清楚了自己想打的是什麼球。接下來五年,這個押注是否成立——歡迎再來聊。

WWDC26 之後:先釘住 Xcode 27 環境,再談 AI 功能開發

若你正在把 Siri Agent App Intents 或 Foundation Models 2.0 接進 App,同時需要固定 Xcode 27 / iOS 26 建置環境,VPSSpark Cloud Mac 可作為開發與 CI 的 macOS 執行底座——在 WWDC26 後幾小時內更新到最新 beta SDK,讓你領先隊友一個身位。

了解 Cloud Mac 方案,讓 Apple Intelligence 開發從第一天就跑在穩定環境上。

限時特惠

Apple Intelligence 開發底座:Xcode 27 隨時就緒

Cloud Mac · 固定 SDK 版本 · Siri Agent 開發環境

返回首頁
限時優惠 點擊查看套餐