AppleはAI前半戦で負けた——だが次の10年を取りに来た

よく検索されている質問

Apple WWDC26 で発表された AI 新機能は何か？
Siri Agent は従来の Siri と本質的に何が違うのか？
Apple Intelligence はなぜ「アップグレード」ではなく「再出発」と言われるのか？
Foundation Models 2.0 で開発者は何ができるようになるのか？
Apple のプライバシー優先 AI 路線は OpenAI / Google に商業的に勝てるのか？

2022 年 11 月、ChatGPT が公開された。それから 3 年間、テック業界は同じ問いを繰り返してきた：Apple はどこにいるのか？

Siri は相変わらず「検索しましょうか？」と聞き、Bing Chat は週報の下書きまで書いてくれる。Google Gemini は Android に深く組み込まれているのに、iPhone で Siri を開くとあの色とりどりの球体が現れ——「すみません、よく聞き取れませんでした」と返ってくる。

2024 年、Apple は Apple Intelligence を発表し、Siri を「再定義する」と約束した。そして——延期。さらに延期。一部の機能は iOS 18.4 で静かに現れ、iOS 18.5 でまた消えた。

Apple は AI の前半戦を勝ち取れなかった。これは事実だ。しかし WWDC26 で Tim Cook と Craig Federighi がステージに立ち、パッチではなく反撃宣言を発表した——Siri Agent、Foundation Models 2.0、Apple Intelligence の本格展開、そしてプライバシー AI への長期ベット。

本稿では、Apple が前半戦でなぜ遅れたのか、WWDC26 で具体的に何が出たのか、そして次の 10 年に向けた賭けが「戦線縮小の保守策」なのか「もっと大きな賭け」なのかを、順を追って整理する。

1 · 前半戦：Apple はなぜ遅れたのか？

1.1 Siri の構造的な限界

Siri は 2011 年に登場し、ChatGPT より 11 年早い。しかし早く出たからといって先を行ったわけではない——Siri の基盤は「ルールエンジン + 音声認識 + API ブリッジ」の組み合わせであり、言語モデルではなかった。できることは事前に決め打ちされている：アラーム設定、音楽再生、天気確認。ここから外れると「ウェブでいくつか見つかりました」で終わる。

GPT-4 が示したのはまったく別次元の能力だ：意図を理解し、推論し、文脈をまたいで動ける。これは Siri が「1 世代遅れている」問題ではなく、状態機械と言語モデルという、根本的に異なる 2 つの設計思想の差だ。

1.2 Apple Intelligence 延期の謎

2024 年の WWDC で Apple は Apple Intelligence を発表した——端末内インテリジェンス、書き直された Siri、ChatGPT 統合、Private Cloud Compute。会場は喝采に包まれた。ところが多くの機能は iOS 18.1、18.2、18.4……と段階的にしか届かなかった。

なぜ何度も延期されたのか？

三つの要因が重なった：（1）ハードウェア要件——端末内でモデルを回すには A17 Pro 以上が必要で、十分なデバイス普及を待つ必要があった；（2）プライバシー審査——Private Cloud Compute のセキュリティ設計は外部監査を通過しなければならず、急げない；（3）多言語対応——英語以外の自然言語理解は本当に難しく、日本語・中国語・韓国語の複雑さは想定を上回った。

延期の裏には、あまり語られない構造的理由もある：Apple の AI の進め方は、本質的に OpenAI より遅い。OpenAI はサーバー側でモデルをこっそり差し替えても、ユーザーは気づかない。Apple の更新はすべて App Store 審査を通り、iOS の新バージョンで出荷され、40 億台のデバイスで安定稼働しなければならない——世界で最も厳しい AI デプロイ条件だ。

1.3 認識のギャップ：物語は負けたが、技術は必ずしも負けていない

見落とされがちな事実がある：Neural Engine は 2017 年の A11 から搭載されている。エッジ AI ハードウェアへの先手は、多くの AI プレイヤーより早い。M シリーズの NPU 性能は業界トップクラスだ。Foundation Models の端末内 3B パラメータモデルができることは、多くの人の予想を上回っている。

Apple が負けたのは、主に「目に見える AI 体験」——メディアがスクショを拡散し、ユーザーが友人の前で自慢できる瞬間だ。前半戦を負けても、未来の手札まで失ったわけではない。

2017

A11 で Neural Engine 初搭載

40億+

Apple 稼働デバイス数

端末内モデル参数量

2 · WWDC26 全解析：実際に何が発表されたか？

2.1 Siri Agent：ついに「話す」から「やる」へ

WWDC26 で最も重要な転換点だ。従来の Siri は質問応答インターフェース——聞かれて答える。新しい Siri Agent は行動の実行者——目標を伝えれば、完了まで動く。

能力の差は二点に集約される：App 間のアクション連携と多段階タスクの計画実行。

能力	旧 Siri	Siri Agent（WWDC26）
タスク種別	単一コマンド、即答	多段階タスク、自動分解・実行
App 連携	SiriKit 対応 App に限定	App Intents によるクロス App 実行
個人コンテキスト	基本：名前・カレンダー	深層：メール・メッセージ・写真・ヘルスデータ
エラー処理	失敗したら諦め、手動を促す	途中で確認を挟み、続行
推論エンジン	ルール木 + 音声認識	言語モデル + プラン実行グラフ

具体例：Siri Agent に「昨日の会議の録音を ToDo リストにまとめて、仕事用グループに送って、明日のフォローアップ会議をカレンダーに入れて」と頼む——メモ・メッセージ・カレンダーの 3 App をまたぐ 4 ステップのタスクだ。旧 Siri は「検索してみます」としか言えない。Siri Agent は実際に実行する。

その仕組みは App Intents 2.0——システム App の数百の「意図」を Siri Agent から呼び出せるようになり、サードパーティも AppIntent プロトコルでコアアクションを公開できる。Siri Agent の本質は LLM 駆動の Intent ルーティングエンジンで、Intent が世界を操作する「手」になる。

開発者視点：App Intents は堀になる

Siri Agent の能力上限は、「App Intents に対応した App の能力の総和」に等しい。つまり App Intents を入れた App は、Siri Agent 経由で自然に露出・起動される——iOS 開発者にとって、App Intents 対応は nice-to-have ではなく、欠かせないトラフィック入口だ。

2.2 Apple Intelligence 本格展開：「プレビュー」から「正式版」へ

WWDC26 で最も率直なシグナルは、Apple Intelligence の横にあった「Beta」ラベルが外れたことだ。単語の変更ではない——十分に安定し、十分に完成し、製品として胸を張って言える段階に来たという宣言だ。

具体的な展開内容：

Writing Tools の全言語対応：書き換え・要約・トーン調整が、繁体中国語・日本語・韓国語を含む 20 言語以上に拡大
Image Playground の強化：カートゥーン調から多様な画風へ。連絡先ベースの「パーソナライズ Genmoji」も追加
Photo Intelligence の向上：「去年の夏に海辺で撮った写真」といった自然言語検索の精度が大幅改善
通知サマリーの改善：昨年批判された「ニュースを誤って釣りタイトル化する」問題を修正し、重要度の階層表示を追加
Screen Awareness（画面認識）：Siri が今見ている画面を理解し、その文脈で回答・操作できる

2.3 Foundation Models 2.0：開発者向けの本当の弾薬

昨年の Foundation Models フレームワークはすでに衝撃的だった——token 費ゼロ、API Key 不要、データは端末外に出ない。WWDC26 の Foundation Models 2.0 はさらに一歩進んだ：

Swift · Foundation Models 2.0 マルチモーダル

import FoundationModels

let session = LanguageModelSession()

// 新機能：ビジョン理解（画像を渡して直接推論）
let image = UIImage(named: "receipt.jpg")!
let result = try await session.respond(
    to: "Extract line items from this receipt as JSON",
    including: [.image(image)]
)

// 新機能：構造化出力（Swift Codable を直接返す）
struct Invoice: Codable {
    let vendor: String
    let total: Double
    let items: [InvoiceItem]
}

let invoice = try await session.respond(
    to: "Parse this invoice",
    including: [.image(image)],
    generating: Invoice.self
)

主なアップグレード：

マルチモーダル：画像を直接渡し、端末内で視覚 + 言語の共同推論
構造化出力：Swift Codable オブジェクトを直接生成、JSON 文字列の手動パースが不要
Streaming 応答：逐次ストリーミング出力、リアルタイム表示向き
Tool Calling：推論中に定義した関数を呼び出し、Agent 的タスクを実現
Python SDK + fm CLI：Swift 以外からも接続可能、スクリプト・バックエンドツール向け
フレームワークのオープンソース化：Foundation Models フレームワーク本体を GitHub で公開、コミュニティ貢献を受け付け

能力	Foundation Models（2025）	Foundation Models 2.0（WWDC26）
言語理解	✓ テキスト入力	✓ テキスト + 画像入力
出力形式	プレーンテキスト	テキスト / JSON / Swift Codable
出力方式	完了後に一括返却	Streaming 逐次出力
Agent 能力	なし	Tool Calling フレームワーク
言語サポート	Swift のみ	Swift + Python SDK + CLI
オープンソース	クローズド	フレームワーク OSS

2.4 Private Cloud Compute 2.0：クラウド推論でもプライバシーを検証可能に

端末内 3B モデルでは足りないタスクに対し、Apple の答えは「OpenAI に任せよう」ではなく Private Cloud Compute（PCC）——Apple 自社運用の AI 推論クラスタで、プライバシーへのコミットは端末内と同じ水準だ。

PCC 2.0 のキー改善は Security Research Virtual Machine——セキュリティ研究者が PCC ノードの VM レプリカを申請・起動し、Apple のプライバシー主張を自分の目で検証できる。「信じてくれ」ではなく「自分で確かめてくれ」——これ以上ない trust but verify の表現だ。

機能以上の競争優位

OpenAI / Google のクラウド AI は、設計上「ユーザー入力を保持しない」ことができない——ビジネスモデルがデータに依存している。Apple の PCC は「データを残さない」ことをアーキテクチャレベルで検証可能にする。プライバシーポリシーの一文ではなく、技術的保証だ。企業・医療・法務・金融では、これが本当の差になる。

2.5 macOS 26 Tahoe × iOS 26：AI が OS の各層に浸透

WWDC26 では macOS 26 Tahoe と iOS 26 も発表された。AI は独立した「機能モジュール」ではなく、OS のあらゆる層に浸透している：

Xcode 27 のローカル補完：マルチラインコード補完が Apple Silicon 上でローカル実行、クラウド往復なし
Safari スマート要約：ウェブページ要約を端末内で生成、サーバーに送信しない
Finder セマンティック検索：「先月の決算関連の Excel を探して」——自然言語でローカルファイル検索
メールのスマート下書き：過去のメール文体を学習して返信を生成、完全オフライン
ヘルス App の AI コーチ：ヘルスデータに基づくパーソナライズ提案、データは端末外に出ない

図 1 · Apple Intelligence アーキテクチャ：端末内から PCC、サードパーティ AI へ

端末内 Foundation Models 2.03B パラメータ · 限界費用ゼロ · データは端末外に出ない

Private Cloud Compute 2.0Apple 自社クラウド · 検証可能なプライバシー · ユーザー入力を保持しない

サードパーティ AI（ChatGPT / その他）明示的なユーザー同意 · 明確なプライバシー表示

3 · 戦略解析：Apple は何に賭けているのか？

3.1 プライバシーはスローガンではなく、ビジネスの堀

Apple の AI 戦略を理解する鍵は、「プライバシー」をブランドコピーから商業的な参入障壁に戻すことだ。

OpenAI と Google の強みは、大量のデータ・大量の算力・高速イテレーションだ。Apple はこの二つでは追いつけない——AI ユーザー行動データも、A100 / H100 規模の GPU もない。選んだのは別の曲線：最強の AI を端末内に持ち込み、「データを上げなくていい」ことを制約ではなく価値にする。

その副産物として、OpenAI が真似しにくい堀ができる：借りたサーバーでは本当の「ユーザーデータは端末外に出ない」は実現できない。GDPR の執行強化や各国のデータ主権法が進むほど、このアーキテクチャ優位は価値を増す。

3.2 エコシステムのロックイン：AI × Apple Silicon × App エコシステム

WWDC26 の設計は意図的だ：ほぼすべての新 AI 機能が A17 Pro 以上または M シリーズでないとフル動作しない。明確な換機インセンティブ——Siri Agent を使いたいなら iPhone 17 へ。Mac で Foundation Models 2.0 のローカル推論を回したいなら、M シリーズの性能差は顕著だ。

同時に App Intents の深い統合により、iOS / macOS エコシステムの開発者は追随を迫られる——App Intents に対応した App は Siri Agent 経由で自然に露出し、未対応 App は徐々に周縁化される。これは Apple お馴染みのエコシステムガバナンス：命令ではなく機能で開発者を導く。

3.3 長期ベット：OS レベル AI vs API レベル AI

OpenAI、Anthropic、Google DeepMind の路線は本質的に「AI as a Service」——API を叩き、百万 token あたりの料金を払い、最強モデルの能力を享受する。2025〜2026 年の商業化は成功しているが、根本的な脆弱性がある：API は誰でも差し替えられる——Apple 自身もそうだ。

Apple の賭けは：AI を差し替え可能なサービスではなく、OS の一部にすること。Siri Agent のデバイスコンテキスト理解、Foundation Models の NPU 深層統合、PCC の Secure Enclave 依存——いずれも「Apple の AI」をサードパーティに置き換えにくくしている。

核心的な見方

Apple が負けたのは「どのモデルが最強か」の競争だ。賭けているのは別の問い：AI の能力が十分になったとき、「プライバシーが検証可能な OS レベル AI」と「最強だがクラウド必須の API レベル AI」のどちらが長期的に価値があるか？2026 年時点では答えは出ていないが、5 年後にははっきりするかもしれない。

4 · 開発者視点：WWDC26 は何を変えたか？

4.1 App Intents：「任意」から「必須」へ

iOS App をメンテしているなら、WWDC26 後に backlog に入れるべきことが一つある：コア機能のうち、どれを App Intent として公開できるかを棚卸しする。

Siri Agent の能力上限 = App Intents に登録されたアクションの集合。公開する Intent ひとつひとつが、Siri Agent がユーザーに代わって実行できる操作になる。ユーザーが「[あなたの App] で X して」と言っても Intent がなければ、Siri は「この App はまだ対応していません」としか言えない。

Swift · App Intent の最小例

import AppIntents

struct CreateNoteIntent: AppIntent {
    static var title: LocalizedStringResource = "Create New Note"
    static var description = IntentDescription("Create a new note in the app")

    @Parameter(title: "Content") var content: String

    func perform() async throws -> some IntentResult {
        // ビジネスロジックをここに
        let note = NoteService.create(content: content)
        return .result(value: note.id)
    }
}

4.2 Foundation Models 2.0 の実用シナリオ

マルチモーダル、構造化出力、Tool Calling により、Foundation Models 2.0 の適用範囲は大きく広がった：

シナリオ	実装方法	推奨レイヤー
請求書 / レシート解析	撮影 → 画像入力 → 構造化 JSON 出力	端末内完結、API 費ゼロ
ローカルファイル要約	PDF テキスト → 端末内要約 → Streaming 表示	端末内完結、プライバシー確保
スマートフォーム入力	自然言語 → Codable オブジェクトでフォーム自動入力	端末内完結、UX 大幅改善
医療 / ヘルスデータ分析	HealthKit データ → 端末内推論 → パーソナライズ提案	端末内必須、法規制対応
社内ファイル検索	セマンティック検索 + Tool Calling でローカル DB 照会	端末内 + PCC、データは社内に留まる

4.3 開発環境の新課題：Xcode 27 + iOS 26 SDK のバージョン固定

これらの新機能はすべて Xcode 27 と iOS 26 SDK に依存する。つまりビルド環境の追随が必要だ——ここが本当に面倒なところだ。

Foundation Models 2.0 の API はシミュレータと実機で挙動が異なる。Siri Agent の App Intent 統合は特定バージョンの Xcode でないと正しくインデックスされない。PCC の統合テストには専用の entitlement が要る。CI が GitHub hosted runner 上なら、Xcode 27 対応の不確実なスケジュールを待つことになる——Cloud Mac なら、WWDC26 終了後数時間で Xcode 27 beta に更新できる。

5 · 次の 10 年の棋譜

5.1 規制の追い風：プライバシー法が Apple の設計を高く評価する

2026 年、世界の AI 規制は加速している：EU AI Act の執行期入り、米国各州の AI 透明性法案、中国の生成 AI 管理規定の更新。この環境では「監査に耐えるプライバシーアーキテクチャ」は希少で、価値が上がる。

Apple の PCC 検証可能設計、Foundation Models の端末内設計、ヘルスデータへの差分プライバシー——消費者市場ではブランド加点にとどまるが、企業・医療・金融市場では調達の前提条件になる。

5.2 ハード × ソフトの協調：他社が真似しにくいフライホイール

あまり語られない現実がある：Apple は AI チップ・AI OS・AI アプリフレームワーク・AI 端末をすべて自社で設計する、地球上で唯一の企業だ。Google は TPU を設計するが Pixel は主流デバイスではない。Qualcomm は NPU を設計するがソフトは作らない。Microsoft は AI ソフトを作るがハードは第三者依存だ。

この垂直統合により、他社にはできない最適化が可能になる：Foundation Models の推論パスを Neural Engine の命令セットに直接チューニングできる。Siri Agent の応答遅延を 50ms 以内に抑えられる——ハードとソフトが同じチームだからだ。

5.3 オープンソースのシグナル：信頼構築とエコシステム引力

Foundation Models フレームワークの OSS 化は、WWDC26 で過小評価されがちな動きだ。Apple はオープンソースに慣れない会社——強みは常に閉じたエコシステムの品質管理だった。このタイミングで Foundation Models を OSS にしたのは、信頼構築の動きだ：外部研究者や企業のセキュリティチームが監査できるようにするためだ。

エコシステム引力の構築でもある：OSS フレームワークが研究者を引きつけ、論文が書かれ、引用が増え、開発者採用が広がり、サードパーティ App が豊かになり、Siri Agent が強くなる。Apple Silicon + Swift エコシステムの再演だ——今度は AI のレイヤーで。

6 · 客観評価：Apple は後半戦を勝ったのか？

ここで過度に楽観的、あるいは悲観的な結論は避けたい。いくつかの現実的な課題を見てみよう：

6.1 Apple が直面する現実的な課題

端末内モデルの天井は現実的：3B パラメータモデルは、複雑な推論・コード生成・長コンテキストでは GPT-5.5 / Claude Opus 4 との差が構造的だ。Siri Agent は「会議録を ToDo にまとめる」はできるが、「この Swift プロジェクトのアーキテクチャを再設計して」は無理だ。
サードパーティ App 統合には時間がかかる：App Intents エコシステムは開発者の協力に依存する。WWDC26 後、十分な数の App が Siri Agent 深層統合に対応するまで 6〜18 ヶ月かかる可能性がある。
非英語市場の体験にはまだギャップがある：繁体中国語・日本語・韓国語の自然言語理解は WWDC26 で改善されたが、英語版との会話の滑らかさの差は依然として目立つ。
ユーザー習慣の移行には教育が必要：多くのユーザーは複雑なタスクを ChatGPT など別アプリで済ませる習慣がある。Siri Agent を信頼させるには行動変容の時間が要る。

50ms

端末内推論の目標レイテンシ

20+

Apple Intelligence 対応言語数

端末内推論の限界費用

6.2 Apple が勝てる可能性のある領域

しかし、いくつかの次元では Apple は確かな優位を築いている：

プライバシー敏感なシーン：医療・法務・財務・企業内部データ——こうしたユーザーは、能力が少し劣ってもデータが端末外に出ない AI を選ぶ。OpenAI のサーバーに機密データを送るよりマシだ。この種の AI 採用が進むほど、Apple のシェアは自然に伸びる。

日常の高頻度・低複雑度タスク：要約・翻訳・書き換え・分類——AI 使用量の大半を占めるが、GPT-5.5 級の知能は不要だ。端末内 Foundation Models で十分、遅延も低く、費用もゼロ。日常ユーザーにとって「十分良くて無料」は、しばしば「最強だが従量課金」より魅力的だ。

OS 統合の深さ：Siri Agent がカレンダー・メール・メッセージ・写真を読める能力は、サードパーティ AI App には不可能——Apple は競合にこれらの API を開放しない。このシステム統合の堀は、短期では誰も複製できない。

7 · FAQ

Siri Agent は今、ChatGPT のできることを全部できるのか？

完全な代替ではない。ターゲットシーンが違う。ChatGPT の強みは「オープンドメイン推論・コード生成・複雑な創作」；Siri Agent の強みは「デバイスコンテキストの深い統合・クロス App タスク実行・プライバシー敏感な操作」だ。理想的には併用であり、二択ではない：Siri Agent がデバイスと生活を管理し、ChatGPT が複雑な思考と創作を担う。

Foundation Models 2.0 は自分の App に向いているか？

以下のいずれかに当てはまれば、非常に向いている：ユーザーのプライバシーデータを扱う（健康・財務・個人ファイル）、高頻度・低遅延の AI 機能が必要（ユーザー入力のたびに発火）、オフラインでも AI 機能を使いたい、AI 機能の限界コストを抑えたい（スケールしても費用ゼロ）。向いていないのは：リアルタイム Web 検索が必須、超長文生成、最高水準のコード生成が必要な場合だ。

Apple Silicon がないデバイスでも Apple Intelligence は使えるか？

一部は使える。Foundation Models 2.0 のフル端末内推論には A17 Pro（iPhone 15 Pro）以上、または M1 以上の Mac / iPad が必要だ。古いデバイスは PCC 経由で一部機能を利用できるが、ネットワーク接続が必要で、機能セットは限定的だ。旧デバイス対応 App には fallback 戦略の実装が必須だ。

WWDC26 後、すぐに App を動かすべきか？

パニックは不要だが、今からスケジュールに入れる価値がある：（1）どの機能を App Intents に載せられるか評価する——Siri Agent 時代のトラフィック入口だ；（2）Foundation Models 2.0 の PoC を計画する——限界コストが高くプライバシー要求の厳しい機能から試す；（3）CI 環境を Xcode 27 に更新する——Cloud Mac でバージョンを固定し、GitHub hosted runner の不確実性を避ける。

VPSSpark Cloud Mac とはどう関係するのか？

WWDC26 で発表された機能は、Xcode 27 + iOS 26 SDK でないとフルに開発・テストできない。Cloud Mac は固定バージョンの macOS + Xcode 環境を提供し、WWDC 直後の数週間から最新 SDK で CI を安定稼働させられる——GitHub hosted runner の更新待ちをしなくていい。Siri Agent の App Intent 統合も、Foundation Models 2.0 のマルチモーダル API も、Cloud Mac の Xcode 27 環境ですぐに試せる。

まとめ：Apple が勝ちたい戦争は、あなたの想像と違う

前半戦で Apple が負けたのは、「どのチャットボットが一番賢いか」の競争だ。この競争では勝てなかったし、勝とうともしなかった。

後半戦で勝ちたい問いは別だ：AI がどこにでもあり、能力も十分になったとき、誰の AI が最も信頼でき、生活に最も深く溶け込んでいるか？

これに即答はなく、MMLU スコアのように一目瞭然の指標もない。だがそれこそが Apple がこの戦場を選んだ理由だ：速いスコアリングのない競争では、先行者優位より長期の信頼の蓄積が効き、信頼は Apple が最も得意とするところだ。

Apple は AI の前半戦を勝ち取れなかった。しかし WWDC26 は、少なくとも「どの球を打とうとしているか」ははっきりした。次の 5 年、この賭けが成立するか——また語り合おう。