よく検索されている質問
- Apple WWDC26 で発表された AI 新機能は何か?
- Siri Agent は従来の Siri と本質的に何が違うのか?
- Apple Intelligence はなぜ「アップグレード」ではなく「再出発」と言われるのか?
- Foundation Models 2.0 で開発者は何ができるようになるのか?
- Apple のプライバシー優先 AI 路線は OpenAI / Google に商業的に勝てるのか?
2022 年 11 月、ChatGPT が公開された。それから 3 年間、テック業界は同じ問いを繰り返してきた:Apple はどこにいるのか?
Siri は相変わらず「検索しましょうか?」と聞き、Bing Chat は週報の下書きまで書いてくれる。Google Gemini は Android に深く組み込まれているのに、iPhone で Siri を開くとあの色とりどりの球体が現れ——「すみません、よく聞き取れませんでした」と返ってくる。
2024 年、Apple は Apple Intelligence を発表し、Siri を「再定義する」と約束した。そして——延期。さらに延期。一部の機能は iOS 18.4 で静かに現れ、iOS 18.5 でまた消えた。
Apple は AI の前半戦を勝ち取れなかった。これは事実だ。しかし WWDC26 で Tim Cook と Craig Federighi がステージに立ち、パッチではなく反撃宣言を発表した——Siri Agent、Foundation Models 2.0、Apple Intelligence の本格展開、そしてプライバシー AI への長期ベット。
本稿では、Apple が前半戦でなぜ遅れたのか、WWDC26 で具体的に何が出たのか、そして次の 10 年に向けた賭けが「戦線縮小の保守策」なのか「もっと大きな賭け」なのかを、順を追って整理する。
1 · 前半戦:Apple はなぜ遅れたのか?
1.1 Siri の構造的な限界
Siri は 2011 年に登場し、ChatGPT より 11 年早い。しかし早く出たからといって先を行ったわけではない——Siri の基盤は「ルールエンジン + 音声認識 + API ブリッジ」の組み合わせであり、言語モデルではなかった。できることは事前に決め打ちされている:アラーム設定、音楽再生、天気確認。ここから外れると「ウェブでいくつか見つかりました」で終わる。
GPT-4 が示したのはまったく別次元の能力だ:意図を理解し、推論し、文脈をまたいで動ける。これは Siri が「1 世代遅れている」問題ではなく、状態機械と言語モデルという、根本的に異なる 2 つの設計思想の差だ。
1.2 Apple Intelligence 延期の謎
2024 年の WWDC で Apple は Apple Intelligence を発表した——端末内インテリジェンス、書き直された Siri、ChatGPT 統合、Private Cloud Compute。会場は喝采に包まれた。ところが多くの機能は iOS 18.1、18.2、18.4……と段階的にしか届かなかった。
延期の裏には、あまり語られない構造的理由もある:Apple の AI の進め方は、本質的に OpenAI より遅い。OpenAI はサーバー側でモデルをこっそり差し替えても、ユーザーは気づかない。Apple の更新はすべて App Store 審査を通り、iOS の新バージョンで出荷され、40 億台のデバイスで安定稼働しなければならない——世界で最も厳しい AI デプロイ条件だ。
1.3 認識のギャップ:物語は負けたが、技術は必ずしも負けていない
見落とされがちな事実がある:Neural Engine は 2017 年の A11 から搭載されている。エッジ AI ハードウェアへの先手は、多くの AI プレイヤーより早い。M シリーズの NPU 性能は業界トップクラスだ。Foundation Models の端末内 3B パラメータモデルができることは、多くの人の予想を上回っている。
Apple が負けたのは、主に「目に見える AI 体験」——メディアがスクショを拡散し、ユーザーが友人の前で自慢できる瞬間だ。前半戦を負けても、未来の手札まで失ったわけではない。
2 · WWDC26 全解析:実際に何が発表されたか?
2.1 Siri Agent:ついに「話す」から「やる」へ
WWDC26 で最も重要な転換点だ。従来の Siri は質問応答インターフェース——聞かれて答える。新しい Siri Agent は行動の実行者——目標を伝えれば、完了まで動く。
能力の差は二点に集約される:App 間のアクション連携と多段階タスクの計画実行。
| 能力 | 旧 Siri | Siri Agent(WWDC26) |
|---|---|---|
| タスク種別 | 単一コマンド、即答 | 多段階タスク、自動分解・実行 |
| App 連携 | SiriKit 対応 App に限定 | App Intents によるクロス App 実行 |
| 個人コンテキスト | 基本:名前・カレンダー | 深層:メール・メッセージ・写真・ヘルスデータ |
| エラー処理 | 失敗したら諦め、手動を促す | 途中で確認を挟み、続行 |
| 推論エンジン | ルール木 + 音声認識 | 言語モデル + プラン実行グラフ |
具体例:Siri Agent に「昨日の会議の録音を ToDo リストにまとめて、仕事用グループに送って、明日のフォローアップ会議をカレンダーに入れて」と頼む——メモ・メッセージ・カレンダーの 3 App をまたぐ 4 ステップのタスクだ。旧 Siri は「検索してみます」としか言えない。Siri Agent は実際に実行する。
その仕組みは App Intents 2.0——システム App の数百の「意図」を Siri Agent から呼び出せるようになり、サードパーティも AppIntent プロトコルでコアアクションを公開できる。Siri Agent の本質は LLM 駆動の Intent ルーティングエンジンで、Intent が世界を操作する「手」になる。
2.2 Apple Intelligence 本格展開:「プレビュー」から「正式版」へ
WWDC26 で最も率直なシグナルは、Apple Intelligence の横にあった「Beta」ラベルが外れたことだ。単語の変更ではない——十分に安定し、十分に完成し、製品として胸を張って言える段階に来たという宣言だ。
具体的な展開内容:
- Writing Tools の全言語対応:書き換え・要約・トーン調整が、繁体中国語・日本語・韓国語を含む 20 言語以上に拡大
- Image Playground の強化:カートゥーン調から多様な画風へ。連絡先ベースの「パーソナライズ Genmoji」も追加
- Photo Intelligence の向上:「去年の夏に海辺で撮った写真」といった自然言語検索の精度が大幅改善
- 通知サマリーの改善:昨年批判された「ニュースを誤って釣りタイトル化する」問題を修正し、重要度の階層表示を追加
- Screen Awareness(画面認識):Siri が今見ている画面を理解し、その文脈で回答・操作できる
2.3 Foundation Models 2.0:開発者向けの本当の弾薬
昨年の Foundation Models フレームワークはすでに衝撃的だった——token 費ゼロ、API Key 不要、データは端末外に出ない。WWDC26 の Foundation Models 2.0 はさらに一歩進んだ:
import FoundationModels
let session = LanguageModelSession()
// 新機能:ビジョン理解(画像を渡して直接推論)
let image = UIImage(named: "receipt.jpg")!
let result = try await session.respond(
to: "Extract line items from this receipt as JSON",
including: [.image(image)]
)
// 新機能:構造化出力(Swift Codable を直接返す)
struct Invoice: Codable {
let vendor: String
let total: Double
let items: [InvoiceItem]
}
let invoice = try await session.respond(
to: "Parse this invoice",
including: [.image(image)],
generating: Invoice.self
)
主なアップグレード:
- マルチモーダル:画像を直接渡し、端末内で視覚 + 言語の共同推論
- 構造化出力:Swift Codable オブジェクトを直接生成、JSON 文字列の手動パースが不要
- Streaming 応答:逐次ストリーミング出力、リアルタイム表示向き
- Tool Calling:推論中に定義した関数を呼び出し、Agent 的タスクを実現
- Python SDK + fm CLI:Swift 以外からも接続可能、スクリプト・バックエンドツール向け
- フレームワークのオープンソース化:Foundation Models フレームワーク本体を GitHub で公開、コミュニティ貢献を受け付け
| 能力 | Foundation Models(2025) | Foundation Models 2.0(WWDC26) |
|---|---|---|
| 言語理解 | ✓ テキスト入力 | ✓ テキスト + 画像入力 |
| 出力形式 | プレーンテキスト | テキスト / JSON / Swift Codable |
| 出力方式 | 完了後に一括返却 | Streaming 逐次出力 |
| Agent 能力 | なし | Tool Calling フレームワーク |
| 言語サポート | Swift のみ | Swift + Python SDK + CLI |
| オープンソース | クローズド | フレームワーク OSS |
2.4 Private Cloud Compute 2.0:クラウド推論でもプライバシーを検証可能に
端末内 3B モデルでは足りないタスクに対し、Apple の答えは「OpenAI に任せよう」ではなく Private Cloud Compute(PCC)——Apple 自社運用の AI 推論クラスタで、プライバシーへのコミットは端末内と同じ水準だ。
PCC 2.0 のキー改善は Security Research Virtual Machine——セキュリティ研究者が PCC ノードの VM レプリカを申請・起動し、Apple のプライバシー主張を自分の目で検証できる。「信じてくれ」ではなく「自分で確かめてくれ」——これ以上ない trust but verify の表現だ。
2.5 macOS 26 Tahoe × iOS 26:AI が OS の各層に浸透
WWDC26 では macOS 26 Tahoe と iOS 26 も発表された。AI は独立した「機能モジュール」ではなく、OS のあらゆる層に浸透している:
- Xcode 27 のローカル補完:マルチラインコード補完が Apple Silicon 上でローカル実行、クラウド往復なし
- Safari スマート要約:ウェブページ要約を端末内で生成、サーバーに送信しない
- Finder セマンティック検索:「先月の決算関連の Excel を探して」——自然言語でローカルファイル検索
- メールのスマート下書き:過去のメール文体を学習して返信を生成、完全オフライン
- ヘルス App の AI コーチ:ヘルスデータに基づくパーソナライズ提案、データは端末外に出ない
図 1 · Apple Intelligence アーキテクチャ:端末内から PCC、サードパーティ AI へ
3 · 戦略解析:Apple は何に賭けているのか?
3.1 プライバシーはスローガンではなく、ビジネスの堀
Apple の AI 戦略を理解する鍵は、「プライバシー」をブランドコピーから商業的な参入障壁に戻すことだ。
OpenAI と Google の強みは、大量のデータ・大量の算力・高速イテレーションだ。Apple はこの二つでは追いつけない——AI ユーザー行動データも、A100 / H100 規模の GPU もない。選んだのは別の曲線:最強の AI を端末内に持ち込み、「データを上げなくていい」ことを制約ではなく価値にする。
その副産物として、OpenAI が真似しにくい堀ができる:借りたサーバーでは本当の「ユーザーデータは端末外に出ない」は実現できない。GDPR の執行強化や各国のデータ主権法が進むほど、このアーキテクチャ優位は価値を増す。
3.2 エコシステムのロックイン:AI × Apple Silicon × App エコシステム
WWDC26 の設計は意図的だ:ほぼすべての新 AI 機能が A17 Pro 以上または M シリーズでないとフル動作しない。明確な換機インセンティブ——Siri Agent を使いたいなら iPhone 17 へ。Mac で Foundation Models 2.0 のローカル推論を回したいなら、M シリーズの性能差は顕著だ。
同時に App Intents の深い統合により、iOS / macOS エコシステムの開発者は追随を迫られる——App Intents に対応した App は Siri Agent 経由で自然に露出し、未対応 App は徐々に周縁化される。これは Apple お馴染みのエコシステムガバナンス:命令ではなく機能で開発者を導く。
3.3 長期ベット:OS レベル AI vs API レベル AI
OpenAI、Anthropic、Google DeepMind の路線は本質的に「AI as a Service」——API を叩き、百万 token あたりの料金を払い、最強モデルの能力を享受する。2025〜2026 年の商業化は成功しているが、根本的な脆弱性がある:API は誰でも差し替えられる——Apple 自身もそうだ。
Apple の賭けは:AI を差し替え可能なサービスではなく、OS の一部にすること。Siri Agent のデバイスコンテキスト理解、Foundation Models の NPU 深層統合、PCC の Secure Enclave 依存——いずれも「Apple の AI」をサードパーティに置き換えにくくしている。
4 · 開発者視点:WWDC26 は何を変えたか?
4.1 App Intents:「任意」から「必須」へ
iOS App をメンテしているなら、WWDC26 後に backlog に入れるべきことが一つある:コア機能のうち、どれを App Intent として公開できるかを棚卸しする。
Siri Agent の能力上限 = App Intents に登録されたアクションの集合。公開する Intent ひとつひとつが、Siri Agent がユーザーに代わって実行できる操作になる。ユーザーが「[あなたの App] で X して」と言っても Intent がなければ、Siri は「この App はまだ対応していません」としか言えない。
import AppIntents
struct CreateNoteIntent: AppIntent {
static var title: LocalizedStringResource = "Create New Note"
static var description = IntentDescription("Create a new note in the app")
@Parameter(title: "Content") var content: String
func perform() async throws -> some IntentResult {
// ビジネスロジックをここに
let note = NoteService.create(content: content)
return .result(value: note.id)
}
}
4.2 Foundation Models 2.0 の実用シナリオ
マルチモーダル、構造化出力、Tool Calling により、Foundation Models 2.0 の適用範囲は大きく広がった:
| シナリオ | 実装方法 | 推奨レイヤー |
|---|---|---|
| 請求書 / レシート解析 | 撮影 → 画像入力 → 構造化 JSON 出力 | 端末内完結、API 費ゼロ |
| ローカルファイル要約 | PDF テキスト → 端末内要約 → Streaming 表示 | 端末内完結、プライバシー確保 |
| スマートフォーム入力 | 自然言語 → Codable オブジェクトでフォーム自動入力 | 端末内完結、UX 大幅改善 |
| 医療 / ヘルスデータ分析 | HealthKit データ → 端末内推論 → パーソナライズ提案 | 端末内必須、法規制対応 |
| 社内ファイル検索 | セマンティック検索 + Tool Calling でローカル DB 照会 | 端末内 + PCC、データは社内に留まる |
4.3 開発環境の新課題:Xcode 27 + iOS 26 SDK のバージョン固定
これらの新機能はすべて Xcode 27 と iOS 26 SDK に依存する。つまりビルド環境の追随が必要だ——ここが本当に面倒なところだ。
Foundation Models 2.0 の API はシミュレータと実機で挙動が異なる。Siri Agent の App Intent 統合は特定バージョンの Xcode でないと正しくインデックスされない。PCC の統合テストには専用の entitlement が要る。CI が GitHub hosted runner 上なら、Xcode 27 対応の不確実なスケジュールを待つことになる——Cloud Mac なら、WWDC26 終了後数時間で Xcode 27 beta に更新できる。
5 · 次の 10 年の棋譜
5.1 規制の追い風:プライバシー法が Apple の設計を高く評価する
2026 年、世界の AI 規制は加速している:EU AI Act の執行期入り、米国各州の AI 透明性法案、中国の生成 AI 管理規定の更新。この環境では「監査に耐えるプライバシーアーキテクチャ」は希少で、価値が上がる。
Apple の PCC 検証可能設計、Foundation Models の端末内設計、ヘルスデータへの差分プライバシー——消費者市場ではブランド加点にとどまるが、企業・医療・金融市場では調達の前提条件になる。
5.2 ハード × ソフトの協調:他社が真似しにくいフライホイール
あまり語られない現実がある:Apple は AI チップ・AI OS・AI アプリフレームワーク・AI 端末をすべて自社で設計する、地球上で唯一の企業だ。Google は TPU を設計するが Pixel は主流デバイスではない。Qualcomm は NPU を設計するがソフトは作らない。Microsoft は AI ソフトを作るがハードは第三者依存だ。
この垂直統合により、他社にはできない最適化が可能になる:Foundation Models の推論パスを Neural Engine の命令セットに直接チューニングできる。Siri Agent の応答遅延を 50ms 以内に抑えられる——ハードとソフトが同じチームだからだ。
5.3 オープンソースのシグナル:信頼構築とエコシステム引力
Foundation Models フレームワークの OSS 化は、WWDC26 で過小評価されがちな動きだ。Apple はオープンソースに慣れない会社——強みは常に閉じたエコシステムの品質管理だった。このタイミングで Foundation Models を OSS にしたのは、信頼構築の動きだ:外部研究者や企業のセキュリティチームが監査できるようにするためだ。
エコシステム引力の構築でもある:OSS フレームワークが研究者を引きつけ、論文が書かれ、引用が増え、開発者採用が広がり、サードパーティ App が豊かになり、Siri Agent が強くなる。Apple Silicon + Swift エコシステムの再演だ——今度は AI のレイヤーで。
6 · 客観評価:Apple は後半戦を勝ったのか?
ここで過度に楽観的、あるいは悲観的な結論は避けたい。いくつかの現実的な課題を見てみよう:
6.1 Apple が直面する現実的な課題
- 端末内モデルの天井は現実的:3B パラメータモデルは、複雑な推論・コード生成・長コンテキストでは GPT-5.5 / Claude Opus 4 との差が構造的だ。Siri Agent は「会議録を ToDo にまとめる」はできるが、「この Swift プロジェクトのアーキテクチャを再設計して」は無理だ。
- サードパーティ App 統合には時間がかかる:App Intents エコシステムは開発者の協力に依存する。WWDC26 後、十分な数の App が Siri Agent 深層統合に対応するまで 6〜18 ヶ月かかる可能性がある。
- 非英語市場の体験にはまだギャップがある:繁体中国語・日本語・韓国語の自然言語理解は WWDC26 で改善されたが、英語版との会話の滑らかさの差は依然として目立つ。
- ユーザー習慣の移行には教育が必要:多くのユーザーは複雑なタスクを ChatGPT など別アプリで済ませる習慣がある。Siri Agent を信頼させるには行動変容の時間が要る。
6.2 Apple が勝てる可能性のある領域
しかし、いくつかの次元では Apple は確かな優位を築いている:
プライバシー敏感なシーン:医療・法務・財務・企業内部データ——こうしたユーザーは、能力が少し劣ってもデータが端末外に出ない AI を選ぶ。OpenAI のサーバーに機密データを送るよりマシだ。この種の AI 採用が進むほど、Apple のシェアは自然に伸びる。
日常の高頻度・低複雑度タスク:要約・翻訳・書き換え・分類——AI 使用量の大半を占めるが、GPT-5.5 級の知能は不要だ。端末内 Foundation Models で十分、遅延も低く、費用もゼロ。日常ユーザーにとって「十分良くて無料」は、しばしば「最強だが従量課金」より魅力的だ。
OS 統合の深さ:Siri Agent がカレンダー・メール・メッセージ・写真を読める能力は、サードパーティ AI App には不可能——Apple は競合にこれらの API を開放しない。このシステム統合の堀は、短期では誰も複製できない。
7 · FAQ
Siri Agent は今、ChatGPT のできることを全部できるのか?
完全な代替ではない。ターゲットシーンが違う。ChatGPT の強みは「オープンドメイン推論・コード生成・複雑な創作」;Siri Agent の強みは「デバイスコンテキストの深い統合・クロス App タスク実行・プライバシー敏感な操作」だ。理想的には併用であり、二択ではない:Siri Agent がデバイスと生活を管理し、ChatGPT が複雑な思考と創作を担う。
Foundation Models 2.0 は自分の App に向いているか?
以下のいずれかに当てはまれば、非常に向いている:ユーザーのプライバシーデータを扱う(健康・財務・個人ファイル)、高頻度・低遅延の AI 機能が必要(ユーザー入力のたびに発火)、オフラインでも AI 機能を使いたい、AI 機能の限界コストを抑えたい(スケールしても費用ゼロ)。向いていないのは:リアルタイム Web 検索が必須、超長文生成、最高水準のコード生成が必要な場合だ。
Apple Silicon がないデバイスでも Apple Intelligence は使えるか?
一部は使える。Foundation Models 2.0 のフル端末内推論には A17 Pro(iPhone 15 Pro)以上、または M1 以上の Mac / iPad が必要だ。古いデバイスは PCC 経由で一部機能を利用できるが、ネットワーク接続が必要で、機能セットは限定的だ。旧デバイス対応 App には fallback 戦略の実装が必須だ。
WWDC26 後、すぐに App を動かすべきか?
パニックは不要だが、今からスケジュールに入れる価値がある:(1)どの機能を App Intents に載せられるか評価する——Siri Agent 時代のトラフィック入口だ;(2)Foundation Models 2.0 の PoC を計画する——限界コストが高くプライバシー要求の厳しい機能から試す;(3)CI 環境を Xcode 27 に更新する——Cloud Mac でバージョンを固定し、GitHub hosted runner の不確実性を避ける。
VPSSpark Cloud Mac とはどう関係するのか?
WWDC26 で発表された機能は、Xcode 27 + iOS 26 SDK でないとフルに開発・テストできない。Cloud Mac は固定バージョンの macOS + Xcode 環境を提供し、WWDC 直後の数週間から最新 SDK で CI を安定稼働させられる——GitHub hosted runner の更新待ちをしなくていい。Siri Agent の App Intent 統合も、Foundation Models 2.0 のマルチモーダル API も、Cloud Mac の Xcode 27 環境ですぐに試せる。
まとめ:Apple が勝ちたい戦争は、あなたの想像と違う
前半戦で Apple が負けたのは、「どのチャットボットが一番賢いか」の競争だ。この競争では勝てなかったし、勝とうともしなかった。
後半戦で勝ちたい問いは別だ:AI がどこにでもあり、能力も十分になったとき、誰の AI が最も信頼でき、生活に最も深く溶け込んでいるか?
これに即答はなく、MMLU スコアのように一目瞭然の指標もない。だがそれこそが Apple がこの戦場を選んだ理由だ:速いスコアリングのない競争では、先行者優位より長期の信頼の蓄積が効き、信頼は Apple が最も得意とするところだ。
Apple は AI の前半戦を勝ち取れなかった。しかし WWDC26 は、少なくとも「どの球を打とうとしているか」ははっきりした。次の 5 年、この賭けが成立するか——また語り合おう。
WWDC26 後:まず Xcode 27 環境を固定してから、AI 機能開発へ
Siri Agent の App Intents や Foundation Models 2.0 を App に組み込みながら、Xcode 27 / iOS 26 のビルド環境を固定したいなら、VPSSpark Cloud Mac が開発・CI の macOS 実行基盤になる——WWDC26 後数時間で最新 beta SDK に更新でき、チームメイトより一歩先に走れる。
Cloud Mac プランを見る、Apple Intelligence 開発を初日から安定環境で。