📅週間レポート🤔省察

週間AIニュースまとめ #002 - Google I/O 2026とエージェント優先の時代

Park Labs

2026年5月26日

2026年5月18日(月) - 5月24日(日)

8分

週間AIニュースまとめの第2回。今週はほぼGoogle I/O 2026の一週間だった。Gemini 3.5 FlashからAntigravity 2.0、Managed Agents、Gemini Spark、Omniまで、「AIが自分で動くエージェント」へ向かう流れが一気に出てきて、その隣でサプライチェーン攻撃と信頼の問題も同じだけ大きくなった。

週間AIニュースまとめの第2回。2026年5月18日(月)から24日(日)までを振り返ると、今週はほぼGoogle I/O 2026の一週間だった。そして流れの方向ははっきりしていた。AIは「質問に答える道具」から「自分で立ち上がって動くエージェント」へ移っている。

🔬 今週の大きな流れ

先週が「AIが作業環境の中に入ってくる」だったとすれば、今週はもう一歩進んだ。Google I/O 2026で出てきた発表は、どれも「エージェント優先(agent-first)」を指していた。

モデルは速くなり、プラットフォームはエージェント中心に再編された

Gemini 3.5 Flash、Antigravity 2.0、Managed Agents APIが同じ日に出た。

エージェントは常時オンへ向かう

Gemini SparkはノートPCを閉じてもクラウドで24時間動き続ける個人秘書だ。

その隣で信頼とセキュリティの問題も同時に大きくなった

GitHub内部流出、PHP生態系への侵害、SynthIDウォーターマークを巡る攻防。エージェントが強くなるほど「何を信じて任せるか」が重くなる。

先週のメモで「次の競争力は信頼の設計から出る」と書いたが、今週はまさにその両面 — 強力なエージェントと、それに比例して大きくなったリスク — が一緒に来た。

🔒 またサプライチェーン攻撃: GitHub内部流出とPHP侵害

先週のnpm事件に続き、今週はGitHub自体とPHP生態系がやられた。

GitHub内部リポジトリ流出

GitHub社員がNX Consoleを偽装した悪意あるVS Code拡張をインストールしたのが発端。内部リポジトリ約3,800件に不正アクセスが発生した。幸いGitHub自社の内部コードに限定され、一般ユーザーや顧客データへの被害はないと発表された。手口は、有名な拡張に偽装してインストールを誘導し、DNSトンネリングなどでデータを外部に持ち出すというものだった。

LaravelLangの管理権限乗っ取り

PHPの多言語ライブラリLaravelLangの管理権限が奪われ、700以上のリポジトリが影響を受けた。AWS、GCP、Azureのアクセスキーなど機密情報がターゲットだった。

先週はnpmパッケージのインストール経由、今週はVS Code拡張＋PHPパッケージのインストール経由。「インストールすること」自体が、ますますリスクになりつつある。

Park Labsのようにひとりで複数サービスを運営すると、依存関係とツールチェーンがそのまま攻撃表面になる。面倒でも自動アップデートを止め、拡張は信頼できる発行元だけ残し、よく狙われるAPIキーやトークンを定期的にローテーションしておくのが現実的な防御だ。

🤖 Google I/O ① モデルと開発プラットフォーム

Gemini 3.5 Flash

マルチモーダル、特に映像・チャート分析で高評価。CharXiv Reasoning 84.2%、MMMU-Pro 83.6%で、これらの項目ではClaude Opus 4.7やGPT-5.5を上回ったという分析もある。ただし推論(thinking)トークンは出力単価で課金され、3.5 Flashは推論トークンの消費が平均の約2倍。Artificial Analysis基準では実際の評価コストが$1,551で、むしろ3.1 Proを超えた。「Flashらしいコスパ」には疑問符がついた。6月公開予定の3.5 Proのほうが個人的には気になる。

Antigravity 2.0

エージェント優先の開発プラットフォーム。デスクトップアプリ(複数エージェント並列実行・スケジュールタスク)、Goで書き直されたCLI、カスタムエージェントを定義するSDKで構成される。既存のGemini CLIのAgent Skills、Hooks、Subagentsは「Antigravityプラグイン」として継承される。I/Oのライブデモでは93のサブエージェントを並列実行して26億トークンを処理し、$1,000以下で動くOSを構築。その上でDOOMを実行しようとしてドライバ不足で失敗すると、その場でドライバを生成して解決した。一方、急なUI変更には批判が多く、右上に「Open IDE」ボタンを追加して従来のIDE形式に切り替えられるようにパッチ予定とのこと。そしてGemini CLIは6/18に終了予定なので、Antigravity CLIへの移行が必須だ。

Managed Agents API

Gemini APIに、自律エージェントをクラウドですぐ動かす機能がプレビューで追加された。API1回の呼び出しで、隔離されたLinuxサンドボックス上にエージェントが起動し、推論 → ツール呼び出し → コード実行 → ウェブブラウジング → ファイル管理を自律的に行う。AGENTS.md、SKILL.mdのようなマークダウンでエージェントを定義すれば、別途のオーケストレーションコードなしでデプロイできる。ひとことで言えば「エージェント実行環境のサーバーレス化」だ。

✨ Google I/O ② 常時オンのエージェントとワールドモデル

Gemini Spark

24時間クラウドに常駐する個人AIエージェント。ノートPCを閉じても、スマホをロックしてもバックグラウンドで動き続ける。Gmail・Docs・SlidesなどWorkspaceと深く連携し、「毎週月曜9時に先週のメールを整理して優先度別のToDoを作成」「カード明細から隠れたサブスクを検知」「領収書を自動でスプレッドシートに記録」といったことをこなす。決済・メール送信などの高リスク行動は事前確認の上で実行する。現在は米国のAI Ultra加入者向けベータ。OpenClawやHermes Agentで話してきた個人秘書を、Googleが自社の生態系の上で実装した格好だ。

Gemini Omni

単なる動画生成モデルではなく、Demis Hassabisが「ワールドモデル」と呼んだ — 世界を理解し、次に起こることを推論するシステムだ。重力・運動エネルギー・流体力学などの物理法則への直感を備え、最初のモデルOmni Flashはプロンプト1回で音声同期した10秒クリップを生成し、チャットでスタイル・カメラアングル・背景を修正できる。SynthIDウォーターマークが自動挿入される。「AGIに向かうにはAnything to Anythingにならなければならない」という言葉が印象的だった。

検索のエージェント化

AI Modeの基本モデルがGemini 3.5 Flashに上がり、25年ぶりに検索窓が再設計された。検索の中で直接エージェントを作れ、「情報エージェント」が24時間ウェブの変化を追跡して通知してくれる。Personal Intelligenceは約200カ国・98言語へ拡大(サブスク不要)。「検索窓に質問してリンクの一覧をもらう」時代が本当に終わりつつある。

AI Studioでネイティブ Androidアプリ

インストール不要、ブラウザだけでプロンプト → 開発 → エミュレーターでプレビュー → 実機にインストール → Play内部テストへデプロイまで一気通貫。GPS・NFC・カメラなどハードウェアセンサーにネイティブアクセスする、本物のネイティブアプリだ。

🛡️ Anthropic: 強力なモデルとそのジレンマ

Project Glasswing 初期結果

4月に発表したセキュリティプロジェクトの1ヶ月の成果が公開された。未公開フロンティアモデルClaude Mythos Previewを使い、パートナー全体で高リスク・致命的な脆弱性を1万件以上発見。Cloudflareは約2,000件(うち高リスク・致命400件)、MozillaはFirefox 150で271件を発見・修正、オープンソース1,000件以上をスキャンして6,202件の高リスク脆弱性を推定した。AWS、Apple、Google、Microsoft、NVIDIA、JPMorganChaseなどがパートナーとして参加する。ただしAnthropic自身が「悪用防止の安全装置がまだ十分でない」として一般公開はせず、信頼パートナーにのみ限定提供中だ。1ヶ月で1万件という結果と同じくらい、「強力すぎるモデルのジレンマ」が現実になった点が印象的だった。

Karpathy、Anthropicに合流

「バイブコーディング」という言葉を生んだAndrej KarpathyがAnthropicの事前学習(Pre-training)チームに合流した。OpenAI共同創業者であり、Tesla Autopilotを率いた人物だ。Claudeを活用して事前学習研究を加速させるチームを新たに構築する予定だという。

🧮 OpenAI: AIが数学難題を自ら反証する

80年来のエルデシュ予想を反証

OpenAIの内部推論モデルが、平面単位距離問題(1946年にPaul Erdősが提起)で「正方格子が最適」という80年来の定説を反証した。代数的整数論を活用して正方格子を多項式的に超える無限構成族を発見し、外部の数学者(プリンストンのWill Sawin)が検証・精密化した。重要なのは、数学専用モデルではなく汎用推論モデルが自律的に新しいアイデアを思いついた点だ。「AIが本当に数学をする」初の事例と言われているが、正直、素直に喜んでいいのか少し怖くもなった。

Codexアップデート

「コーディングエージェント」を超えて「Macを丸ごと扱うエージェント」へ進化中だ。Appshots(Commandキー2回で現在のアプリ画面をコンテキストとして送信)、ロック状態でも動作するRemote Computer Use、そして目標を与えると数時間〜数日にわたり自律作業するGoal Modeの正式化。最近Codexはかなり良くなっているので、Claude Codeと両方を使いながら比較している。

💡 今週感じたこと

今週いちばん強く思ったのは「エージェント優先が、もう一社の実験ではなく業界の標準になった」ということだ。

Googleはモデル(Gemini 3.5)から開発ツール(Antigravity)、API(Managed Agents)、個人秘書(Spark)、検索まで、すべてをエージェント中心に敷き直した。OpenAIのCodexはMac全体を扱い始め、Anthropicはモデルで脆弱性を1万件見つけた。方向は同じだ。AIは人が指示したことを実行する段階を超え、環境を直接扱い、長時間自律的に動くようになっている。

だからひとり開発者としての問いも変わる。

どのエージェントプラットフォームにロックインするか(Gemini CLIの廃止のように、ツールはいつでも消える)

常時オンのエージェントに、自分のアカウントとデータをどこまで接続するか

推論トークンのような「見えないコスト」をどう予測するか

インストール・接続するすべてが攻撃表面だという前提を、どう運用に落とすか

強力なエージェントは確かにひとり運用のレバレッジだ。ただ今週のセキュリティ事件が示すように、レバレッジが大きいほど小さなミスのコストも大きくなる。Park Labsもエージェントを積極的に使いつつ、権限・コスト・信頼の境界は狭く取り続けたい。