주간 AI 뉴스 정리 #002 - Google I/O 2026과 에이전트 우선 시대
주간 AI 뉴스 정리 두 번째 글. 이번 주는 Google I/O 2026이 거의 모든 화제를 가져갔다. Gemini 3.5 Flash부터 Antigravity 2.0, Managed Agents, Gemini Spark, Omni까지 'AI가 직접 일하는 에이전트'로 향하는 흐름이 한꺼번에 쏟아졌고, 그 옆에서 공급망 공격과 신뢰 문제도 같이 커졌다.
주간 AI 뉴스 정리 두 번째 글이다. 2026년 5월 18일 월요일부터 24일 일요일까지의 뉴스를 정리해보니, 이번 주는 거의 Google I/O 2026 한 주였다. 그리고 그 흐름의 방향은 분명했다. AI가 "질문에 답하는 도구"에서 "스스로 켜져서 일하는 에이전트"로 넘어가고 있다.
🔬 이번 주의 큰 흐름
지난주가 "AI가 작업 환경 안으로 들어온다"였다면, 이번 주는 한 단계 더 나아갔다. Google I/O 2026에서 쏟아진 발표들은 하나같이 "에이전트 우선(agent-first)"을 가리켰다.
모델은 빨라지고, 플랫폼은 에이전트 중심으로 재편됐다
Gemini 3.5 Flash, Antigravity 2.0, Managed Agents API가 같은 날 나왔다.
에이전트가 항상 켜져 있는 쪽으로 간다
Gemini Spark는 노트북을 닫아도 클라우드에서 24시간 돌아가는 개인 비서다.
그 옆에서 신뢰와 보안 문제가 같이 커졌다
GitHub 내부 유출과 PHP 생태계 침해, SynthID 워터마크를 둘러싼 공방까지. 에이전트가 강해질수록 "무엇을 믿고 맡길 것인가"가 더 무거워졌다.
지난주 메모에서 "다음 경쟁력은 신뢰 설계에서 나온다"고 적었는데, 이번 주는 정확히 그 양면 — 강력한 에이전트와 그만큼 커진 위험 — 이 같이 왔다.
🔒 또 공급망 공격: GitHub 내부 유출과 PHP 생태계 침해
지난주 npm 사건에 이어, 이번 주는 GitHub 자체와 PHP 생태계가 당했다.
GitHub 내부 리포지토리 유출
GitHub 직원이 NX Console을 사칭한 악성 VS Code 확장을 설치한 게 발단이었다. 내부 리포지토리 약 3,800건에 무단 접근이 발생했다. 다행히 GitHub 자사 내부 코드에 한정됐고, 일반 사용자나 고객 데이터 피해는 없다고 발표됐다. 수법은 유명 확장으로 위장해 설치를 유도하고, DNS 터널링 등으로 데이터를 빼내는 방식이었다.
LaravelLang 관리 권한 탈취
PHP 다국어 라이브러리 LaravelLang의 관리 권한이 탈취돼 700개 이상의 리포지토리가 영향을 받았다. AWS, GCP, Azure 액세스 키 같은 민감 정보가 표적이었다.
지난주는 npm 패키지 설치 경유, 이번 주는 VS Code 확장 + PHP 패키지 설치 경유다. "무언가를 설치하는 것" 자체가 점점 더 큰 리스크가 되고 있다.
Park Labs처럼 1인이 여러 서비스를 운영하면, 의존성과 도구 체인이 곧 공격 표면이다. 귀찮아도 자동 업데이트를 멈추고, 확장은 신뢰할 수 있는 발행처만 남기고, 자주 노려지는 API 키와 토큰은 주기적으로 로테이션해 두는 게 현실적인 방어다.
🤖 Google I/O ① 모델과 개발 플랫폼
Gemini 3.5 Flash
멀티모달, 특히 영상·차트 분석에서 호평을 받았다. CharXiv Reasoning 84.2%, MMMU-Pro 83.6%로 일부 항목에서는 Claude Opus 4.7, GPT-5.5를 앞섰다는 분석도 나왔다. 다만 추론(thinking) 토큰을 출력 단가로 과금하는데 3.5 Flash는 추론 토큰 소비가 평균의 약 2배라, Artificial Analysis 기준 실제 평가 비용은 $1,551로 오히려 3.1 Pro를 넘었다. "Flash다운 가성비"에는 의문이 붙었다. 6월 공개 예정인 3.5 Pro 쪽이 더 기대된다.
Antigravity 2.0
에이전트 우선 개발 플랫폼이다. 데스크톱 앱(멀티 에이전트 병렬 실행·스케줄 작업), Go로 재작성된 CLI, 커스텀 에이전트를 정의하는 SDK로 구성된다. 기존 Gemini CLI의 Agent Skills, Hooks, Subagents는 "Antigravity 플러그인"으로 계승된다. I/O 라이브 데모에서는 93개 서브에이전트를 병렬로 돌려 26억 토큰을 처리하며 $1,000 이하로 동작하는 OS를 만들고, 그 위에서 DOOM을 실행하다 드라이버 부족으로 실패하자 즉석에서 드라이버를 생성해 해결했다. 다만 급격한 UI 변경에는 비판이 많아, 우상단에 "Open IDE" 버튼을 추가해 기존 IDE 형식으로 전환할 수 있게 패치할 예정이라고 한다. 그리고 Gemini CLI는 6/18 종료 예정이라 Antigravity CLI로의 이전이 필수다.
Managed Agents API
Gemini API에 자율 에이전트를 클라우드에서 바로 띄우는 기능이 프리뷰로 추가됐다. API 한 번 호출로 격리된 리눅스 샌드박스에서 에이전트가 추론 → 도구 호출 → 코드 실행 → 웹 브라우징 → 파일 관리를 자율적으로 수행한다. AGENTS.md, SKILL.md 같은 마크다운으로 에이전트를 정의하면 별도 오케스트레이션 코드 없이 배포된다. 한마디로 "에이전트 실행 환경의 서버리스화"다.
✨ Google I/O ② 항상 켜진 에이전트와 월드 모델
Gemini Spark
24시간 클라우드에 상주하는 개인 AI 에이전트다. 노트북을 닫아도, 폰을 잠가도 백그라운드에서 계속 돈다. Gmail·Docs·Slides 등 Workspace와 깊게 연동돼서 "매주 월요일 9시에 지난주 메일을 정리해 우선순위별 ToDo 작성", "카드 명세서에서 숨은 구독 탐지", "영수증을 자동으로 스프레드시트에 기록" 같은 일을 한다. 결제·메일 발송 같은 고위험 행동은 사전 확인 후 실행한다. 현재 미국 AI Ultra 가입자 대상 베타다. OpenClaw나 Hermes Agent로 이야기해온 개인 비서를, Google이 자기 생태계 위에서 구현한 셈이다.
Gemini Omni
단순 영상 생성 모델이 아니라, Demis Hassabis가 "월드 모델"이라 부른 — 세계를 이해하고 다음에 일어날 일을 추론하는 시스템이다. 중력·운동에너지·유체역학 같은 물리 법칙에 대한 직관을 갖췄고, 첫 모델 Omni Flash는 프롬프트 한 번으로 음성 동기화된 10초 클립을 만들고, 채팅으로 스타일·카메라 앵글·배경을 수정한다. SynthID 워터마크가 자동 삽입된다. "AGI로 가려면 Anything to Anything이 돼야 한다"는 발언이 인상적이었다.
검색의 에이전트화
AI Mode 기본 모델이 Gemini 3.5 Flash로 올라가고, 25년 만에 검색창이 재설계됐다. 검색 안에서 직접 에이전트를 만들고, "정보 에이전트"가 24시간 웹 변화를 추적해 알림을 준다. Personal Intelligence는 약 200개국·98개 언어로 확대(구독 불필요). "검색창에 질문하면 링크 목록을 받는" 시대가 진짜 끝나가고 있다.
AI Studio로 네이티브 안드로이드 앱
설치 없이 브라우저만으로 프롬프트 → 개발 → 에뮬레이터 프리뷰 → 실기기 설치 → Play 내부 테스트 배포까지 한 번에. GPS·NFC·카메라 등 하드웨어 센서에 네이티브로 접근하는 진짜 네이티브 앱이다.
🛡️ Anthropic: 강력한 모델과 그 딜레마
Project Glasswing 초기 결과
4월에 발표한 보안 프로젝트의 1개월 성과가 공개됐다. 미공개 프런티어 모델 Claude Mythos Preview로 파트너 전체에서 고위험·치명적 취약점을 1만 건 이상 발견했다. Cloudflare 약 2,000건(고위험·치명 400건), Mozilla는 Firefox 150에서 271건을 발견·수정, 오픈소스 1,000건 이상을 스캔해 6,202건의 고위험 취약점을 추정했다. AWS, Apple, Google, Microsoft, NVIDIA, JPMorganChase 등이 파트너로 참여한다. 다만 Anthropic 스스로 "악용 방지 안전장치가 아직 충분치 않다"며 일반 공개는 하지 않고 신뢰 파트너에게만 제한 제공 중이다. 1개월에 1만 건이라는 결과만큼이나, "너무 강력한 모델의 딜레마"가 현실이 된 게 인상적이다.
Karpathy, Anthropic 합류
"바이브 코딩"이라는 말을 만든 Andrej Karpathy가 Anthropic의 사전학습(Pre-training) 팀에 합류했다. OpenAI 공동창업자이자 Tesla Autopilot을 이끈 인물이다. Claude를 활용해 사전학습 연구를 가속하는 팀을 새로 만든다고 한다.
🧮 OpenAI: AI가 수학 난제를 스스로 반증하다
80년 묵은 에르되시 예상 반증
OpenAI 내부 추론 모델이 평면 단위 거리 문제(1946년 Paul Erdős 제기)에서 "정사각 격자가 최적"이라는 80년 정설을 반증했다. 대수적 정수론을 활용해 정사각 격자를 다항식적으로 넘는 무한 구성족을 발견했고, 외부 수학자(프린스턴 Will Sawin)가 검증·정밀화했다. 중요한 건 수학 전용 모델이 아니라 범용 추론 모델이 자율적으로 새 아이디어를 떠올렸다는 점이다. "AI가 진짜 수학을 한" 첫 사례라는 평가인데, 솔직히 마냥 기뻐해야 할지 조금 무섭기도 했다.
Codex 업데이트
"코딩 에이전트"를 넘어 "Mac을 통째로 다루는 에이전트"로 진화 중이다. Appshots(Command 두 번으로 현재 앱 화면을 컨텍스트로 전송), 잠금 상태에서도 동작하는 Remote Computer Use, 그리고 목표를 주면 수 시간~수일 자율 작업하는 Goal Mode 정식화. 요즘 Codex가 꽤 좋아지고 있어서, Claude Code와 양쪽을 같이 쓰며 비교하는 중이다.
💡 이번 주에 느낀 것
이번 주 가장 강하게 든 생각은 "에이전트 우선이 이제 한 회사의 실험이 아니라 업계 기본값이 됐다"는 것이다.
Google은 모델(Gemini 3.5)부터 개발 도구(Antigravity), API(Managed Agents), 개인 비서(Spark), 검색까지 전부 에이전트 중심으로 다시 깔았다. OpenAI Codex는 Mac 전체를 다루기 시작했고, Anthropic은 모델로 취약점을 1만 건 찾아냈다. 방향은 같다. AI가 사람이 시키는 걸 실행하는 단계를 넘어, 환경을 직접 다루고 오래 자율적으로 돌아간다.
그래서 1인 개발자 입장에서 질문도 바뀐다.
강력한 에이전트는 분명 1인 운영의 레버리지다. 하지만 이번 주 보안 사건들이 보여주듯, 레버리지가 클수록 작은 실수의 비용도 커진다. Park Labs도 에이전트를 적극 쓰되, 권한·비용·신뢰의 경계는 계속 좁게 잡으려 한다.
🔗 참고한 출처
이번 글은 아래 공식 발표와 보도를 바탕으로 정리했다.
🎯 다음은
지난주에 "다음부터는 10개를 다 같은 깊이로 다루기보다 2-3개만 깊게 파보겠다"고 적었는데, 이번 주는 Google I/O가 워낙 커서 자연스럽게 I/O를 두 묶음으로 깊게 다루고 나머지를 짧게 정리하는 형태가 됐다.
다음 주에는 직접 써본 도구 — Antigravity CLI를 Claude Code·Codex와 비교한 사용기 — 를 하나 끼워 넣어보려고 한다. 뉴스를 모으는 데서 끝내지 않고, Park Labs 운영에 실제로 무엇을 켜고 무엇을 끌지까지 기록해보는 게 이 시리즈의 목표다.