원본 요약
Simon Willison이 2025년 11월~2026년 5월의 LLM 6개월 트렌드를 압축 요약한 글.
핵심 메시지 2가지
- 코딩 에이전트의 도약: 강화학습(RLVR)으로 "종종 작동" → "대부분 작동" 수준으로 진화, 일상 업무 도구로 실용화
- 오픈소스 모델의 폭발: 노트북에서 실행 가능한 수준의 성능, 예상 초과
주요 사건 타임라인
2025년 11월 (인플렉션 포인트)
- 최고 성능 모델 왕좌가 5번 교체: Claude Sonnet 4.5 → GPT-5.1 → Gemini 3 → GPT-5.1 Codex Max → Claude Opus 4.5
- OpenAI/Anthropic의 RLVR 투자가 코딩 에이전트 능력을 실용적 수준으로 끌어올림
2025년 12월~2026년 1월 (LLM 집착의 시대)
- 개발자들이 새로운 능력 테스트에 몰입 (불필요한 프로젝트도 다수)
- Simon Willison 본인: "micro-javascript" (Python 기반 JS 구현) 개발 후 불필요성 인식
2026년 2월 (OpenClaw 등장)
- Pete의 "Warelay" → "OpenClaw"로 명명, 세계적 주목
- "개인 AI 어시스턴트" 카테고리 = "Claws"로 일반화
- 실리콘밸리 Mac Mini 매진 사태
2026년 4월 (오픈 웨이트 모델의 도약)
- Gemma 4 (Google 최강 오픈 웨이트)
- GLM-5.1: 754B 파라미터, 1.51TB
- Qwen3.6-35B-A3B: 20.9GB, 노트북 실행 가능, Claude Opus 4.7 능가
기타 인사이트
- "펠리컨 자전거 타기" 테스트: 훈련 데이터에 없는 주제로 모델의 진정한 창조 능력 평가
- Gemini 3.1 Pro가 뛰어난 SVG 생성 능력 시연