AI 인사이트 목록

AI

The last six months in LLMs in five minutes

2026-05-20

원본 요약

Simon Willison이 2025년 11월~2026년 5월의 LLM 6개월 트렌드를 압축 요약한 글.

핵심 메시지 2가지

코딩 에이전트의 도약: 강화학습(RLVR)으로 "종종 작동" → "대부분 작동" 수준으로 진화, 일상 업무 도구로 실용화
오픈소스 모델의 폭발: 노트북에서 실행 가능한 수준의 성능, 예상 초과

주요 사건 타임라인

2025년 11월 (인플렉션 포인트)

최고 성능 모델 왕좌가 5번 교체: Claude Sonnet 4.5 → GPT-5.1 → Gemini 3 → GPT-5.1 Codex Max → Claude Opus 4.5
OpenAI/Anthropic의 RLVR 투자가 코딩 에이전트 능력을 실용적 수준으로 끌어올림

2025년 12월~2026년 1월 (LLM 집착의 시대)

개발자들이 새로운 능력 테스트에 몰입 (불필요한 프로젝트도 다수)
Simon Willison 본인: "micro-javascript" (Python 기반 JS 구현) 개발 후 불필요성 인식

2026년 2월 (OpenClaw 등장)

Pete의 "Warelay" → "OpenClaw"로 명명, 세계적 주목
"개인 AI 어시스턴트" 카테고리 = "Claws"로 일반화
실리콘밸리 Mac Mini 매진 사태

2026년 4월 (오픈 웨이트 모델의 도약)

Gemma 4 (Google 최강 오픈 웨이트)
GLM-5.1: 754B 파라미터, 1.51TB
Qwen3.6-35B-A3B: 20.9GB, 노트북 실행 가능, Claude Opus 4.7 능가

기타 인사이트

"펠리컨 자전거 타기" 테스트: 훈련 데이터에 없는 주제로 모델의 진정한 창조 능력 평가
Gemini 3.1 Pro가 뛰어난 SVG 생성 능력 시연