Drama tháng 4/2026
Cộng đồng phàn nàn dữ dội: "Claude Opus càng ngày càng ngu". Nhiều người tưởng Anthropic nerf bí mật để tiết kiệm chi phí.
23/4/2026 Anthropic ra postmortem chính thống thừa nhận 3 lỗi.
Quote thẳng từ Anthropic: "We never intentionally degrade our models."
3 nguyên nhân cụ thể
1. Đổi default reasoning effort từ high → medium (4/3 – 7/4)
Để giảm UI freeze do latency cao. User cảm thấy Claude "ngu hơn" → revert.
Sửa: Default mới: xhigh cho Opus 4.7, high cho model khác.
2. Bug caching ở thinking history (26/3 – 10/4)
Tính năng clear thinking history khi session idle có bug nghiêm trọng:
"Instead of clearing thinking history once, it cleared it on every turn for the rest of the session."
Hậu quả: Claude trông quên trước quên sau, repeat câu hỏi, và đốt usage limit gấp đôi do cache miss.
3. System prompt verbose limit (16/4 – 20/4)
Thêm dòng "keep text between tool calls to ≤25 words" để giảm output token.
Internal test: pass. Broader eval: giảm 3% perf cả Opus 4.6 và 4.7. Revert ngay.
Timeline
| Ngày | Sự kiện |
|---|---|
| Đầu 3 | User báo degradation, Anthropic điều tra |
| 4/3 | Ship downgrade effort → lỗi #1 bắt đầu |
| 26/3 | Ship caching opt → lỗi #2 bắt đầu |
| 7/4 | Revert effort |
| 10/4 | Fix caching |
| 16/4 | Ship verbose limit → lỗi #3 |
| 20/4 | Final fix v2.1.116 |
| 23/4 | Reset usage limit cho tất cả subscriber |
Bài học Anthropic công bố
- Internal test phải dùng đúng public build (không phải dev build)
- Mọi prompt change cần per-model eval + ablation + soak period + gradual rollout
- Cải tiến Code Review tool (đang ship cho khách hàng)
- Tighter monitoring cho mọi change ảnh hưởng intelligence
Bài học cho dev VN
- Đừng pin model phiên bản cũ vô tội vạ — model mới + revert nhanh là cơ chế bảo vệ
- Khi cảm thấy AI "ngu hơn", check changelog trước khi đổi vendor — có thể là bug tạm, không phải nerf
- Đọc postmortem là cách học engineering tốt nhất — Anthropic minh bạch hiếm có
- Eval framework tự build sẽ giúp phát hiện regression — đừng tin vendor 100%
Nguồn chính thống: anthropic.com/engineering/april-23-postmortem · 23/4/2026