taw·lmsĐăng nhập
Tin tức Claude & Tính năng mới

Bài 9 · Tháng 5/2026

Tại sao Claude "ngu đi" hồi tháng 4? — Postmortem chính thống

Bài học này chưa có video. Cứ đọc nội dung phía dưới nhé.

Drama tháng 4/2026

Cộng đồng phàn nàn dữ dội: "Claude Opus càng ngày càng ngu". Nhiều người tưởng Anthropic nerf bí mật để tiết kiệm chi phí.

23/4/2026 Anthropic ra postmortem chính thống thừa nhận 3 lỗi.

Quote thẳng từ Anthropic: "We never intentionally degrade our models."

3 nguyên nhân cụ thể

1. Đổi default reasoning effort từ high → medium (4/3 – 7/4)

Để giảm UI freeze do latency cao. User cảm thấy Claude "ngu hơn" → revert.

Sửa: Default mới: xhigh cho Opus 4.7, high cho model khác.

2. Bug caching ở thinking history (26/3 – 10/4)

Tính năng clear thinking history khi session idle có bug nghiêm trọng:

"Instead of clearing thinking history once, it cleared it on every turn for the rest of the session."

Hậu quả: Claude trông quên trước quên sau, repeat câu hỏi, và đốt usage limit gấp đôi do cache miss.

3. System prompt verbose limit (16/4 – 20/4)

Thêm dòng "keep text between tool calls to ≤25 words" để giảm output token.

Internal test: pass. Broader eval: giảm 3% perf cả Opus 4.6 và 4.7. Revert ngay.

Timeline

NgàySự kiện
Đầu 3User báo degradation, Anthropic điều tra
4/3Ship downgrade effort → lỗi #1 bắt đầu
26/3Ship caching opt → lỗi #2 bắt đầu
7/4Revert effort
10/4Fix caching
16/4Ship verbose limit → lỗi #3
20/4Final fix v2.1.116
23/4Reset usage limit cho tất cả subscriber

Bài học Anthropic công bố

  • Internal test phải dùng đúng public build (không phải dev build)
  • Mọi prompt change cần per-model eval + ablation + soak period + gradual rollout
  • Cải tiến Code Review tool (đang ship cho khách hàng)
  • Tighter monitoring cho mọi change ảnh hưởng intelligence

Bài học cho dev VN

  1. Đừng pin model phiên bản cũ vô tội vạ — model mới + revert nhanh là cơ chế bảo vệ
  2. Khi cảm thấy AI "ngu hơn", check changelog trước khi đổi vendor — có thể là bug tạm, không phải nerf
  3. Đọc postmortem là cách học engineering tốt nhất — Anthropic minh bạch hiếm có
  4. Eval framework tự build sẽ giúp phát hiện regression — đừng tin vendor 100%

Nguồn chính thống: anthropic.com/engineering/april-23-postmortem · 23/4/2026

Bạn đang xem ở chế độ preview công khai. Để nộp bài tập, hỏi AI tutor, và làm quiz — đăng nhập.
Claude for Creative Work — kết nối Adobe, Blender, AbletonKPMG ký deal Anthropic — 276K nhân viên dùng Claude→