Bài học · taw·lms

Drama tháng 4/2026

Cộng đồng phàn nàn dữ dội: "Claude Opus càng ngày càng ngu". Nhiều người tưởng Anthropic nerf bí mật để tiết kiệm chi phí.

23/4/2026 Anthropic ra postmortem chính thống thừa nhận 3 lỗi.

Quote thẳng từ Anthropic: "We never intentionally degrade our models."

3 nguyên nhân cụ thể

1. Đổi default reasoning effort từ `high` → `medium` (4/3 – 7/4)

Để giảm UI freeze do latency cao. User cảm thấy Claude "ngu hơn" → revert.

Sửa: Default mới: xhigh cho Opus 4.7, high cho model khác.

2. Bug caching ở thinking history (26/3 – 10/4)

Tính năng clear thinking history khi session idle có bug nghiêm trọng:

"Instead of clearing thinking history once, it cleared it on every turn for the rest of the session."

Hậu quả: Claude trông quên trước quên sau, repeat câu hỏi, và đốt usage limit gấp đôi do cache miss.

3. System prompt verbose limit (16/4 – 20/4)

Thêm dòng "keep text between tool calls to ≤25 words" để giảm output token.

Internal test: pass. Broader eval: giảm 3% perf cả Opus 4.6 và 4.7. Revert ngay.

Timeline

Ngày	Sự kiện
Đầu 3	User báo degradation, Anthropic điều tra
4/3	Ship downgrade effort → lỗi #1 bắt đầu
26/3	Ship caching opt → lỗi #2 bắt đầu
7/4	Revert effort
10/4	Fix caching
16/4	Ship verbose limit → lỗi #3
20/4	Final fix v2.1.116
23/4	Reset usage limit cho tất cả subscriber

Bài học Anthropic công bố

Internal test phải dùng đúng public build (không phải dev build)
Mọi prompt change cần per-model eval + ablation + soak period + gradual rollout
Cải tiến Code Review tool (đang ship cho khách hàng)
Tighter monitoring cho mọi change ảnh hưởng intelligence

Bài học cho dev VN

Đừng pin model phiên bản cũ vô tội vạ — model mới + revert nhanh là cơ chế bảo vệ
Khi cảm thấy AI "ngu hơn", check changelog trước khi đổi vendor — có thể là bug tạm, không phải nerf
Đọc postmortem là cách học engineering tốt nhất — Anthropic minh bạch hiếm có
Eval framework tự build sẽ giúp phát hiện regression — đừng tin vendor 100%

Nguồn chính thống: anthropic.com/engineering/april-23-postmortem · 23/4/2026

Drama tháng 4/2026

Cộng đồng phàn nàn dữ dội: "Claude Opus càng ngày càng ngu". Nhiều người tưởng Anthropic nerf bí mật để tiết kiệm chi phí.

23/4/2026 Anthropic ra postmortem chính thống thừa nhận 3 lỗi.

Quote thẳng từ Anthropic: "We never intentionally degrade our models."

3 nguyên nhân cụ thể

1. Đổi default reasoning effort từ `high` → `medium` (4/3 – 7/4)

Để giảm UI freeze do latency cao. User cảm thấy Claude "ngu hơn" → revert.

Sửa: Default mới: xhigh cho Opus 4.7, high cho model khác.

2. Bug caching ở thinking history (26/3 – 10/4)

Tính năng clear thinking history khi session idle có bug nghiêm trọng:

"Instead of clearing thinking history once, it cleared it on every turn for the rest of the session."

Hậu quả: Claude trông quên trước quên sau, repeat câu hỏi, và đốt usage limit gấp đôi do cache miss.

3. System prompt verbose limit (16/4 – 20/4)

Thêm dòng "keep text between tool calls to ≤25 words" để giảm output token.

Internal test: pass. Broader eval: giảm 3% perf cả Opus 4.6 và 4.7. Revert ngay.

Timeline

Ngày	Sự kiện
Đầu 3	User báo degradation, Anthropic điều tra
4/3	Ship downgrade effort → lỗi #1 bắt đầu
26/3	Ship caching opt → lỗi #2 bắt đầu
7/4	Revert effort
10/4	Fix caching
16/4	Ship verbose limit → lỗi #3
20/4	Final fix v2.1.116
23/4	Reset usage limit cho tất cả subscriber

Bài học Anthropic công bố

Internal test phải dùng đúng public build (không phải dev build)
Mọi prompt change cần per-model eval + ablation + soak period + gradual rollout
Cải tiến Code Review tool (đang ship cho khách hàng)
Tighter monitoring cho mọi change ảnh hưởng intelligence

Bài học cho dev VN

Đừng pin model phiên bản cũ vô tội vạ — model mới + revert nhanh là cơ chế bảo vệ
Khi cảm thấy AI "ngu hơn", check changelog trước khi đổi vendor — có thể là bug tạm, không phải nerf
Đọc postmortem là cách học engineering tốt nhất — Anthropic minh bạch hiếm có
Eval framework tự build sẽ giúp phát hiện regression — đừng tin vendor 100%

Nguồn chính thống: anthropic.com/engineering/april-23-postmortem · 23/4/2026

Tại sao Claude "ngu đi" hồi tháng 4? — Postmortem chính thống

Drama tháng 4/2026

3 nguyên nhân cụ thể

1. Đổi default reasoning effort từ `high` → `medium` (4/3 – 7/4)

2. Bug caching ở thinking history (26/3 – 10/4)

3. System prompt verbose limit (16/4 – 20/4)

Timeline

Bài học Anthropic công bố

Bài học cho dev VN

Tại sao Claude "ngu đi" hồi tháng 4? — Postmortem chính thống

Drama tháng 4/2026

3 nguyên nhân cụ thể

1. Đổi default reasoning effort từ `high` → `medium` (4/3 – 7/4)

2. Bug caching ở thinking history (26/3 – 10/4)

3. System prompt verbose limit (16/4 – 20/4)

Timeline

Bài học Anthropic công bố

Bài học cho dev VN

Tại sao Claude "ngu đi" hồi tháng 4? — Postmortem chính thống

Drama tháng 4/2026

3 nguyên nhân cụ thể

1. Đổi default reasoning effort từ high → medium (4/3 – 7/4)

2. Bug caching ở thinking history (26/3 – 10/4)

3. System prompt verbose limit (16/4 – 20/4)

Timeline

Bài học Anthropic công bố

Bài học cho dev VN

Tại sao Claude "ngu đi" hồi tháng 4? — Postmortem chính thống

Drama tháng 4/2026

3 nguyên nhân cụ thể

1. Đổi default reasoning effort từ high → medium (4/3 – 7/4)

2. Bug caching ở thinking history (26/3 – 10/4)

3. System prompt verbose limit (16/4 – 20/4)

Timeline

Bài học Anthropic công bố

Bài học cho dev VN

1. Đổi default reasoning effort từ `high` → `medium` (4/3 – 7/4)

1. Đổi default reasoning effort từ `high` → `medium` (4/3 – 7/4)