Đang tải...

Thử Claude 4, GPT-4o, Gemini với Grok gần 1 tháng, mình rút ra cái này

16/05/2026
6 phút đọc
Thử Claude 4, GPT-4o, Gemini với Grok gần 1 tháng, mình rút ra cái này
Tháng trước mình hơi bị nghiện, mở 4 con AI coding cùng lúc để test thật trong công việc. Không phải benchmark xịn sò, mà là dùng để làm feature, fix bug production,...

Tháng trước mình hơi bị nghiện, mở 4 con AI coding cùng lúc để test thật trong công việc. Không phải benchmark xịn sò, mà là dùng để làm feature, fix bug production, review PR, viết test… đại loại là những thứ dev làm hàng ngày.

Kết quả? Không con nào làm mình hài lòng hoàn toàn, nhưng cũng có con làm mình hài lòng rõ rệt.

Claude 4

Con này hiện tại vẫn là lựa chọn số 1 của mình.

Mình từng đưa nguyên một con service cũ hơn 800 dòng, bảo refactor lại cho sạch. Nó làm khá ổn, biết giữ coding style của team, còn gợi ý thêm vài chỗ có thể tách ra module riêng.

Debug bug khó thì Claude làm tốt nhất, nó suy nghĩ khá logic và ít bịa code lung tung.

Có lần mình đưa cho nó một bug liên quan tới queue processing bị duplicate request ngẫu nhiên. Con này ngồi phân tích gần cả phút, trace từ retry logic tới transaction handling rồi chỉ đúng chỗ race condition thật. Đoạn đó mình khá bất ngờ.

Nhưng mà đắt vl, với lại có hôm lag kinh khủng, chờ mãi mới ra. Có lần mình ngồi chờ gần 20 giây chỉ để nó trả lời một câu hỏi đơn giản.

Mà đôi khi nó cũng over-engineer hơi khó chịu. Có task chỉ cần sửa nhanh một function mà nó refactor luôn nửa cái file.


GPT-4o

Nhanh thật, cái này phải công nhận.

Làm task nhỏ, generate API, viết script lặt vặt thì cực sướng tay. Mình dùng nhiều nhất chắc là mấy đoạn CRUD, validate input, mock data các kiểu.

Nhưng càng làm mấy việc cần logic chặt chẽ thì càng thấy vấn đề.

Mình nhớ có lần bảo nó fix bug race condition, nó đưa code về, mình chạy thử vẫn lỗi y chang, chỉ khác mỗi cái tên biến với comment // fixed race condition 😂. Lúc đó tức thật sự.

Có hôm nó còn import một package không tồn tại rồi code như đúng rồi. Mình copy chạy mãi không được mới phát hiện package đó… không có thật.

GPT-4o kiểu rất hợp để tăng tốc, nhưng mình không dám thả hoàn toàn cho nó code production mà không review kỹ.


Gemini 2.5 Pro

Con này lạ lắm. Context to, tốc độ nhanh, quota miễn phí cũng ổn.

Mình từng ném cả folder project vào test. Nó đọc được thật, cũng nhớ được kha khá file liên quan.

Nhưng code nó hay bị “lạc quẻ”.

Có lần bảo viết caching layer với Redis, nó viết một đống mà logic sai từ ý tưởng cơ bản. Cache invalidation viết ngược luôn flow business bên mình. Mình đọc xong chỉ biết lắc đầu.

Nhiều lúc cảm giác Gemini hiểu từng phần riêng lẻ nhưng không giữ được “big picture” của cả project.

Dùng để search thông tin, đọc docs, hỏi syntax hoặc task đơn giản thì ổn. Chứ production thì mình không dám tin hoàn toàn.


Grok 3

Con này vui tính nhất, hỏi gì cũng trả lời, ít cằn nhằn.

Code thì tạm ổn, đặc biệt khi mình muốn brainstorm ý tưởng hay làm cái gì đó hơi “lạ lạ”.

Có lần mình hỏi thử mấy ý tưởng optimize workflow CI/CD hơi dị dị, Grok trả lời khá sáng tạo, kiểu mấy con khác ít suggest.

Nhưng context giữ không lâu, đôi khi trả lời hơi nông. Có lúc đang nói backend thì vài message sau nó quên mất mình dùng framework gì luôn.

Mình hay dùng Grok khi chán Claude hoặc GPT rồi, hoặc lúc muốn hỏi mấy thứ linh tinh mà không muốn bị “lecture”.


Tóm lại sau gần 1 tháng dùng thật

  • Muốn code production nghiêm túc → Claude 4 vẫn mạnh nhất hiện tại.
  • Cần làm nhanh, prototype → GPT-4o vẫn tiện tay hơn.
  • Ngân sách eo hẹp → Dùng Gemini + Grok thay phiên.
  • Combo mình đang dùng:
  • Cursor + Claude backend làm chính
  • GPT-4o làm phụ
  • Grok để hỏi linh tinh

Thật ra không có AI nào “thắng tuyệt đối”.

Càng dùng nhiều càng thấy:

  • AI giúp tiết kiệm thời gian thật.
  • Nhưng cũng có lúc nó tạo thêm bug rất ngu.
  • Và cuối cùng người phải chịu trách nhiệm sửa production vẫn là dev thôi.

Nên giờ mình xem AI như một thằng intern cực nhanh:

  • làm được nhiều việc,
  • đôi khi rất bá,
  • nhưng vẫn phải review kỹ trước khi merge.

📚 Nguồn: Viblo

Chia sẻ bài viết

Cần tư vấn?

Liên hệ với chúng tôi để được hỗ trợ

Liên hệ ngay

Bài viết liên quan

FilamentPHP: tuỳ chỉnh từ màu sắc, đường dẫn, sidebar đến custom theme
16/05/2026

FilamentPHP: tuỳ chỉnh từ màu sắc, đường dẫn, sidebar đến custom theme

Trong bài này, mình sẽ hướng dẫn các bạn cách để **tùy chỉnh Filament**, từ màu sắc mặc định, đường dẫn, sidebar cho tới custom theme để thêm css tùy chỉnh...

Đọc thêm
Crypto-Agility: Thiết kế hệ thống thay thuật toán mã hóa chỉ trong vài giờ khi Quantum đến
16/05/2026

Crypto-Agility: Thiết kế hệ thống thay thuật toán mã hóa chỉ trong vài giờ khi Quantum đến

> **TL;DR** — PQC migration sẽ không fail vì thiếu thuật toán. Nó sẽ fail vì không có inventory, không có abstraction layer, và cryptography bị hard-code khắp nơi. --- ## Mụ...

Đọc thêm
Sau Hơn 100 Prompt Với Claude, Đây Là Workflow Giúp Mình Code Nhanh Hơn Rõ Rệt
16/05/2026

Sau Hơn 100 Prompt Với Claude, Đây Là Workflow Giúp Mình Code Nhanh Hơn Rõ Rệt

Hơn 1 tháng nay mình dùng Claude khá nặng cho công việc. Chủ yếu là viết Compose, refactor màn hình cũ, debug với mấy cái bug lạ, với review code trước khi push. Ban đ...

Đọc thêm

Bắt đầu dự án của bạn

Hãy để Flash Dev đồng hành cùng bạn

Liên hệ ngay