Sử dụng nhiều loại mô hình tôi nhận thấy một điều, đó là hỏi mấy câu thông dụng kiểu tra cứu thông tin thì mô hình nào cũng tốt, không cho thấy sự khác biệt.
Chỉ khi vào việc chuyên môn sâu thì mới bộc lộ ra đặc trưng của nó, đó là họ nhà Claude Opus cực mạnh về code, tìm lỗi tiềm ẩn, sinh mã còn Gemini mạnh về các dự án học máy, thao tác trên dữ liệu, ChatGPT mạnh về tài chính định lượng và nói chung là có kiến thức sâu rộng về nhiều chủ đề.
Tôi đã cho 3 mô hình Deepseek, Gemini, ChatGPT xử lý và tranh luận về một vấn đề gán nhãn dữ liệu để đào tạo mô hình ML, kết quả Deepseek nhầm lẫn về khái niệm cơ bản gọi là look ahead dẫn đến rò rỉ dữ liệu.
Hầu hết các vấn đề chuyên môn sâu đều có kiểu tình trạng như vậy, không phải nhồi nhét vào một đống dữ liệu rồi nó tự khôn ra đâu, đào tạo mô hình là phải bỏ tiền ra thuê chuyên gia mỗi ngành tự training kiến thức nâng cao, trăm tỷ đô nó ở chỗ này chứ không phải tiền điện chạy GPU.