Sáng mùng 2 Tết: Anthropic tung Claude Sonnet 4.6 giá rẻ hơn nhưng hiệu năng ngang ngửa Opus

Thế Duyệt, Đời sống Pháp luật 

Model AI tầm trung mới của Anthropic được định vị với hiệu năng gần bằng Opus 4.6 nhưng chi phí chỉ bằng 1/5, đồng thời trở thành mặc định cho cả người dùng miễn phí.

Anthropic vừa chính thức giới thiệu Claude Sonnet 4.6, mẫu AI thuộc phân khúc tầm trung nhưng được khẳng định có hiệu năng tiệm cận dòng cao cấp Opus 4.6. Đáng chú ý, động thái này diễn ra chỉ 12 ngày sau khi hãng ra mắt Claude Opus 4.6, cho thấy tốc độ cập nhật sản phẩm nhanh và liên tục.

Theo công bố, Claude Sonnet 4.6 được thiết kế nhằm mang lại "trí tuệ cấp Opus" với chi phí thấp hơn đáng kể. Trong bối cảnh ngành AI lâu nay tồn tại sự đánh đổi giữa hiệu năng và giá thành, các mô hình có khả năng lập luận phức tạp và lập trình tốt thường đi kèm mức giá cao, còn các mô hình rẻ hơn phải chấp nhận giới hạn về năng lực xử lý. Với phiên bản mới này, Anthropic đặt mục tiêu xóa bỏ ranh giới đó.

Giá sử dụng của Claude Sonnet 4.6 được giữ nguyên ở mức 3 USD cho mỗi triệu input token, tương đương khoảng 79.000 đồng theo tỷ giá quy đổi 1 USD = 26.400 đồng. Mức giá này không thay đổi so với phiên bản trước, dù khả năng xử lý đã được cải thiện đáng kể. Anthropic cho biết chi phí vận hành một AI agent hiệu năng cao hiện đã rẻ hơn khoảng 5 lần so với chỉ vài tuần trước đó. Đối với các doanh nghiệp triển khai hàng triệu tác vụ tự động mỗi ngày, chênh lệch này có thể tạo ra tác động tài chính đáng kể.

Một trong những cải tiến nổi bật của Claude Sonnet 4.6 nằm ở khả năng "computer use", tức năng lực sử dụng máy tính như con người. Mô hình có thể quan sát màn hình, di chuyển con trỏ và nhập liệu vào các ứng dụng. Khi Anthropic lần đầu giới thiệu tính năng này vào cuối năm 2024, nó vẫn ở giai đoạn thử nghiệm và hoạt động chưa thực sự mượt mà.

Với phiên bản 4.6, Anthropic cho biết mô hình đã đạt trình độ gần với con người. Trong các bài kiểm tra đánh giá khả năng điều hướng ứng dụng web và desktop, Claude Sonnet 4.6 đạt 72,5%, tăng mạnh so với mức 61,4% của thế hệ trước. Kết quả này gần tương đương với mẫu cao cấp Opus 4.6 có giá cao hơn nhiều. Theo đánh giá của hãng, đây có thể là bước tiến quan trọng trong việc tự động hóa các hệ thống cũ như cơ sở dữ liệu hoặc cổng thông tin bảo hiểm vốn không hỗ trợ API hiện đại.

Ở mảng lập trình, Claude vốn đã được nhiều nhà phát triển lựa chọn, và Sonnet 4.6 tiếp tục củng cố vị thế này. Trong thử nghiệm thực tế, 70% lập trình viên tham gia đánh giá ưu tiên đầu ra của Sonnet 4.6 so với phiên bản trước. Mô hình được cho là ít gặp tình trạng "lười" trong xử lý yêu cầu và có độ nhất quán cao hơn khi thực hiện các chỉ dẫn phức tạp nhiều bước.

Không dừng lại ở khả năng viết mã, Sonnet 4.6 còn cho thấy tiến bộ trong tư duy dài hạn. Trong bài kiểm tra mô phỏng kinh doanh mang tên "Vending-Bench", AI này quản lý một doanh nghiệp suốt một năm giả lập. Mô hình lựa chọn chiến lược đầu tư mạnh trong 10 tháng đầu nhằm mở rộng năng lực, sau đó chuyển hướng tối đa hóa lợi nhuận. Kết quả cuối cùng cho thấy số dư cao gấp hơn hai lần so với các mô hình tiền nhiệm, phản ánh khả năng lập kế hoạch dài hạn thay vì chỉ xử lý tác vụ ngắn hạn.

Trong khi một số đối thủ như Google hay OpenAI được cho là có lịch phát hành sản phẩm thiếu ổn định, Anthropic duy trì chu kỳ cập nhật bốn tháng một lần. Cách tiếp cận này được xem là tạo điều kiện để các CTO và đội ngũ phát triển xây dựng lộ trình công nghệ với mức độ dự đoán cao hơn, đặc biệt trong môi trường doanh nghiệp.

Hiện tại, Claude Sonnet 4.6 đã trở thành mô hình mặc định cho toàn bộ người dùng, bao gồm cả nhóm sử dụng miễn phí. Động thái này cho thấy Anthropic đang hướng đến việc phổ cập các công nghệ AI tự động hóa cao cấp tới nhiều đối tượng hơn, thay vì chỉ tập trung vào nhóm khách hàng trả phí cao.

Tin cùng chuyên mục
Xem theo ngày

NỔI BẬT TRANG CHỦ