Google công bố một "hệ điều hành" chung cho robot, giúp người máy sớm gia nhập lực lượng lao động
Một bước gần hơn để đưa robot từ phòng thí nghiệm bước ra thế giới.
- Ông lớn Google ra mắt mô hình AI 'siêu nhẹ': Khẳng định hiệu suất vượt trội hơn loạt mô hình của DeepSeek, ChatGPT hay Facebook
- CEO VinAI Research Bùi Hải Hưng: "6 năm trước, quyết định rời Google Deepmind về Việt Nam xây dựng phòng nghiên cứu AI là rủi ro sự nghiệp lớn đối với tôi"
- Đây rồi Google Pixel 10: Pixel 10 Pro XL vẫn là tâm điểm chú ý, nhưng nâng cấp lớn nhất thuộc về Pixel 10 giá rẻ nhất
- Kỹ thuật bị lãng quên 10 năm của Google khiến DeepSeek tận dụng vươn lên cướp việc của con người với giá rẻ mạt như thế nào?
- Google cuối cùng đã giải quyết nỗi khó chịu của Gmail sau hơn 2 thập kỷ
Thời gian gần đây, Google đạt được nhiều tiền bộ trong phát triển mô hình AI Gemini: nay nó đã có thể phân tích văn bản, hình ảnh, âm thanh và video và giải quyết các vấn đề phức tạp thông qua lập luận đa phương thức. Tuy nhiên, những gì Gemini đã học mới chỉ được áp dụng trong thế giới ảo.
Đó là lý do Google DeepMind công bố hai mô hình AI mới dựa trên Gemini 2.0, mong muốn xây dựng một nền tảng cho một lực lượng robot hữu ích của tương lai. Về cơ bản, Google đang cố gắng phát triển một “hệ điều hành” cho nhân công giá rẻ của sau này.

Gemini Robotics dạy đôi tay máy gấp origami - Ảnh: Google.
Đầu tiên là mô hình có tên Gemini Robotics - mô hình vision-language-action (thị giác - ngôn ngữ - hành động - VLA), giúp robot hiểu và thực hiện hành động trong thế giới thực. Thứ hai là gemini Robotics-ER, tập trung vào lập luận không gian (spatial reasoning), giúp robot định vị, nhận diện vật thể 3D và lập kế hoạch tự thực hiện các chức năng của mình.
Hai mô hình mới sẽ giúp robot thực hiện nhiều những tác vụ thực tế khác, nhằm sớm đưa robot vào lực lượng lao động.
Gemini Robotics chạy được trên nhiều dạng robot khác nhau - Video: Google.
Google xây dựng các mô hình AI dựa trên 3 tiêu chí lớn:
Tính tổng quát (generality): giúp robot có khả năng thích nghi với nhiều tình huống khác nhau.
Tính tương tác (interactivity): giúp robot có thể hiểu và phản hồi nhanh chóng trước hướng dẫn hoặc những thay đổi trong môi trường.
Khả năng khéo léo (dexterity): giúp robot có thể thực hiện các thao tác tinh vi giống con người, như cầm nắm và điều khiển vật thể một cách chính xác.
Bên cạnh đó, Gemini Robotics còn được thiết kế để ứng dụng được cho nhiều dạng robot khác nhau, bởi lẽ robot của mỗi doanh nghiệp, mỗi tập đoàn sẽ có hình dạng riêng biệt. Google mong muốn dù robot có một hay nhiều tay, tay có hai hay nhiều ngón, phần mềm Gemini Robotics vẫn có thể giúp phần cứng vận hành trơn tru.

Công việc "trực nhật" sẽ bị robot thay thế? - Ảnh: Google.
Google khẳng định trong môi trường thử nghiệm, Gemini Robotics đã giúp robot thực hiện tốt các tác vụ chưa hề được huấn luyện trước đây. Điều đó cho thấy tính tổng quát, tính tương tác và tính khéo léo đã được phát huy hiệu quả.
Bên cạnh đó, Google còn cam kết sẽ phát triển một mô hình AI giúp robot vận hành an toàn, cho người xung quanh, cho chính nó và cho mục đích tốt đẹp.
Từ những thứ đơn giản như tránh va chạm, giới hạn lực tiếp xúc cho tới một bộ quy tắc an toàn do chuyên gia soạn thảo và đánh giá, Google đề cao tính trách nhiệm trong sản xuất ứng dụng AI. Họ mong muốn tạo ra một lực lượng robot an toàn, hữu ích và đồng thuận với mục tiêu của con người.
NỔI BẬT TRANG CHỦ
Dân mạng "phát sốt" vì công cụ chỉnh sửa ảnh bằng AI mới của Google: Có người tự hỏi liệu Photoshop có còn cần thiết?
Dù mới chỉ ra mắt vài ngày, nhưng công cụ AI mới của Google đã nhận được những lời phản hồi không thể tuyệt vời hơn.
AI Trung Quốc xóa sổ lợi thế cuối cùng của phi công máy bay chiến đấu: Không chiến sắp không còn chỗ cho con người?