- Published on
Kỷ Nguyên Bạc của Trí Tuệ Nhập Thể: Phân Tích Chuyên Sâu
Tổng quan
Bài viết này bàn về tình hình hiện tại của trí tuệ nhập thể, được mô tả là đang trong "kỷ nguyên bạc" - một giai đoạn khám phá mạnh mẽ giữa sự xuất hiện ban đầu và sự trưởng thành hoàn toàn của công nghệ. Cuộc thảo luận xoay quanh một bàn tròn tại hội nghị Volcano Engine FORCE, nơi các chuyên gia từ nhiều lĩnh vực khác nhau đã khám phá tiềm năng của các mô hình lớn trong việc thúc đẩy sự phát triển của ngành robot.
Bối cảnh
Sự tiến bộ nhanh chóng của các mô hình AI lớn đã thúc đẩy đầu tư đáng kể vào ngành công nghiệp robot. Tuy nhiên, sự tăng vọt về vốn đầu tư này cũng mang theo nguy cơ thị trường quá nóng. Thách thức cốt lõi là xác định những đột phá thực sự về công nghệ và ứng dụng của nó. Các câu hỏi chính bao gồm:
- Nên tập trung vào học tăng cường hay học mô phỏng?
- Ưu tiên mô phỏng hay thử nghiệm trong thế giới thực quan trọng hơn?
- Nên chú trọng vào thị giác hay động cơ vật lý?
Các chuyên gia tham gia thảo luận
Bàn tròn bao gồm các chuyên gia từ nhiều lĩnh vực khác nhau:
- Chen Yang: Phó Chủ tịch Galaxy General Robotics
- Shi Lingxiang: Trưởng bộ phận Ươm tạo Đổi mới tại Volcano Engine (Điều phối viên)
- Wu Di: Trưởng bộ phận Thuật toán Thông minh tại Volcano Engine
- Wan Haoji: Đối tác tại Matrix Partners China
- Wang Xiao: Người sáng lập Nine Chapters Capital
- Yan Weixin: Đồng sáng lập Shanghai Zhiyuan Robotics và Giám đốc Tiến sĩ tại Đại học Giao thông Thượng Hải
Các điểm thảo luận chính
Sự tăng vọt đầu tư vào robot
- Tại sao lại có sự hào hứng? Ứng dụng AI được chia thành hai loại: ứng dụng mềm (như chatbot và tạo video) và ứng dụng cứng (như robot). Robot được xem là ứng dụng cứng linh hoạt nhất của AI.
- Tập trung đầu tư: Các nhà đầu tư đang tìm kiếm các công ty có thể tích hợp cả phần mềm và phần cứng, đồng thời chứng minh các ứng dụng thực tế ngoài các bản demo.
- Thách thức thương mại hóa: Việc thương mại hóa robot diễn ra chậm hơn dự kiến, đặc biệt là trong các môi trường phức tạp như nhà ở và dịch vụ B2B.
- Sự phối hợp giữa "bộ não" (AI) và "bộ não nhỏ" (hệ thống điều khiển) cần được cải thiện.
- Giảm chi phí là yếu tố then chốt để việc áp dụng rộng rãi.
Con đường thương mại hóa
- Đồng thuận: Có sự đồng thuận chung rằng robot sẽ thành công, nhưng mốc thời gian và các công ty dẫn đầu vẫn chưa chắc chắn.
- Nhiều người chiến thắng: Thị trường không có khả năng bị chi phối bởi một công ty duy nhất, tương tự như ngành xe điện.
- Thương mại hóa ban đầu: Các mô hình lớn đã cung cấp cho robot khả năng tương tác và tư duy được cải thiện.
- Rào cản kỹ thuật: Mặc dù không có rào cản kỹ thuật nào không thể vượt qua, nhưng quá trình này sẽ dài hơn và thách thức hơn dự kiến.
- Vai trò của VC: Các nhà đầu tư mạo hiểm đóng vai trò quan trọng trong việc thúc đẩy sự phát triển bằng cách cung cấp vốn.
Tầm quan trọng của trí tuệ tổng quát
- Chuyển đổi trọng tâm: Trọng tâm nên là robot thích nghi với con người và môi trường, thay vì ngược lại.
- Dữ liệu mô phỏng: Sử dụng lượng lớn dữ liệu mô phỏng là chìa khóa để cho phép robot có trí tuệ tổng quát.
- Thách thức của startup: Các startup robot phải đối mặt với những thách thức đáng kể về công nghệ, phát triển sản phẩm và mô hình kinh doanh.
- Hợp tác ngành: Ngành cần sự hợp tác trên toàn chuỗi cung ứng và sự hỗ trợ từ các nhà đầu tư.
Các con đường kỹ thuật cho trí tuệ nhập thể
- Học bắt chước và học tăng cường: Sử dụng học bắt chước để tăng cường học tăng cường là một cách tiếp cận khả thi để kiểm soát dáng đi.
- Mô phỏng cho chi dưới: Dữ liệu mô phỏng có hiệu quả đối với việc kiểm soát dáng đi của chi dưới, nhưng việc điều chỉnh tham số và tính nhất quán của sản phẩm vẫn là những thách thức.
- Tập trung vào chi trên: Cần chuyển trọng tâm từ chuyển động của chi dưới sang khả năng vận hành nhiệm vụ tổng thể của robot hình người.
- Vận hành nhiệm vụ: Trọng tâm nên là khả năng vận hành nhiệm vụ thay vì chỉ di chuyển.
- Thách thức dữ liệu: Việc thu thập và tiêu chuẩn hóa dữ liệu, đặc biệt đối với các nhiệm vụ phức tạp, là một thách thức đáng kể.
- Dữ liệu thế giới thực: Dữ liệu thế giới thực rất quan trọng, đặc biệt đối với các tương tác vật lý phức tạp khó mô phỏng.
Mô phỏng so với dữ liệu thế giới thực
- Dữ liệu mô phỏng: Dữ liệu mô phỏng tiết kiệm chi phí hơn, có khả năng mở rộng và linh hoạt để đào tạo các mô hình nhập thể đa năng.
- Dữ liệu thế giới thực: Dữ liệu thế giới thực rất cần thiết để nắm bắt các sắc thái của tương tác vật lý, chẳng hạn như ma sát và độ đàn hồi.
- Mô hình thế giới: Một khi robot có các mô hình thế giới đáng tin cậy, các mô phỏng quy mô lớn có thể được sử dụng để kiểm tra và cải thiện hiệu suất của chúng trong các tình huống khác nhau.
Ứng dụng tương lai
Ứng dụng ngắn hạn (2-3 năm)
- Sản xuất công nghiệp: Robot có thể thực hiện các nhiệm vụ phức tạp đòi hỏi sự khéo léo trong môi trường được kiểm soát.
- Vận hành từ xa: Robot có thể được sử dụng trong môi trường nguy hiểm, chẳng hạn như xử lý vật liệu độc hại.
- Môi trường được kiểm soát: Robot sẽ được triển khai trong các môi trường được kiểm soát như nhà hàng, khách sạn và nhà máy.
- Nhiệm vụ cụ thể: Robot sẽ được sử dụng cho các nhiệm vụ như giao đồ ăn, pha cà phê và thực hiện bảo trì nhẹ.
- Nhà máy, văn phòng và an ninh: Đây là những lĩnh vực có khả năng triển khai ban đầu cao nhất.
Ứng dụng dài hạn
- Môi trường gia đình: Ứng dụng phức tạp nhất nhưng được mong đợi nhất là trong môi trường gia đình.
- Công việc gia đình: Robot cuối cùng sẽ có thể thực hiện các công việc như nấu ăn, gấp quần áo và dọn dẹp.
- Giảm chi phí: Khi công nghệ tiến bộ, chi phí robot sẽ giảm, giúp chúng dễ tiếp cận hơn với người tiêu dùng.
- Robot đa năng: Trọng tâm sẽ chuyển sang robot đa năng có thể phục vụ nhiều nhu cầu khác nhau.
- Cân nhắc thị trường: Các công ty cần xem xét chức năng, hiệu suất, tính cởi mở và mức độ chấp nhận rủi ro của các ứng dụng khác nhau.
Volcano Engine VeOmniverse
- Nền tảng mô phỏng ảo: veOmniverse là một nền tảng dựa trên đám mây để mô phỏng và đào tạo robot.
- Môi trường thực tế: Nó tạo ra môi trường kỹ thuật số rất thực tế để đào tạo và thử nghiệm robot.
- Tiết kiệm chi phí: Nó giảm nhu cầu về thiết bị vật lý và giảm chi phí phát triển.
- Đào tạo toàn diện: Nền tảng này sử dụng các công cụ thị giác, công cụ vật lý, mô phỏng cảm biến và tạo 3D để tạo ra một hệ thống đào tạo toàn diện.
- Hỗ trợ AI: Nền tảng này sử dụng AI để tạo dữ liệu đào tạo chất lượng cao và tăng tốc quá trình đào tạo.
- Tùy chỉnh: Nền tảng này mở và có thể tùy chỉnh, cho phép các công ty phát triển các ứng dụng song sinh kỹ thuật số được cá nhân hóa.
- Phát triển tăng tốc: Nó giúp các công ty nhanh chóng xây dựng, xác thực và tối ưu hóa các mô hình robot.
- Chuyển đổi ngành: veOmniverse là một công cụ chính cho quá trình chuyển đổi kỹ thuật số và thông minh của ngành công nghiệp robot.