- Published on
Srebrny Wiek Inteligencji Ucieleśnionej: Dogłębna Analiza
Wprowadzenie do Inteligencji Ucieleśnionej
Inteligencja ucieleśniona, znajdująca się obecnie w swoim "srebrnym wieku", to fascynujący obszar, gdzie eksploracja i intensywny rozwój technologiczny przeplatają się. Ten okres, umiejscowiony między początkowym pojawieniem się a pełną dojrzałością technologii, jest czasem poszukiwań i odkryć. Dyskusja na temat przyszłości robotyki i jej powiązania ze sztuczną inteligencją (AI) nabiera na znaczeniu, zwłaszcza w kontekście szybko rozwijających się modeli AI. Okrągły stół podczas konferencji Volcano Engine FORCE zgromadził ekspertów z różnych dziedzin, aby zgłębić ten temat i omówić potencjał dużych modeli w przyspieszeniu rozwoju robotyki.
Kontekst Rozwoju Robotów i AI
Szybki postęp w dziedzinie dużych modeli AI wywołał znaczący wzrost inwestycji w sektorze robotyki. To z kolei niesie ze sobą ryzyko przegrzania rynku. Kluczowym wyzwaniem staje się zidentyfikowanie prawdziwych przełomów w technologii i jej zastosowaniu. W centrum dyskusji znajdują się pytania o priorytety w rozwoju, takie jak wybór między uczeniem przez wzmacnianie a uczeniem przez symulację, czy też decyzja, czy ważniejsza jest symulacja, czy testy w rzeczywistych warunkach. Kolejnym aspektem jest rozważenie, czy większy nacisk należy położyć na systemy wizyjne, czy na silniki fizyczne.
Uczestnicy Okrągłego Stołu
Podczas okrągłego stołu spotkali się eksperci reprezentujący różnorodne środowiska:
- Chen Yang: Wiceprezes Galaxy General Robotics
- Shi Lingxiang: Szef Inkubacji Innowacji w Volcano Engine (Moderator)
- Wu Di: Szef Algorytmów Inteligentnych w Volcano Engine
- Wan Haoji: Partner w Matrix Partners China
- Wang Xiao: Założyciel Nine Chapters Capital
- Yan Weixin: Współzałożyciel Shanghai Zhiyuan Robotics i Promotor Doktoratu na Shanghai Jiao Tong University
Kluczowe Punkty Dyskusji
Wzrost Inwestycji w Robotykę
Skąd to podekscytowanie? Aplikacje AI dzielą się na dwie kategorie: aplikacje miękkie (takie jak chatboty i generowanie wideo) oraz aplikacje twarde (takie jak robotyka). Robotykę postrzega się jako najbardziej wszechstronną twardą aplikację AI. Inwestorzy poszukują firm, które potrafią zintegrować zarówno oprogramowanie, jak i sprzęt, prezentując realne zastosowania wykraczające poza pokazy. Wyzwaniem pozostaje komercjalizacja robotów, która postępuje wolniej niż oczekiwano, zwłaszcza w złożonych środowiskach, takich jak domy i usługi B2B. Wymaga poprawy koordynacja między "mózgiem" (AI) a "małym mózgiem" (systemy sterowania), a redukcja kosztów jest kluczowa dla powszechnego przyjęcia robotów.
Ścieżka do Komercjalizacji
Istnieje ogólna zgoda, że robotyka odniesie sukces, ale harmonogram i wiodące firmy są nadal niepewne. Rynek prawdopodobnie nie będzie zdominowany przez jedną firmę, podobnie jak w przypadku pojazdów elektrycznych. Duże modele zapewniły robotom lepszą interakcję i zdolność myślenia. Choć nie ma nie do pokonania barier technicznych, proces ten będzie dłuższy i bardziej wymagający niż przewidywano. Inwestorzy venture capital odgrywają kluczową rolę w przyspieszeniu rozwoju poprzez finansowanie.
Znaczenie Ogólnej Inteligencji
Nacisk powinien przesunąć się na dostosowanie robotów do ludzi i środowisk, a nie odwrotnie. Wykorzystanie dużych ilości danych symulacyjnych jest kluczowe dla umożliwienia robotom posiadania ogólnej inteligencji. Startupy robotyczne stoją w obliczu wyzwań w technologii, rozwoju produktu i modelach biznesowych. Potrzebna jest współpraca w całym łańcuchu dostaw i wsparcie inwestorów.
Techniczne Ścieżki Inteligencji Ucieleśnionej
Uczenie przez naśladowanie i uczenie przez wzmacnianie to realne podejście do kontroli chodu. Dane symulacyjne są skuteczne w kontroli chodu kończyn dolnych, ale wyzwania stanowią dostrajanie parametrów i spójność produktu. Należy przesunąć nacisk z ruchu kończyn dolnych na ogólne możliwości operacyjne robotów humanoidalnych. Skupienie powinno być na operacjach zadaniowych, a nie tylko na lokomocji. Zbieranie i standaryzacja danych, zwłaszcza dla złożonych zadań, stanowi duże wyzwanie. Dane z rzeczywistego świata są kluczowe, szczególnie dla złożonych interakcji fizycznych trudnych do symulacji.
Symulacja vs. Dane z Rzeczywistego Świata
Dane symulacyjne są bardziej opłacalne, skalowalne i wszechstronne w szkoleniu ogólnych modeli ucieleśnionych. Dane z rzeczywistego świata są niezbędne do uchwycenia niuansów interakcji fizycznych, takich jak tarcie i elastyczność. Gdy roboty będą miały wiarygodne modele świata, symulacje na dużą skalę będzie można wykorzystać do testowania i poprawy ich wydajności w różnych scenariuszach.
Przyszłe Zastosowania
Zastosowania Krótkoterminowe (2-3 lata)
- Produkcja przemysłowa: Roboty mogą wykonywać złożone zadania wymagające zręczności w kontrolowanych środowiskach.
- Operacje zdalne: Roboty mogą być wykorzystywane w niebezpiecznych środowiskach, np. do obsługi niebezpiecznych materiałów.
- Środowiska kontrolowane: Roboty będą wdrażane w kontrolowanych środowiskach, takich jak restauracje, hotele i fabryki.
- Konkretne zadania: Roboty będą wykorzystywane do zadań takich jak dostarczanie jedzenia, robienie kawy i wykonywanie lekkiej konserwacji.
- Fabryki, biura i ochrona: To najbardziej prawdopodobne obszary początkowego wdrożenia.
Zastosowania Długoterminowe
- Środowiska domowe: Najbardziej złożone, ale bardzo oczekiwane zastosowanie.
- Zadania domowe: Roboty będą mogły wykonywać zadania takie jak gotowanie, składanie prania i sprzątanie.
- Redukcja kosztów: Wraz z postępem technologicznym koszt robotów spadnie, czyniąc je bardziej dostępnymi dla konsumentów.
- Roboty ogólnego przeznaczenia: Nacisk przesunie się w kierunku robotów ogólnego przeznaczenia, które mogą służyć różnym potrzebom.
- Rozważania rynkowe: Firmy muszą wziąć pod uwagę funkcjonalność, wydajność, otwartość i tolerancję ryzyka różnych zastosowań.
Volcano Engine VeOmniverse
Wirtualna platforma symulacyjna: VeOmniverse to platforma oparta na chmurze do symulacji i szkolenia robotów. Tworzy realistyczne środowiska cyfrowe do szkolenia i testowania robotów. Jest opłacalna, zmniejsza potrzebę fizycznego sprzętu i obniża koszty rozwoju. Platforma wykorzystuje silniki wizualne, silniki fizyczne, symulację czujników i generowanie 3D, tworząc kompleksowy system szkoleniowy. Wykorzystuje AI do generowania wysokiej jakości danych treningowych i przyspieszenia procesu szkolenia. Jest otwarta i konfigurowalna, umożliwiając firmom tworzenie spersonalizowanych aplikacji cyfrowych bliźniaków. Pomaga firmom szybko budować, walidować i optymalizować modele robotów. VeOmniverse to kluczowe narzędzie do inteligentnej i cyfrowej transformacji przemysłu robotycznego.