Společnost Google prostřednictvím své vývojové laboratoře DeepMind zveřejnila své pokroky v oblasti umělé inteligence aplikované na roboty a její poznatky a provedení jsou poměrně lákavé.
Další krok ve vývoji umělé inteligence (AI) by mohl být přímo aplikován na fyzické roboty. Zatím jsme viděli, jak generativní AI dosáhla úžasné úrovně při tvorbě obsahu, ale logickým vývojem je přenesení těchto schopností na roboty. Významný krok tímto směrem učinila společnost Google DeepMind se svým projektem Gemini Robotics-ER 1.5, který představuje dva nové modely určené k tomu, aby roboti mohli přemýšlet dříve, než začnou jednat.
Gemini Robotics slibuje pokrok na poli AI robotů
Ředitelka robotiky společnosti Google DeepMind Carolina Parada poznamenala, že v současné době trvá „několik měsíců, než se podaří nainstalovat jedinou buňku schopnou plnit určitý úkol“. Díky integraci umělé inteligence by se však tento proces mohl radikálně změnit a eliminovat potřebu specifického programování i v nových situacích. Dva klíčové modely Google DeepMind, známé jako Gemini Robotics 1.5 a Gemini Robotics-ER 1.5, pracují v tandemu. První z nich je model „vidění-jazyk-akce“, který generuje akce na základě vizuálního prostředí, zatímco druhý zahrnuje schopnosti uvažování pro přijímání informovaných rozhodnutí.
Praktickým příkladem, který uvádí společnost Google, je každodenní úkol třídění prádla. V tomto scénáři Gemini Robotics-ER 1.5 využívá obrazy prostředí ke generování instrukcí v přirozeném jazyce, které podrobně popisují kroky potřebné k dokončení úkolu. Robotický systém Gemini Robotics 1.5 tyto instrukce přijme a na základě vizuálních informací řídí své pohyby tak, aby úkol efektivně provedl. Tento přístup umožňuje robotům nejen provádět jednoduché úkoly, ale otevírá také dveře k provádění složitějších úkolů v budoucnosti.
Budoucnost robotů s umělou inteligencí
Společnost Google již tyto pokroky testuje na dvou robotech Aloha 2 a Apollo, kteří mají humanoidní podobu. I když jsme ještě daleko od robotů, kteří by prováděli činnosti přesně jako lidé, je tento vývoj slibný a vytváří základ pro vytvoření robotů, kteří se budou řídit složitými pokyny a přizpůsobovat se měnícímu se fyzickému prostředí. Při nedávných testech s robotem Gemini Robotics 2.0 byl robot požádán, aby uložil klobouk do batohu na cestu do Londýna. Překvapivě robot uložil také deštník a předvídal možnost deště, čímž prokázal své rozumové schopnosti.

Zdroj: Youtube.com
Klíč k těmto pokrokům spočívá ve vylepšení tradičních velkých jazykových modelů (LLM) o schopnost uvažování. Podle společnosti Google DeepMind je generativní umělá inteligence pro robotiku klíčová, protože dokáže „odemknout obecné funkce“. Roboti vyvinutí před érou umělé inteligence vyžadují intenzivní trénink, aby se naučili specifické úkoly, a často selhávají v úkolech, pro které nebyli navrženi. Díky umělé inteligenci se mohou tito roboti učit a přizpůsobovat efektivněji, což jim umožní vykonávat širší škálu úkolů.
Pokroky společnosti Google DeepMind v oblasti robotiky s umělou inteligencí jsou důležitým krokem k vytvoření inteligentnějších a všestrannějších robotů. Tento vývoj má nejen potenciál změnit způsob, jakým komunikujeme s technologiemi, ale mohl by také způsobit revoluci v celých průmyslových odvětvích tím, že umožní robotům samostatně vykonávat složité úkoly.