Root NationNoviceIT noviceSlika AI je pokazala nove sposobnosti svojega humanoidnega robota AI

Slika AI je pokazala nove sposobnosti svojega humanoidnega robota AI

-

Razvoj humanoidnih robotov je bil večji del dveh desetletij počasen, v zadnjem času pa smo priča vse več prebojem na tem področju. Kot smo nedavno pisali, je bil na MWC 2024 predstavljen robot z umetno inteligenco Amekain še en razvoj, Unitree H1, podrl hitrostni rekord med humanoidnimi roboti. In zdaj se je na spletu pojavil spektakularen rezultat sodelovanja med podjetji Figure AI in OpenAI – osupljiv videoposnetek humanoidnega robota, ki lahko sedaj vodi pogovore z ljudmi.

Figure AI in OpenAI sta predstavila novega humanoidnega robota z AI

Startup Figure AI je objavil videoposnetek, ki prikazuje robota Figure 01, ki dela z novim modelom vizualnega jezika (VLM). Na njej Slika 01 stoji ob mizi, na kateri so krožnik, jabolko in skodelica. Na levi strani je sušilnik. In na vprašanje osebe, kaj robot vidi pred seboj, odgovori tako, da podrobno opiše vse, kar leži na mizi.

In potem človek vpraša, ali lahko kaj poje, robot odgovori: "Seveda", nato pa s spretnim gladkim gibom vzame jabolko in ga poda človeku. Sledi še ena osupljiva demonstracija - moški strese zmečkane smeti iz koša pred sliko 01 in zahteva od robota, naj pojasni, zakaj je to naredil, hkrati pa smeti pobere v koš. In razloži svojo »misel«, medtem ko odlaga papir nazaj v smeti. "Dal sem ti jabolko, ker je to edini užitni izdelek, ki bi ti ga lahko dal z mize," je rekel robot.

Predstavniki podjetja so pojasnili, da slika 01 uporablja vnaprej usposobljen multimodalni model OpenAI, VLM, za razumevanje slik in besedil ter se zanaša na glasovne pozive za ustvarjanje svojih odzivov. To se razlikuje od, recimo, GPT-4 OpenAI, ki se osredotoča na pisne pozive.

Uporablja tudi tisto, kar podjetje imenuje "naučene bimanualne manipulacije nizke ravni." Sistem usklajuje natančno kalibracijo slike (do ravni slikovnih pik) s svojo nevronsko mrežo za nadzor gibanja. "Ta omrežja prejemajo slike pri 10 Hz in ustvarjajo dejanja s 24 DOF (poze zapestja in koti sklepov prstov) pri 200 Hz," je dejal Figure AI v izjavi.

Podjetje trdi, da vsako vedenje v videoposnetku temelji na sistemskem učenju, tako da nihče v ozadju ne vleče niti Slika 01. Seveda obstaja odtenek - ni znano, kolikokrat je robot šel skozi ta postopek. Morda že stotič, kar pojasnjuje njegove natančne gibe. Toda v vsakem primeru je ta dosežek videti spektakularen in malo fantastičen.

Preberite tudi:

Jerelotechradar
Prijavite se
Obvesti o
gost

0 Komentarji
Vdelana mnenja
Prikaži vse komentarje