Nalazite se
Članak
Objavljeno: 07.05.2024. 17:47

University of Pennsylvania 

VIDEO: GPT uvježbava robote bolje od ljudi

Istraživači su uvježbavali robusnost četvronožnog robota korištenjem velikih jezičnih modela koji su si sami pisali kod.

VIDEO: GPT uvježbava robote bolje od ljudi

Istraživači na američkom Sveučilištu Pennsylvania demonstrirali su kako generativna umjetna inteligencija kao što je OpenAI-jev model GPT-4 može istrenirati robote da izvršavaju složene zadatke iz stvarnog svijeta mnogo učinkovitije nego što to mogu ljudi.

Oni su za tu potrebu razvili novi softverski paket otvorenog koda pod nazivom DrEureka, koji se koristi za osposobljavanje robota za obavljanje zadataka u stvarnom svijetu korištenjem velikih jezičnih model (LLM-ova).

To je sustav kojeg nazivaju "sim-to-reality", što znači da uči robote u virtualnom okruženju koristeći simuliranu fiziku, prije nego što ih implementira stvarno okruženje.

Dr. Jim Fan, jedan od programera DrEureke, nakon što je AI isprogramirao robota, postavio je Unitree Go1 četveronožnog robota na veliku loptu za jogu i poveo ga u šetnju, dok je robot uspješno balansirao na njoj bez pada, kao što možete vidjeti u ovom videu.

Jim Fan je omogućio da AI model uz nekoliko uputa ChatGPT-u sam napiše kod koji stvara sustav nagrada/kazni za treniranje robota u virtualnom prostoru, gdje je 0 jednako neuspjeh, a sve više od 0 je jednako pobjeda.

Prekoračenje ili kršenje parametara, primjerice pregrijavanjem motora ili pokušajem artikulacije uda izvan njegovih mogućnosti, rezultirat će ocjenom 0, koju nitko ne bi želio dobiti, pa tako ni AI.

Istraživači su rekli AI modelu da bude posebno oprezan tijekom programiranja, jer bi neuspjeh u održavanju ravnoteže na lopti u stvarnom okruženju mogao izazvati teška oštećenja robota pa je sam stvorio sigurnosne funkcije za primjerice orijentaciju i visinu torza, a vodio je i računa o tome da se robot ne "preturira", odnosno da mu se motori ne pregriju.

Na kraju se pokazalo da je AI u uvježbavanju robota bio bolji od ljudi jer je DrEureka uspio pobijediti ljude u treniranju robo-psa, zabilježivši prednost pred ljudima od 34% u brzini naprijed i 20% u prijeđenoj udaljenosti preko mješovitih terena u stvarnom svijetu.

DrEureka vs čovjek

Fan kaže da je razlog tome stil podučavanja. Ljudi teže nastavnom okruženju, raščlanjujući zadatke na male korake i pokušavajući ih objasniti u izolaciji, dok GPT ima sposobnost učinkovito podučavati sve odjednom, a to je nešto što mi ljudi jednostavno nismo u stanju učiniti.

Tvorci DrEureke vjeruju da bi mogli dodatno poboljšati obuku iz simulacije u stvarnost ako bi GPT-u mogli pružiti povratne informacije iz stvarnog svijeta. Trenutačno se sva obuka provodi pomoću podataka iz robotovih vlastitih propriocepcijskih sustava, odnosno osjećaja za vlastito tijelo u prostoru, ali kad bi GPT mogao vidjeti što je pošlo po zlu kroz video feed iz stvarnog svijeta, umjesto da samo iščitava neuspjehe u robotovim zapisima, mogao bi znatno učinkovitije poboljšati svoje upute.

Vjerojatno će se sada naći netko tko će reći da bi AI ne ovakav način mogao jednostavno isprogramirati robota terminatora i to zapravo nije daleko od istine, ali bi iza svega još uvijek morao biti čovjek koji će mu dati osnovne upute.

To što roboti zasad nemaju moral i etiku uopće nije bitno, jer oni nemaju nikakvu korist za sebe od toga da nas pobiju, ali ako njima upravljaju psihopati, onda smo u ozbiljnom problemu. To je puno izgledniji scenarij nego da umjetna inteligencija sama zaključi da joj nismo potrebni. Barem za još neko vrijeme.

Istraživački rad možete pronaći na ovoj poveznici pa probajte sami naučiti AI da programira vašeg robousisivača da ganja nekog ukućana po kući.

Vezani sadržaji
Ključne riječi University of Pennsylvania
Komentari

Učitavam komentare ...

Učitavam













       

*/-->