Dinamika je oblast mehanike koja je posvećena proučavanju sila koje prouzrokuju kretanje. Sa ciljem da se ubrza manipulator, učini klizanje na konstantnog brzini zadnjeg efektora i konačno uspori i zaustavi, kompleksan skup funkcija momenta mora da se primeni u slučaju zajedničkih aktuatora. U dinamici se ne koriste samo geometrijske osobine (kinematika), već i fizičke osobine robota se uzimaju u razmatranje. Uzmimo, na primer, težinu (inerciju) robotske ruke, koja određuje silu potrebnu da promeni kretanje ručice. Dinamika uvodi dva dodatna problema problemima kinematike.
Konačni cilj pri upravljanju robotskim manipulatorom je pozicioniranje zadnjeg efektora ili robotske ruke sa ciljem da se, na primer, pokupi objekat. Sa preciznom robotskom rukom, ovaj zadatak je relativno jednostavan i uključuje sledeće korake:
- Određivanje koordinata cilja relativno u odnosu na osnovu robota. Tipično, kada ova pozicija nije uvek ista, ovo se ostvaruje pomoću odreñenog broja fiksiranih kamera ili drugih senzora koji posmatraju scenu tako da se iz okvira slike odreñuje pozicija objekta u toj slici i izvršava pre-odreñivanje koordinantnih transformacija;
- Sa preciznim modelom robota, izračunava se ugao veza koje dostižu cilj (na primer, inverzna kinematika). Ovo je relativno jednostavan problem;
- Pomeranje robotske ruke i približavanje držača.
Dakle, ako je sve ovo lako rešiti sa visokom tačnošću, zbog čega u sve uključiti i neuralne mreže? Razlog leži u primenjivosti robota. Kada se koriste ‘tradicionalne’ metode za upravljanje robotskom rukom, tačni modeli senzora i manipulatora su zahtevani i sam sistem mora da bude baždaren. Takoñe, sistemi koji se lako troše i habaju, zahtevaju čestu kalibraciju i odreñivanje parametara. Konačno, sa razvojem složenijeg adaptivnog upravljanja došlo je do razvoja fleksibilnijih robotskih sistema, kako sa senzorske, tako i sa motorne strane.
Pristup 1: Mreže sa pozitivnom povratnom spregom
Kada se koristi sistem sa pozitivnom povratnom spregom za upravljanje manipulatorom, potrebno je koristiti sistem sa sopstvenim nadzorom učenja. Jedan takav sistem je bio opisan od strane Psaltis, Sideris i Yamamura (Psaltis, Sideris, & Yamamura, 1988). Ovde, mreža, koja je konzistentna 20dimenzinalnom pozicioniranju robotske ruke, uči na osnovu eksperimenata. Predložene su tri metode:
U indirektnom učenju, Dekartova ciljana tačka x se generiše u koordinantnom sistemu, na primer, pomoću dve kamere koje posmatraju objekat. Ova ciljana tačka je napajana u mreži, koja generiše ugaoni vektor θ. Manipulator se pomera na poziciju θ, i kamera odreñuje novu poziciju x’ zadnjeg efektora u koordinantnom sistemu. Veličina x’ je ponovo ulaz za mrežu, koji rezultira u ugao θ’. Mreža je tada trenirana na grešku ε1= θ-θ’.
Slika 2. Indirektno učenje za robotiku. U svakom ciklusu, mreža se koristi na dva različita mesta: prvo u
koraku napred, i zatim kao povratna sprega greške.
Međutim, minimizacija greške ε1 ne garantuje minimizaciju celokupne greške ε = x-x’. Na primer, mreža se obično podešava na ‘rešenje’ koje mapira sve x’ vrednosti na jedinstvenu vrednost θ.
ii. Opšte učenje
Metod je u osnovi vrlo sličan nadziranom učenju, ali ovde ulaz objekta θ mora biti obezbeđen od strane korisnika. Tako mreža može direktno da minimizira |θ – θ’|. Uspeh ove metode zavisi od sposobnosti interpolacije mreže. Pravilan izbor ugla θ može da pojednostavi problem.
iii. Specijalizovano učenje
Treba imati u vidu da je cilj treninga mreže minimiziranje greške izlaza objekta: ε = x – x’. Takođe je moguće trenirati mrežu pomoću ‘back-propagacije’ greška kroz objekat . Ova metoda zahteva poznavanje Jakobijanovih matrica objekta upravljanja. Jacobijanova matrica multidimenzionalne funkcije F je matrica parcijalnih izvoda funkcije F, odnosno multidimenzionalna forma izvoda.
Sada, u ovom slučaju imamo Pi( θ ), i0ti element izlaza objekta za ulaz θ. Pravilo učenja koje se primenjuje ovde se odnosi na objekat kao dodatni i jednorežimski sloj u neuralnoj mreži. Ukupna greška ε = x – x’ se prostire nazad kroz objekat.
Dvoslojna mreža sa pozitivnom povratnom spregom se trenira pomoću back0propagacije. Međutim, umesto računanja željenog vektora izlaza koji bi trebao da uvede trenutni vektor izlaza i da ga rekonstruiše, primenjena je back0propagacija na ovaj novi vektor ulaza i postojeći vektor izlaza. Korišćena konfiguracija se sastoji od monokularnog manipulatora koji hvata objekte. Zbog činjenice da je kamera pozicionirana na ruci robota, zadatak je da se pomeri ruka tako da je objekat u centru slike i da ima predefinisanu veličinu (Smagt, Krose, & Groen, 1992) pri kojoj se koristi vizuelno polje za proračun monokularnosti sistema. Jedan korak napred prema cilju se sastoji od sledećih operacija:
- Merenje rastojanja od trenutne pozicije do same pozicije cilja u domenu kamere, x.
- Korišćenje rastojanja, zajedno sa trenutnim stanjem θ robota, kao ulaza za neuralnu mrežu. Mreža
tada generiše rastojanje veze Cθ.
- Slanje Cθ manipulatoru.
- Ponovno mernje rastojanja od trenutne pozicije do pozicije cilja u domenu kamere, x’.
- Izračunavanje pomeraja manipulatora u vizuelnom domenu, gde je rotaciona matrica druge slike kamere sa tolerancijom u odnosu na r-tu sliku kamere;
- Učenje neuralne mreže.
Korišćenjem mreže sa pozitivnom povratnom spregom, dostupni uzorci za učenje se približno predstavljaju kao pojedinačna, glatka funkcija koja se sastoji od sume sinusnih funkcija. Ovakva mreža sa jednim slojem sinusnih jedinica je sposobna da predstavi praktično bilo koju funkciju. Ali, kakvi su optimalni težinski koeficijenti odreñeni u konačnom vremenu koji postižu optimalnu reprezentaciju? Eksperimenti su pokazali da razumna reprezentacija može da se postigne u kratkom periodu vremena, dok tačna reprezentacija funkcije koja upravlja uzorkom učenja je obično nemoguće ili ekstremno komplikovana. Razlog za ovo predstavlja opšti karakter aproksimacije koji se postiže mrežom sa pozitivnom povratnom spregom koja ima sinusne jedinice: svaki težinski koeficijent u mreži ima globalne efekte na konačnu aproksimaciju. Građenje lokalnih reprezentacija je očigledan izlaz iz ove situacije: svaki deo mreže je odgovoran za mali potprostor ukupnog prostora ulaza. Na taj način, tačnost je postignuta lokalno. Ovo se tipično postiže pomoću Kohonen-ove neuralne mreže.
Pristup 2: Topologija koja konzervira mape
Opisani sistem se sastoji od robotskog manipulatora sa 3 stepena slobode koji je u stanju da uhvati objekat u 3D-prostoru. Sistem se posmatra pomoću dve fiksirane kamere koje predstavljaju izlaz njihovih (x; y) koordinata u smislu objekta i zadnjeg efektora.
Slika 3. Kohonen-ova mreža koja se odnosi na izlaz dveju kamera.
Svako kretanje se satoji od dva pokreta. U ukupnom pokretu, posmatrana lokacija objekta x je ulaz mreže. Pomoću Kohonen-ove neuralne mreže, neuron k sa najvišom vredošću aktivacije je selektovan kao pobednik, zato što je njegov težinski vektor Wk najbliži vrednosti x. Neuroni, koji su rasporeñeni u 3D rešetki, koresponduju na 1-1 način sa podregionom 3D radnog prostora robota, odnosno neuronalna rešetka je diskretna reprezentacija radnog prostora. Sa svakim neuronom, vektor θ i Jacobijanova matrica A su pridruženi. Za vreme ukupnog pomeraja, ugao θk se dovodi do robota koji zatim načini pokret koji rezultira u promenu koordinata zadnjeg efektora.