Már a beszédet is felismerik a humanoid robotok
2005.06.24. 08:01
A japán Advanced Industrial Science and Technology (AIST) nemzeti intézet kifejlesztett egy olyan beszédfelismerő funkciót , mely valós körülmények között, egy sor mikrofonnal, sikeresen terjeszti ki egy humanoid robot érzékelő képességeit a Prométhée projekt keretein belül.
A mikrofonsor nyolc, minden irányban működő mikrofont tartalmaz, melyeket a robot feje köré helyeznek fel. A hangforrásokat különböző helyeken szerelték fel, hogy az egyes mikrofonokat leteszteljék, emellett egy kamerát szereltek a robot fejére, hogy észlelje, nyomon kövesse és lokalizálja a hozzá beszélő embert. A stabil beszédfelismerés a mikrofonsor és a kamera által begyűjtött információk kombinálásával, valamint a zajok kiszűrésével válik lehetővé.
A zajok kiszűrését biztosító hardvert már kifejlesztették és beépítették a robotba, ezzel lehetővé vált, hogy az emberi irányító vokális instrukciókat adjon a robotnak, és IT alkalmazásokat vezéreljen annak segítségével. A kutatók azt várják, hogy ezzel a fejlesztéssel a természetes kommunikáció valósítható meg az emberi operátor és a humanoid robot között.
Mióta a Honda 1996-ban bejelentette a P2-es humanoid robot fejlesztését, azóta a hasonló projektek száma jelentősen megugrott, ám nemcsak a szigetországban, hanem az egész világon. Japánban már azt tervezik, hogy az emberszerű robotokat bevezetik a laborokba, hogy segítsék a tudományos kutatásokat, emellett 2025-ig háztartási robotokat, valamint betegeket és öregeket segítő robotokat is szeretnének kifejleszteni.
Míg a korábbi kutatások kifejezetten a robotok mozgására koncentrált, hogy azok stabil és biztos lépéseket produkáljanak, nem sok figyelmet fordítottak a robotok hallófunkcióira, mely szintén fontos szerepet játszik a természetes kommunikációs folyamat biztosításában ember és robot között. Az élő környezetben, ahol a következő generációs robotok használata már elvárható, a közvetlen ember-robot kapcsolat hangcsatornán keresztül a robot perceptív funkcióinak egyik kulcsfontosságú metódusa lesz.
Szintén ilyen környezetben, a robotnak számos hangforrással kell majd megbirkóznia, többek között a multimédiás eszközökkel. Bizonyos körülmények között, a természetes kommunikációs ember és robot között ugyanolyan fontos lesz, mint az emberek egymás közötti vokális érintkezése. A jelenlegi fejlesztés lehetővé teszi, hogy egy humanoid robot hang interfészt kapjon, így számos, a környezetben előforduló hangforrással képes majd megbírkózni.
A hang interfész egy mikrofonsorból áll, mely 8, minden irányban figyelő mikrofont tartalmaz a robot fejébe beágyazva. Emellett kell egy szoftver, mely az ember pozícióját észleli, amikor a kamera nagylátószögű képeket készít az operátor mozgásáról. Emellett kell egy szoftver, mely a hangforrás helyzetét állapítja meg, a hangjelek beérkező idejének különbsége szerint. Egy kisméretű hardver multicsatornás jelfeldolgozást tesz lehetővé, hogy ezen szoftverek adatait valós időben dolgozza fel.
Az emberi hangot megszabadítván a zajtól, a "Julian" nevű hangfelismerő szoftver lehetővé teszi, hogy a humanoid robot pontosan meg tudja állapítani, honnan is ered a hang, főleg egy olyan környezetben, ahol szól a tévé, vagy egyéb zajok is zavarják a kommunikációt. Emellett a japán kutatók egy sor olyan szoftvert is kifejlesztettek, melyekkel a robotok a vokális instrukcióknak megfelelőn irányítják az elektronikai eszközöket.
Forrás: Híradó.hu http://www.hirado.hu/cikk.php?id=45957
|