Nyelveket tanul a szoftver
2005.09.25. 12:46
Mikor tanulnak a robotok angolul? Kissé sci-fiszerűen hangzik a kérdés, ám a válasz mégsem annyira futurisztikus, mert ha ők még nem is, de egyes programok már most igyekeznek elsajátítani természetes nyelveket. Az izraeli Tel Aviv Egyetemen fejlesztett ADIOS szövegekből érti az adott nyelv grammatikáját, majd új mondatokat hoz létre belőlük.
Az Automatic DIstillation Of Structures (ADIOS, hozzávetőleges fordításban: szerkezetek automatikus „lepárlása”, letisztítása) a lingvisztikán kívül más tudományterületek, például a bioinformatika, vagy a fejlődéspszichológia problémáira is adhat megoldásokat.
A projektet részben az 1972-ben a két ország kormánya által létrehozott Egyesült Államok-Izraeli Tudományos Alapítvány finanszírozta, amerikai részről a Cornell Egyetem (Ithaca, New York állam) vett részt benne. Az utóbbi években egyre több technológiai, kutatásfejlesztési kooperáció jött létre a két állam között. Az együttműködést sikeres termék sora szemlélteti: az Intel Pentium IV és Centrino processzorai, Windows XP, AOL Instant Messenger, stb.
Az ADIOS fejlesztését a Cornell Egyetem Pszichológia Tanszékén dolgozó, a látást és nyelvi kérdéseket kutató izraeli születésű Shimon Edelman vezette. Munkatársai a tel avivi felsőoktatási intézmény két professzora, David Horn és Eytan Ruppin, valamint az ott PhD-hallgató Zach Solan voltak.
ADIOS látott ma egy filmet
Elsődleges célként az agyban lévő szintaktikai és szemantikai ismeretek reprezentációjára vonatkozó új, számítógépes modell készítését tűzték ki. A kivitelezéshez a nyelvtanulás és feldolgozás folyamatát tanulmányozták. Programjuk nyers – nemcsak nyelvi – adatokból (szövegből, leírt beszédből, aminosav-sorozatokból, hangjegyekből, stb.) összeálló halmazokat vizsgálva próbál a működésüket meghatározó szabályokra következtetni.
A nyelvelsajátítás során fontos szerepet játszó két folyamatra, a mintakivonatolásra (pattern extraction), illetve annak egyik statisztikai módszerére, a MEX algoritmusra és a strukturált általánosításra támaszkodó ADIOSt kontextus-független mesterséges nyelvtanokon (ATIS, CHILDES), bibliai szövegeken, azaz természetes nyelveken (angolon, kínain, stb.), valamint DNS-szekvenciák kódoló részein és proteineken egyaránt tesztelték.
„Amikor új inputot vizsgál, egymás között felcserélhető szekvenciák, vagy ismétlődő minták után kutat” – magyarázza Edelman. Például egy szövegben a következő három mondat szerepel: „láttam ma egy filmet, te jó ég, milyen volt!”, „látott ma egy filmet a fogadáson”, „látott ma egy filmet, és tetszett neki”. A program azonosítja a „látott/láttam ma egy filmet” szekvenciát, és eldönti, hogy statisztikailag fontos minta, vagy sem. Ha igen, akkor hozzáadja a saját lexikonjához, majd felhasználhatja új mondatok létrehozására. Mivel különböző mondatok egymást részlegesen lefedő szekvenciáit használja, a fejlesztők kimutatták, hogy a szigorú nyelvtani szabályokon alapuló nyelveknél, például az angolnál, vagy a németnél működik a legjobban. Az ebből a szempontból „problematikusabb” nyelvek, például a héber esetében (a közeljövőben elvégzendő) további finomításokra, pontosításokra lesz szükség.
ADIOS jövője
Edelman szerint szoftverüket hamarosan több területen (legelőször a beszédfelismerésben) alkalmazzák. Használatban lévő termékekbe szintén beépítik. Például Julie, az Amtrak virtuális utazási alkalmazottja az ADIOS nyelvtani ismereteinek segítségével ki tudja következtetni, mi lesz az adott mondat soron következő eleme, vagy könnyebben áthidalja a (például idegen akcentus miatti) megértésbeli problémákat.
A szoftver a gyerekkori nyelvelsajátításra, a felnőttek nyelvi kompetenciájára, a nyelvfeldolgozásra, a második nyelv tanulására vonatkozó eddigi vélekedések, prekoncepciók felülvizsgálatában szintén hasznos lehet. Mindezt pszicholingvisztikai kísérletek, például mesterséges nyelvek tanulásának modellezése során szerzett tapasztalataikból szűrték le.
Forrás: agent.ai http://www.agent.ai/main.php?articleID=1521
|