Pázmány Péter Katolikus Egyetem
A Pázmány Péter Katolikus Egyetem Információs Technológiai és Bionikai Karán létrejött, a Magyar Tudományos Akadémiával együttműködő Nyelvtechnológiai Kutatóközpontban nyelvészek, mérnökök és informatikusok, kutatók és diákok dolgoznak együtt. A központ fő kutatási és fejlesztési területei közé tartozik például a statisztikai gépi fordítás, az orvosi szövegek feldolgozása, a morfológiai elemzők építése és a szófaji elemzés.
A központ nagy projektje egy olyan elemzőrendszer, mely számos ponton különbözik az eddigi eszközöktől. Az AnaGramma egy pszicholingvisztikai indíttatású, performancián alapuló rendszer, amelynek célja, hogy bármilyen szöveget fel tudjon dolgozni, nem csak a nyelvtanilag helyes formákat. A parser szigorú balról jobbra történő feldolgozást követ. Felépítése a korábbi megközelítésekkel ellentétben párhuzamos, vagyis a morfológiai és szintaktikai elemzők, statisztikai ellenőrzések stb. párhuzamosan zajlanak, és egymással kooperálva adják az outputot. Ez az elemző teljesen új megközelítése a számítógépes nyelvi feldolgozásnak.
További információ: http://nlpg.itk.ppke.hu
A PPKE átlal kidolgozott eszközök:
Infrastruktúra | Leírás | Koordinátor |
---|---|---|
PurePos morfológiai egyértelműsítő program | A PurePos egy nyílt forráskódú, HMM-alapú automatikus morfológiai elemző, mely szótövesítésre és címkézésre is alkalmas. | Orosz György |
AnaGramma | Párhuzamos felépítésű, pszicholingvisztikai indíttatású elemző, mely az egész szöveget veszi az elemzés alapjául. | Novák Attila |