INFOLING Lista moderada de lingüística española
http://listserv.rediris.es/archives/infoling.html
Envío de información: [log in to unmask]
Editor: Carlos Subirats Rüggeberg <[log in to unmask]>
Colaboradoras:
Paola Bentivoglio <[log in to unmask]>, UCV
Eulalia de Bobes <[log in to unmask]>, UAB
Mar Cruz <[log in to unmask]>, UB
Emma Martinell <[log in to unmask]>, UB
____________________________________________________________
Nueva página web
del
Laboratorio de Lingüística Informática de la UAB
http://seneca.uab.es/csubirats/lali.html
____________________________________________________________
El Laboratorio de Lingüística Informática (LaLI) de la
Universidad Autónoma de Barcelona (España) os invita a visitar su
nueva página:
http://seneca.uab.es/csubirats/lali.html
En dicha página, se describe la actividad que se está desarrollando
en el LaLI, la cual se centra básicamente en el desarrollo de:
- bases de conocimiento lingüístico (léxico, sintáctico y
semántico) y
- aplicaciones informáticas
para tratar automáticamente la información de grandes corpus en
lengua española.
Las bases de conocimiento lingüístico están integradas por:
- un diccionario electrónico de 92.000 lemas (66,000 formas
simples y 26,000 locuciones), que se expande automáticamente
en un diccionario de 600.000 formas;
- una gramática electrónica de 4.600 predicados
El proceso de extracción de información parte de la
identificación de los elementos léxicos de un texto (tanto simples
como locuciones) junto con sus posibles ambigüedades. Para llevar a
cabo este proceso, se utiliza la información de:
- un diccionario electrónico convertido en un transductor;
- transductores extraídos de una gramática electrónica;
De esta forma, es posible identificar tanto los elementos léxicos
simples como los locutivos, incluyendo aquellas locuciones, como p.
ej., las locuciones verbales o las adjetivas, cuya detección
requiere información léxica y sintáctica (que, en nuestra
aplicación, procede de un diccionario y de una gramática
electrónicos respectivamente).
La extracción del contenido informativo de las oraciones de un
texto se realiza a partir de la identificación de las relaciones
jerárquicas de predicación, es decir, a partir de la identificación
de las relaciones entre los predicados y sus argumentos. Este
procedimiento permite poner directamente en relación una jerarquía
de predicación -tal como se manifiesta en una oración- con la
información que vehicula y, por tanto, permite prescindir de
niveles intermedios, como p. ej., la 'estructura de
constituyentes':
http://seneca.uab.es/csubirats/lali.html
----------------------------------------------------
Formatos para enviar informacion a INFOLING.
Enviar a [log in to unmask]
la orden: INFO INFOLING
----------------------------------------------------
|