Print

Print


--------------------------   INFOLING   ------------------------------
 Lista de distribución de lingüística del español (ISSN: 1576-3404)
                  http://elies.rediris.es/infoling/
    Envío de información: [log in to unmask]
                             EDITORES:
       Carlos Subirats Rüggeberg, UAB <[log in to unmask]>
           Mar Cruz Piñol, U. Barcelona <[log in to unmask]>
   Eulalia de Bobes Soler, U. Abat Oliba-CEU <[log in to unmask]>
 Equipo de edición: http://elies.rediris.es/infoling/editores.html
Estudios de Lingüística del Español (ELiEs): http://elies.rediris.es
es una red temática de lingüística del español asociada a INFOLING.
                       © Copyright Infoling

------------------------------------------------------------------
Información sobre proyecto de investigación:
SenSem: Banco de datos sintáctico y semántico del español
Informaciòn sobre el proyecto:
http://grial.uab.es/index.php?idioma=es
Consulta de resultados:
http://grial.uab.es/search/index.php?idioma=es
Duración del proyecto: 2004/06
Financiado por el Ministerio de Ciencia y Tecnología de España (BFF2003-06456)
------------------------------------------------------------------

El proyecto  SenSem, que está desarrollando el grupo de investigación
GRIAL en Barcelona (España) (http://grial.uab.es/index.php?idioma=es),
consiste en la creación de un banco  de datos en el que se describe el
comportamiento sintáctico-semántico  de los verbos del español. Se
dispondrá de dos recursos: un corpus  anotado y un léxico verbal.

El corpus está constituido por 25.000 oraciones que se han
seleccionado  de un conjunto de textos de estilo periodístico del
español.  La selección  se ha llevado a cabo a partir de los 250
verbos más frecuentes de esta  lengua y se han considerado 100 frases
para cada verbo, por lo que es  posible que no estén ejemplificados
todos los sentidos.

La anotación  se ha hecho manualmente a través de  una herramienta de
anotación  creada en el marco del proyecto. Las oraciones se han
anotado a 3 niveles:  el verbo, como unidad léxica (sentido, uso
metafórico, etc.), los  constituyentes de la oración dominados por el
verbo (categoría sintagmática,  función sintáctica, rol semántico y
argumentalidad) y la semántica  oracional (aspecto, antiagentividad,
anticausatividad, reflexividad,  etc.). El corpus anotado se puede
consultar vía web a través de una  interfaz de búsqueda en:
http://grial.uab.es/search/index.php?idioma=es
Los resultados de las búsquedas  también se pueden visualizar en formato XML.

En el léxico  verbal, en:
http://grial.uab.es/sentits/index.php?idioma=es
cada sentido está asociado a su  definición, el tipo aspectual
prototípico, los papeles semánticos  y las correspondencias con la red
semántica WordNet. Al final del proyecto,  se incluirán también, para
cada sentido, ejemplos representativos  extraídos del corpus anotado,
así como los diferentes patrones de  subcategorización del verbo,
indicando, para cada argumento, su categoría  sintagmática, la función
sintáctica y el papel semántico. Además,  también se incorporarán las
restricciones de selección y las preposiciones  a partir de la
información extraída del corpus.

Actualmente  se está llevando a cabo la fase de revisión de la
anotación y la  constitución de la base de datos léxica. Se prevé
finalizar el proyecto  a finales del 2006. Todas las herramientas y
recursos que se han ido  construyendo en el marco del proyecto
(léxico, corpus e interfaces  de búsqueda y anotación) estarán
disponibles para la comunidad universitaria  para entonces. Para
obtener más información sobre el proyecto, como  las publicaciones
relacionadas, se puede consultar: http://grial.uab.es/projectes/sensem

Más información: [log in to unmask]

----------------------------------------------------------------------
Utiliza el buscador de Infoling en http://elies.rediris.es/infoling/
para realizar búsquedas en los mensajes enviados a la lista desde 1998.
----------------------------------------------------------------------