-------------------------- INFOLING ------------------------------ Lista de distribución de lingüística del español (ISSN: 1576-3404) http://elies.rediris.es/infoling/ Envío de información: [log in to unmask] EDITORES: Carlos Subirats Rüggeberg, UAB <[log in to unmask]> Mar Cruz Piñol, U. Barcelona <[log in to unmask]> Eulalia de Bobes Soler, U. Abat Oliba-CEU <[log in to unmask]> Equipo de edición: http://elies.rediris.es/infoling/editores.html Estudios de Lingüística del Español (ELiEs): http://elies.rediris.es es una red temática de lingüística del español asociada a INFOLING. © Copyright Infoling ------------------------------------------------------------------ Información sobre proyecto de investigación: SenSem: Banco de datos sintáctico y semántico del español Informaciòn sobre el proyecto: http://grial.uab.es/index.php?idioma=es Consulta de resultados: http://grial.uab.es/search/index.php?idioma=es Duración del proyecto: 2004/06 Financiado por el Ministerio de Ciencia y Tecnología de España (BFF2003-06456) ------------------------------------------------------------------ El proyecto SenSem, que está desarrollando el grupo de investigación GRIAL en Barcelona (España) (http://grial.uab.es/index.php?idioma=es), consiste en la creación de un banco de datos en el que se describe el comportamiento sintáctico-semántico de los verbos del español. Se dispondrá de dos recursos: un corpus anotado y un léxico verbal. El corpus está constituido por 25.000 oraciones que se han seleccionado de un conjunto de textos de estilo periodístico del español. La selección se ha llevado a cabo a partir de los 250 verbos más frecuentes de esta lengua y se han considerado 100 frases para cada verbo, por lo que es posible que no estén ejemplificados todos los sentidos. La anotación se ha hecho manualmente a través de una herramienta de anotación creada en el marco del proyecto. Las oraciones se han anotado a 3 niveles: el verbo, como unidad léxica (sentido, uso metafórico, etc.), los constituyentes de la oración dominados por el verbo (categoría sintagmática, función sintáctica, rol semántico y argumentalidad) y la semántica oracional (aspecto, antiagentividad, anticausatividad, reflexividad, etc.). El corpus anotado se puede consultar vía web a través de una interfaz de búsqueda en: http://grial.uab.es/search/index.php?idioma=es Los resultados de las búsquedas también se pueden visualizar en formato XML. En el léxico verbal, en: http://grial.uab.es/sentits/index.php?idioma=es cada sentido está asociado a su definición, el tipo aspectual prototípico, los papeles semánticos y las correspondencias con la red semántica WordNet. Al final del proyecto, se incluirán también, para cada sentido, ejemplos representativos extraídos del corpus anotado, así como los diferentes patrones de subcategorización del verbo, indicando, para cada argumento, su categoría sintagmática, la función sintáctica y el papel semántico. Además, también se incorporarán las restricciones de selección y las preposiciones a partir de la información extraída del corpus. Actualmente se está llevando a cabo la fase de revisión de la anotación y la constitución de la base de datos léxica. Se prevé finalizar el proyecto a finales del 2006. Todas las herramientas y recursos que se han ido construyendo en el marco del proyecto (léxico, corpus e interfaces de búsqueda y anotación) estarán disponibles para la comunidad universitaria para entonces. Para obtener más información sobre el proyecto, como las publicaciones relacionadas, se puede consultar: http://grial.uab.es/projectes/sensem Más información: [log in to unmask] ---------------------------------------------------------------------- Utiliza el buscador de Infoling en http://elies.rediris.es/infoling/ para realizar búsquedas en los mensajes enviados a la lista desde 1998. ----------------------------------------------------------------------