LISTSERV mailing list manager LISTSERV 16.0

Help for INFOLING Archives


INFOLING Archives

INFOLING Archives


INFOLING@LISTSERV.REDIRIS.ES


View:

Message:

[

First

|

Previous

|

Next

|

Last

]

By Topic:

[

First

|

Previous

|

Next

|

Last

]

By Author:

[

First

|

Previous

|

Next

|

Last

]

Font:

Monospaced Font

LISTSERV Archives

LISTSERV Archives

INFOLING Home

INFOLING Home

INFOLING  April 1999

INFOLING April 1999

Subject:

Información sobre la empresa de ingeniería lingüística SIGNUM

From:

Carlos Subirats Rüggeberg <[log in to unmask]>

Reply-To:

[log in to unmask]

Date:

Wed, 21 Apr 1999 14:18:24 +0200

Content-Type:

text/plain

Parts/Attachments:

Parts/Attachments

text/plain (394 lines)

INFOLING Lista moderada de lingüística española
http://listserv.rediris.es/archives/infoling.html
http://www.rediris.es/list/info/infoling.html
Envío de información: [log in to unmask]
Editor: Carlos Subirats Rüggeberg <[log in to unmask]>
Colaboradoras:
Paola Bentivoglio <[log in to unmask]>, U. Central Venezuela
Mar Cruz <[log in to unmask]>, U. Barcelona
Eulalia de Bobes <[log in to unmask]>, U. Autónoma Barcelona
Emma Martinell <[log in to unmask]>, U. Barcelona
Rosa Ribas <[log in to unmask]>, U. Frankfurt
____________________________________________________________

      Información sobre la empresa de ingeniería lingüística
                              SIGNUM
           De: Plutarco Naranjo <[log in to unmask]>
                      http://www.lenguaje.com
____________________________________________________________

                           Introducción
    SIGNUM es una empresa de ingeniería lingüística dedicada al
español. Tiene un producto para usuarios finales, Ortógrafo, que
es un corrector ortográfico del español con más de cinco millones
de palabras. Ha sido seleccionada por Microsoft para proporcionar
sus motores para la venidera versión del Microsoft Office. La
compañía SIGNUM fue galardonada por Alcatel Ecuador con su premio
a la innovación tecnológica.

    SIGNUM Cía. Ltda. se fundó en 1988 con el fin de prestar
servicios de investigación y desarrollo en el campo del lenguaje
y su procesamiento. Inicialmente realizó trabajos de localización
de software para empresas norteamericanas como Apple Computer,
Autodesk, Software Publishing Corporation, Aldus Corporation y
otras. A partir de 1994 se dedicó únicamente a investigar el
léxico, la morfología y la sinonimia del español.

SIGNUM Cía. Ltda.
Avenida 12 de Octubre E24-994
Casilla 17-07-9918
Quito, Ecuador
Correo-e: [log in to unmask]
http://www.lenguaje.com
Tel.: (593-2) 568037 / 568038
Fax: (593-2) 568114


             Motores para el procesamiento del español
    SIGNUM ha desarrollado motores lingüísticos del español que
pueden formar parte de aplicaciones informáticas:
    - módulos de corrección ortográfica,
    - módulos o de división en sílabas;
    - apoyo léxico y morfológico para obtener lemas y
      etiquetar;
    - búsqueda de palabras homófonas o parónimas para un
      término;
    - diccionario de sinónimos totalmente declinable.


                              Léxico
    El léxico de SIGNUM está basado en un núcleo de más de
115.000 vocablos; incluye la terminología local de cada país
hispanohablante y el vocabulario técnico de casi todos los campos
de la ciencia. Contiene nuevos términos que son comúnmente usados
hoy en día en publicaciones, pero que no aparecen en muchos
diccionarios, así como términos no frecuentes, que suelen
aparecer en literatura especializada.

    El núcleo de 115.000 vocablos está complementado por todas
las formas flexivas que estas palabras pueden tener. Contempla
variaciones de género, número, diminutivos, aumentativos,
superlativos y desienencias peyorativas; todas las conjugaciones
verbales, los enclíticos más usados en español; asimismo contiene
morfemas derivativos como "-mente" "-ismo" "super-" "semi-"
"pre-" "pos-" entre otros. Tomando en cuenta todas estas
formaciones morfológicas, el tamaño del léxico es de más de
5.000.000 de palabras.

    Cada término del léxico tiene docenas de atributos,
proveyendo así datos morfológicos, gramaticales, semánticos y
otro tipo de datos como el "índice de frecuencia", que nos indica
cuán común o rara es la palabra.

    Dos características importantes se pueden resaltar del léxico
de SIGNUM:
    - éste es utilizado de forma óptima por nuestros motores
lingüísticos y forma así su diccionario base, sobre el cual
trabajan muchos de estos motores;
    - y también, a partir de este léxico, podemos generar listas
de palabras que consistan de determinados tipos de lemas, formas
flexivas o palabras con características especiales, de acuerdo
con los requerimientos específicos de una aplicación o de un
usuario que necesite un léxico depurado y de alta calidad.


                       Beneficios del léxico
     Dispondrá de un léxico muy completo y actualizado del idioma
     español.
     El contenido léxico ha sido revisado, depurado de errores y
     es altamente confiable.
     Léxico categorizado y etiquetado con información morfológica,
     y sintáctica.
     El usuario que necesita una lista de palabras puede
     especificar qué tipo de información relevante, contenida en
     nuestro léxico, le interesa.
     Los motores lingüísticos de SIGNUM se basan en un amplio
     léxico de alta calidad.


                            Lematizador
    Al reconocer una palabra, el lematizador de SIGNUM presenta
su lema (raíz) e información sobre el tipo de flexión de la
palabra consultada. La base de este motor es el léxico de SIGNUM
con sus 5 millones de palabras.

    En el caso de la palabra "perritas", por ejemplo, el
lematizador determina que se trata del lema "perro" con los
atributos femenino, plural y diminutivo. Similarmente, si
ingresamos la palabra "leerá", nos indicará que es la tercera
persona del singular del futuro del indicativo del verbo "leer".
El usuario puede resolver ambigüedades semánticas para aquellas
palabras que pueden tener dos o más lemas: el lematizador está en
capacidad de encontrar todos los posibles lemas; así, si se busca
la palabra "suma" el lematizador retorna lo siguiente:

     Raíz del sustantivo "suma".
     Tercera persona singular del presente de indicativo del verbo
     "sumar".
     Primera persona del presente del subjuntivo y tercera persona
     singular del imperativo del verbo "sumir".
     Femenino singular del adjetivo "sumo".

Parte de la información que se puede obtener de cada palabra, es
la siguiente:

     Lema o lemas de la palabra analizada.
     Índice de rareza de la palabra; éste ha sido calculado en
     base al uso de la palabra, un término usado frecuentemente en
     el español tendrá un índice mayor que aquel no casi no se
     utiliza.
     Indicador de mayúsculas; determina si la palabra requiere
     mayúscula inicial, esto es si es un nombre propio.
     Indicador de abreviatura; si la palabra ingresada es una
     abreviatura común en español.
     Categoría gramatical, indicando si la palabra analizada es
     sustantivo, adjetivo, adverbio, verbo, etc.
     Heterónimos; indica la formación de un femenino o un
     masculino irregular, por ejemplo: emperador y emperatriz,
     macho y hembra, etc.
     Flexión; indica la relación morfológica de la palabra
     respecto a su lema. Si se ingresa la palabra "organizamos" se
     tiene que corresponde a la primera persona del plural del
     presente del indicativo.
     Indicador de significación por género masculino; esta
     información permite saber cuando un término tiene un
     significado especial en el género masculino, así: "gato"
     solamente en masculino toma dos significados particulares, de
     "herramienta, palanca, prensa" y el de "bolso, talego";
     mientras que "gato" cuando puede aplicarse en ambos géneros
     como "gato" y "gata" tiene como significado el de animal.

Se puede obtener otros datos como por ejemplo, si el verbo es
pronominal o, en algunas palabras, el ámbito regional y temático.

    Este motor está en capacidad de almacenar información
adicional para cada lema como: definición, sinónimos, información
semántica, imagen, o cualquier otro dato que el usuario desee
asociar con la palabra.


                  Características del lematizador
     Capacidad de reconocer el léxico más completo, incluyendo a
     la rica morfología del español.
     Obtención de todos los lemas posibles de las palabras
     consultadas, con la posibilidad de determinar el tipo de
     declinación que tienen.
     Permite almacenar junto a cada palabra cualquier otro tipo de
     información que el usuario necesite asociar a las palabras.
     El lematizador puede ser utilizado dentro de las aplicaciones
     del cliente, siendo así una poderosa plataforma para el
     procesamiento del español.


                        Motor de flexiones
    El motor de flexiones de SIGNUM provee la funcionalidad para
generar todas las formas posibles de una palabra española.
Dependiendo de la naturaleza de la palabra, se generan, entre
otras, las flexiones de género, número, diminutivos,
aumentativos, superlativos y formas peyorativas; en el caso de
los verbos, todas las conjugaciones verbales y los enclíticos más
comunes.

    Este motor recibe como entrada un palabra, la analiza, si
está correctamente escrita y la encuentra en su base
léxico-morfológica, procede a generar todas las formas
morfológicas que este término puede aceptar. Además, proporciona
información sobre el tipo de forma flexiva generada.

    Por ejemplo, si se ingresa el término "perro" obtendremos
información como la siguiente:

     "perro" masculino singular
     "perros" masculino plural
     "perrito" masculino diminutivo singular
     "perritos" masculino diminutivo plural
     "perrillo" masculino diminutivo-2 singular
     "perrillos" masculino diminutivo-2 plural
     "perrote" masculino aumentativo singular
     "perrotes" masculino aumentativo plural
     "perrazo" masculino aumentativo-2 singular
     "perrazos" masculino aumentativo-2 plural
     "perra" femenino singular
     "perras" femenino plural
     "perrita" femenino diminutivo singular
     "perritas" femenino diminutivo plural
     "perrilla" femenino diminutivo-2 singular
     "perrillas" femenino diminutivo-2 plural
     "perrota" femenino aumentativo singular
     "perrotas" femenino aumentativo plural
     "perraza" femenino aumentativo-2 singular
     "perrazas" femenino aumentativo-2 plural

    De manera similar, se pueden consultar las flexiones
completas de un verbo, presentando todas sus formas conjugadas,
su participio con sus formas correspondientes, así como también
el grupo de enclíticos más usados. Por otra parte, si únicamente
se desean obtener las conjugaciones verbales, por ser tan útiles
al momento de resolver dudas, se recomienda usar el motor de
conjugaciones que es una herramienta sumamente didáctica


                  Beneficios del motor de flexión
     Posibilidad de crear con mucha precisión y agilidad léxicos o
     listas de palabras flexionadas.
     Rapidez en la generación y presentación de las posibles
     flexiones que acepta una palabra.
     Información morfológica completa, confiable y de alta
     calidad.


                  Motor de corrección ortográfica
    El motor ortográfico de SIGNUM provee a sus usuarios finales
múltiples beneficios que no pueden ser obtenidos de motores
similares, gracias a sus avanzadas características:

     Vocabulario de más de 5.000.000 de palabras que comprende
     términos locales y técnicos con una vasta capacidad
     morfológica.
     Motor de sugerencias construido para la fonética española,
     provee excelentes sugerencias para errores tipográficos y
     ortográficos.
     Reconocimiento inteligente y señalamiento de los conflictivos
     homófonos y parónimos del español, es decir, aquellas
     palabras cuya pronunciación es muy similar, pero que se
     escriben de una manera diferente y que tienen, por lo tanto,
     diferentes significados. Por ejemplo, "ingerir" e "injerir",
     o "binario" y "vinario".
     Manejo adecuado de las frases que actúan como palabras. Se
     consideran tres casos: aquellas que deben ser escritas como
     dos palabras "a través" aquellas que pueden cambiar de
     significado si son escritas como dos palabras o como una sola
     "apropósito - a propósito" y aquellas que deben ser escritas
     en una sola palabra "autocrítica".
     Señalamiento de palabras especiales. Por ejemplo el programa
     señala a la palabra "indefensible" y recomienda
     "indefendible" como un término más culto; o sugiere
     "transporte" como una forma más tradicional que "trasporte";
     para un error común como "accesar" sugiere el término propio
     "acceder"; o el término extranjero "cash" recibe su
     equivalente en español "en efectivo".
     Ejemplos aclaratorios para muchas de las sugerencias. Ayudan
     a sus usuarios a decidir entre formas similares de escritura
     y dan al programa un alto valor didáctico.
     Listas de sugerencias cortas, precisas e inteligentes para
     los errores ortográficos de los usuarios.
     Características especiales para usuarios de OCR.
     Amplia gama de opciones para el usuario con el fin de hacer
     la revisión más permisiva o más estricta acorde al nivel de
     conocimientos ortográficos del usuario.


          Beneficios del motor de corrección ortográfica
     Cuenta con el motor de corrección ortográfica más avanzado y
     completo del español.
     Gracias a su amplio vocabulario no se detiene inútilmente en
     palabras poco usuales, técnicas o localismos que están bien
     escritos y, por lo tanto, la corrección es más rápida.
     Dispone del léxico más completo y confiable del español.
     Poderoso módulo de reconocimiento de homófonos y parónimos
     que con sus ejemplos aclaran las dudas y resulta muy
     didáctico.
     Atrapa errores fáciles de cometer, que muchas veces ni
     siquiera nos traen dudas.
     Opciones de corrección ortográfica para una adaptación ceñida
     al nivel ortográfico del usuario.

                  Motor de sinónimos y antónimos
    El motor de sinónimos y antónimos de SIGNUM acepta palabras
flexionadas y presenta los sinónimos en la misma forma flexiva
que la palabra buscada; por ejemplo, para el término "librito" se
tienen los sinónimos "obrita, tratadito, manualito, textito",
entre otros. Este diccionario contiene aproximadamente 50.000
entradas y más 500.000 sinónimos, antónimos y expresiones
relacionadas.

    Cuando la palabra buscada es una forma flexiva que puede
provenir de más de un lema, este motor presenta los sinónimos que
corresponden a cada uno de los lemas, así para la palabra "fui"
que proviene del verbo "ir" se tiene "marché, caminé, partí" y
otros; para "fui" del verbo "ser" se tiene "existí, estuve, me
hallé" y demás. El motor puede presentar la categoría gramatical
de cada sinónimo y antónimo encontrado, así como también, indicar
a qué declinación morfológica corresponde.


           Beneficios del motor de sinónimos y antónimos
     El más sofisticado diccionario electrónico de sinónimos listo
     para usarse en su aplicación.
     Poderosa herramienta que proporciona sinónimos y antónimos en
     la misma forma declinada en que se encuentra la palabra
     buscada.
     Al presentar todos los posibles significados de una palabra
     el usuario puede resolver ambigüedades y obtener los
     sinónimos correspondientes a cada significado.


                         Motor de guiones
    El motor de guiones de SIGNUM no sólo separa a una palabra en
sílabas en la forma académicamente correcta, sino que corta a la
palabra en puntos estratégicos para que, cuando ésta se divida al
final de una línea, el resultado sea estético y fácil de leer.

    Esta forma de separar una palabra permite un considerable
ahorro de espacio en los textos y brinda facilidad de lectura y
entendimiento.

    A continuación detallamos unos pocos ejemplos para mostrar
las diferencias entre nuestro motor de guiones y aquellos que se
encuentran en otros productos:

                  SIGNUM OTROS
                  al-helí alhe-lí
                  bien-in-ten-cio-na-do bie-nin-ten-cio-na-do
                  bio-éti-ca bioé-ti-ca
                  en-hora-bue-na enho-ra-bue-na
                  ve-he-men-te vehe-men-te


                  Beneficios del motor de guiones
     Separa las palabras en forma estética y fácil de leer.
     Optimiza la distribución del texto en un párrafo y reduce su
     número de líneas ahorrando espacio.


                      Motor de conjugaciones
    El motor de conjugaciones de SIGNUM puede generar, con total
exactitud, la conjugación completa de más de 13.000 verbos.
Incluye todos los modos verbales, tiempos y personas.


               Beneficio del motor de conjugaciones
     Aclara las dudas con algunas formas verbales cuya escritura
     trae problemas.
     Agrega valor a cualquier diccionario o programa de
     procesamiento del lenguaje.
     Sumamente didáctico.


                    Motor de semejanza fonética
    Con nuestro motor de semejanza fonética sus aplicaciones
pueden incluir la notable función de "suena como" para el
español. Esto tiene muchos usos, por ejemplo, búsquedas de
palabras en textos completos; reconocimiento del habla;
generación de homófonos y parónimos; detección de marcas y
nombres comerciales semejantes; generación de sugerencias en caso
de palabras mal escritas; entre otras.


            Beneficios del motor de semejanza fonética
     Aumenta la versatilidad de aplicaciones que trabajan con el
     lenguaje natural dotándoles de capacidades fonéticas que
     mejoran significativamente determinadas funciones.

                         Más información:
                      http://www.lenguaje.com
     Otras informaciones sobre SIGNUM aparecidas en Infoling:
http://listserv.rediris.es/cgi-bin/wa?A2=ind9904&L=infoling&D=1&H=1&O=D&P=1908

----------------------------------------------------
Formatos para enviar informacion a INFOLING.
Enviar a [log in to unmask]
la orden: INFO INFOLING
----------------------------------------------------

Top of Message | Previous Page | Permalink

Advanced Options


Options

Log In

Log In

Get Password

Get Password


Search Archives

Search Archives


Subscribe or Unsubscribe

Subscribe or Unsubscribe


Archives

October 2021
September 2021
August 2021
July 2021
June 2021
May 2021
April 2021
March 2021
February 2021
January 2021
December 2020
November 2020
October 2020
September 2020
August 2020
July 2020
June 2020
May 2020
April 2020
March 2020
February 2020
January 2020
December 2019
November 2019
October 2019
September 2019
August 2019
July 2019
June 2019
May 2019
April 2019
March 2019
February 2019
January 2019
December 2018
November 2018
October 2018
September 2018
August 2018
July 2018
June 2018
May 2018
April 2018
March 2018
February 2018
January 2018
December 2017
November 2017
October 2017
September 2017
August 2017
July 2017
June 2017
May 2017
April 2017
March 2017
February 2017
January 2017
December 2016
November 2016
October 2016
September 2016
August 2016
July 2016
June 2016
May 2016
April 2016
March 2016
February 2016
January 2016
December 2015
November 2015
October 2015
September 2015
August 2015
July 2015
June 2015
May 2015
April 2015
March 2015
February 2015
January 2015
December 2014
November 2014
October 2014
September 2014
August 2014
July 2014
June 2014
May 2014
April 2014
March 2014
February 2014
January 2014
December 2013
November 2013
October 2013
September 2013
August 2013
July 2013
June 2013
May 2013
April 2013
March 2013
February 2013
January 2013
December 2012
November 2012
October 2012
September 2012
August 2012
July 2012
June 2012
May 2012
April 2012
March 2012
February 2012
January 2012
December 2011
November 2011
October 2011
September 2011
August 2011
July 2011
June 2011
May 2011
April 2011
March 2011
February 2011
January 2011
December 2010
November 2010
October 2010
September 2010
August 2010
July 2010
June 2010
May 2010
April 2010
March 2010
February 2010
January 2010
December 2009
November 2009
October 2009
September 2009
August 2009
July 2009
June 2009
May 2009
April 2009
March 2009
February 2009
January 2009
December 2008
November 2008
October 2008
September 2008
August 2008
July 2008
June 2008
May 2008
April 2008
March 2008
February 2008
January 2008
December 2007
November 2007
October 2007
September 2007
August 2007
July 2007
June 2007
May 2007
April 2007
March 2007
February 2007
January 2007
December 2006
November 2006
October 2006
September 2006
August 2006
July 2006
June 2006
May 2006
April 2006
March 2006
February 2006
January 2006
December 2005
November 2005
October 2005
September 2005
August 2005
July 2005
June 2005
May 2005
April 2005
March 2005
February 2005
January 2005
December 2004
November 2004
October 2004
September 2004
August 2004
July 2004
June 2004
May 2004
April 2004
March 2004
February 2004
January 2004
December 2003
November 2003
October 2003
September 2003
August 2003
July 2003
June 2003
May 2003
April 2003
March 2003
February 2003
January 2003
December 2002
November 2002
October 2002
September 2002
August 2002
July 2002
June 2002
May 2002
April 2002
March 2002
February 2002
January 2002
December 2001
November 2001
October 2001
September 2001
August 2001
July 2001
June 2001
May 2001
April 2001
March 2001
February 2001
January 2001
December 2000
November 2000
October 2000
September 2000
August 2000
July 2000
June 2000
May 2000
April 2000
March 2000
February 2000
January 2000
December 1999
November 1999
October 1999
September 1999
August 1999
July 1999
June 1999
May 1999
April 1999
March 1999
February 1999
January 1999
December 1998
November 1998
October 1998
September 1998
August 1998
July 1998
June 1998
May 1998
April 1998
March 1998
February 1998

ATOM RSS1 RSS2



LISTSERV.REDIRIS.ES

CataList Email List Search Powered by the LISTSERV Email List Manager