Estimado Emilio,

Choca un tanto que la primera afirmacion del texto de presentacion de un analisis tan concienzudo y valioso como el que ha llevado a cabo vuestro grupo sea tan discutible. La declaracion de que "existen evidencias empíricas que demuestran que el autoarchivo es actualmente el principal medio de materialización del acceso abierto" es --creo-- incorrecta a menos que se especifique que se refiere expresamente a America Latina. Es un argumento interesante éste sin embargo, sobre el que me permito aportar un par de reflexiones.

El autoarchivo entendido como el proceso por el cual un autor deposita una copia de su trabajo y de los metadatos asociados al mismo en un repositorio de acceso abierto es el modelo por defecto del acceso abierto, y en su momento, al comienzo del movimiento OA, fue mayoritario en todos los ambitos geograficos. A medida no obstante que se generalizaba la renuencia de los autores a copiar los metadatos de los trabajos en los formularios de archivo de los repositorios, la variante de archivo delegado por la cual un cual un servicio de apoyo (generalmente biblioteca) se ocupaba de la descripcion de los archivos de texto completo facilitados por el autor se fue haciendo cada vez mas habitual (y es de hecho muy probable que sea ya mayoritaria tambien en determinados paises de America Latina, algo que seria interesante averiguar).

El factor principal que ha alterado la metodologia predominante de deposito de trabajos en acceso abierto es sin embargo la integracion de los repositorios con los sistemas institucionales de gestion de la informacion cientifica o sistemas CRIS (tales como Universitas XXI o Sigma CRIS en España y muchos otros en otros paises), que hace que los metadatos no sean ya tampoco procesados por la biblioteca como servicio de apoyo al archivo de los autores, sino incorporados automaticamente mediante el intercambio de informacion entre sistemas. Como resultado de este proceso evolutivo, en paises como el Reino Unido, y crecientemente en España, la inmensa mayoria de los trabajos se archiva de manera automatica, con la biblioteca asegurandose tan solo de que el archivo de texto completo facilitado por el autor este de acuerdo con las politicas de copyright de los editores. Este mecanismo, aunque sigue perteneciendo a la llamada ruta verde, dudosamente podria ser calificado como autoarchivo.

En America Latina el indice de implantacion de estos sistemas CRIS es por el momento relativamente bajo, lo que resulta en una mucha mayor fuerza para el movimiento de acceso abierto basado en la alimentacion "directa" de repositorios (probablemente siguiendo un modelo mixto de autoarchivo puro y archivo delegado). A medida que el panorama vaya evolucionando, puede ser interesante examinar el impacto de la implantacion de procesos mas automatizados en los modelos de archivo de trabajos en acceso abierto, por mucho que la peculiar representacion de la produccion cientifica latinoamericana en las anglofilas bases de datos internacionales haga mas complejo adoptar mecanismos de ingestion automatica de referencias de publicaciones (con novedades como la indexacion de SciELO por WoS gradualmente evolucionando la situacion).

En este sentido el analisis de los factores que dificultan la visibilidad en la red de los trabajos disponibles en acceso abierto en los repositorios latinoamericanos es sumamente interesante, y cabe confiar que ayude a que se pongan los medios para mejorar la situacion. Entretanto es gratificante comprobar los niveles de visibilidad reales de los contenidos de los repositorios a traves de la informacion facilitada por los modulos de estadisticas de las propias plataformas, http://www.bibliotecadigital.unicamp.br/indicadores/index.php (incluso teniendo en cuenta que Unicamp es un outlier tal como se menciona en el trabajo). Una ampliacion de esta informacion estadistica al nivel del agregador de LA Referencia, http://www.lareferencia.info/vufind/, del estilo de la que se esta haciendo en otros ambitos geograficos podria ser de gran utilidad en este aspecto.


Un saludo,


Pablo

-----
Pablo de Castro
euroCRIS Board - Best Practice/DRIS Task Group Leader

ORCID Technical Steering Group member
http://orcid.org/0000-0001-6300-1033

GrandIR Ltd.
Company No. SC461215
http://www.grandir.com/en/
[log in para visualizar]



2014-06-25 12:57 GMT+01:00 Emilio Delgado López-Cózar <[log in para visualizar]>:
Existen evidencias empíricas que demuestran que el autoarchivo es actualmente el principal medio de materialización del acceso abierto (OA) al conocimiento científico, lo que convierte a los repositorios en una pieza clave para el mantenimiento de éste. Para asegurar que éstos cumplen adecuadamente su misión es fundamental conocer su presencia e impacto en la Web, especialmente en Google (motor de búsqueda por excelencia) y Google Scholar (herramienta cada vez más usada por los investigadores para buscar información científica).

Por ello, el objetivo de este mensaje es anunciaros algunas de nuestras últimas indagaciones sobre la visibilidad de los repositorios en Google y Google Scholar.  En nuestro boletín Google Scholar Digest (http://googlescholardigest.blogspot.com.es) nos hemos hecho eco de dos trabajos:

- La indización de los informes del Banco Mundial en los susodichos buscadores (http://googlescholardigest.blogspot.com.es/2014/06/world-banks-policy-reports-google-scholar.html)
- La cobertura, visibilidad e impacto web de 127 repositorios de Latinoamericanos (http://googlescholardigest.blogspot.com.es/2014/06/are-latin-americanrepositories.html)

Conseguir que los repositorios estén correctamente indizados para hacer visible la producción científica, académica e institucional es responsabilidad de todos. En estos trabajos se arroja algo de luz sobre los motivos por los que los buscadores academicos de Google no son capaces de indizar fielmente dichos documentos:

- Problemas en el propio robot de Google y de sus procedimientos para recuperar los documentos indizados
- Problemas en la arquitectura de los propios documentos o de los metadatos que los representen según las exigencies de GS: carecer de resumen, problemas la denominación de los ficheros (me refiero tanto al titulo como a las extensiones .pdf), documentos escaneados como imagen y no como OCR, excesivo tamaño de los ficheros (Documents larger than 5MB), etc…
- Problemas en la arquitecturas de los sitios web que contienen los documentos (repositories, publishers): direcciones, estructura de las páginas, control de accesos, etc...

En definitiva, nuestro objetivo último es poner encima todos estos problemas, concienciar a la comunidad y ayudar a que mejore la difusión y accesibilidad del conocimiento.

Un abrazo,
Emilio Delgado López-Cózar

----------------------------------------------------
Para darse de baja INCYT pincha y envia el siguiente url
mailto:INCYT-signoff-request@listserv.rediris.es
----------------------------------------------------

----------------------------------------------------
Si tiene algun problema con la utilizacion de la lista.
Pongase en contacto con nosotros a traves de:
[log in para visualizar]
----------------------------------------------------