INCYT Archivos

Indicadores en Ciencia y Tecnologia

INCYT@LISTSERV.REDIRIS.ES

Opciones: Vista Forum

Use Monospaced Font
Por defecto enseñar Text Part
Mostrar todas las cabeceras de correo

Mensaje: [<< Primero] [< Prev] [Siguiente >] [Último >>]
Tema: [<< Primero] [< Prev] [Siguiente >] [Último >>]
Autor: [<< Primero] [< Prev] [Siguiente >] [Último >>]

Print Responder
Subject:
Emisor:
Isabel Bernal <[log in para visualizar]>
Reply To:
Indicadores en Ciencia y Tecnologia <[log in para visualizar]>
Fecha:
Fri, 27 Jun 2014 08:49:36 +0200
Content-Type:
text/plain
Parts/Attachments:
text/plain (366 lines)
Buenos días,

Siguiendo el interesante debate y recogiendo el guante de Emilio, desde DIGITAL.CSIC pensamos que los "problemas", las irregularidades y/o la lentitud de indización, con las consecuencias que todo ello tiene para la visibilidad de los contenidos de los repositorios, se dan fundamentalmente en Google Scholar, no tanto en Google. En nuestra memoria anual 2013, a punto de ser difundida, abordamos este asunto con más datos.  

Un cordial saludo

Isabel


Isabel Bernal Martínez
Oficina Técnica de DIGITAL.CSIC
Unidad de Recursos de Información Científica para la Investigación - Unit of Information Resources for Research
Consejo Superior de Investigaciones Científicas-Spanish National Research Council
C/Joaquín Costa 22; Desp. 308
28002 MADRID
ESPAÑA-SPAIN
Telf. 34-91-5681667; Ext. Interna 991667
Fax: 91 568 16 81
e-mail: [log in para visualizar]
http://bibliotecas.csic.es
http://digital.csic.es 
@DigitalCSIC 




 

-----Mensaje original-----
De: Indicadores en Ciencia y Tecnologia [mailto:[log in para visualizar]] En nombre de Emilio Delgado López-Cózar
Enviado el: jueves, 26 de junio de 2014 19:41
Para: [log in para visualizar]
Asunto: Re: [INCYT] Los repositorios en Google y Google Scholar

Estimados Pablo y Alicia, muchísimas gracias por vuestros juiciosos a la vez que incisivos comentarios sobre el tema. Por una vez me alegro que mis obligaciones docentes (toda la mañana la he tenido ocupada con un curso a los doctorandos de experimentales de la UGR) me hayan hecho llegar tarde a la pequeña controversia desatada. Y lo digo porque todo ha quedado aclarado, y sin que haya tenido que intervenir: ¡qué maravilla! Alicia, a la que a partir de ahora voy a convertir en mi hermeneuta, no sólo ha leído mi pensamiento sino que lo ha expresado mucho mejor que yo pudiera hacerlo. Suscribo desde la A a la Z todo tu mensaje; y digo TODO.

Además, ha surtido efecto, ya que Pablo recogió el guante exclamando “Estoy seguro de que el texto se refería a la ruta verde y no al autoarchivo como tal (que son conceptos distintos, estaras conmigo)”. En cualquier caso, Pablo te agradezco la sugerencia y repasaremos el paper y el digest por si habíamos incurrido en este sutil desliz terminológico.

Dudo de ello ya que el paper arranca con esta declaración “Since repositories are a key tool in making scholarly knowledge open access (OA)” y en el “digest” que hemos hecho del mismo no encuentro ninguna frase que aluda a este tema. Aquí, lo que afirmamos simplemente es que los repositorios son una “herramienta clave” para materializar el OA. Y me da igual quien los alimente: los propios autores, los bibliotecarios o los robots que prolongan la mano del bibliotecario. Creo que esto lo puede suscribir cualquiera.

Desde luego cuando empleé el término autoarchivo no me estaba refiriendo al “proceso por el cual un autor deposita una copia de su trabajo y de los metadatos asociados al mismo en un repositorio de acceso abierto”, que es la definición canónica de este vocablo. Por tu prolija descripción de lo que es el autoarchivo, de lo que son sus derivadas,  y en lo que se está o puede transformar estoy seguro  que puedes pontificar con mucho tino; desde luego mucho más que yo: me rindo.

Ahora bien, cuando hablo de autoarchivo me refiero:

- Al científico que deposita de forma directa o mediante persona interpuesta (otro colega o personal allegado) un documento en su web personal o institucional (grupo, departamento, facultad, instituto….).  
Que yo sepa esta vía no está cifrada, pero no debe ser insignificante (recomiendo la lectura de este reciente trabajo de Isidro “Successful Researchers Publicizing Research Online: An Outlink Analysis of European Highly Cited Scientists’ Personal Websites”.
- Al científico que deposita de forma directa en un repositorio institucional o temático.
- Al bibliotecario o al robot que lo representa y que deposita los documentos generados por el personal adscrito a su institución (repositorios institucionales) o por los científicos adscritos a un campo científico (temático), una deriva lógica del autoarchivo y una nueva-vieja función de la biblioteca que justifica su papel como memoria de la comunidad a la que representa y en la que se sustenta.

En definitiva, la ruta verde… a esa me refería. Y para verificar que “Existen evidencias empíricas que demuestran que la ruta verde es actualmente el principal medio de materialización del acceso abierto
(OA) al conocimiento científico”, recomiendo la lectura de las diapositivas 4-8 y 13 de esta conferencia que dicté en Valencia en octubre pasado (http://hdl.handle.net/10481/28569).

Pero, tras estas disquisiciones, vamos a lo que realmente importa de nuestro trabajo y que han resaltado atinadamente vuestros comentarios:
La deficiente visibilidad de los repositorios en Google/GS, algo que ya examinó en mucho detalle el artículo de Arlitsch y O'Brien en 2012 en 21 repositorios enclavados en USA. Ahora se analizan 127 repositorios de 13 países latinoamericanos. Desgraciadamente a la luz de los resultados, parece que avanzamos poco; lo peor: nos tropezamos con los mismos problemas. ¿Será el famoso gap?

La insondable política de indexación, búsqueda y recuperación  de información practicada por Google y Google Scholar, un arcano que nuestro grupo se ha propuesto descifrar. No sé si moriremos en el intento, pero creo que modestamente estamos contribuyendo a desvelar las fortalezas y debilidades de este nuevo “ojo orwelliano”. El tema es más que relevante: los datos que nos proporciona Alicia hablan por sí solos: 
más del 80% de descargas se hacen a través de Google.

Aprovecho el mensaje para hacer un llamamiento a los responsables de otros repositorios: ¿ocurre lo mismo en vuestro repositorio que en la UNED? ¿cuáles son vuestros datos de tráfico con G o GS? ¿son la puerta de entrada a vuestra morada?

Y concluyo parafraseando a Alicia: SER y ESTAR, la mano invisible que todo lo mueve: la biblioteca real o virtual. Me da lo mismo como sea: lo que me interesa es el rábano no las hojas.

Un abrazo y gracias,
Emilio


El 2014-06-26 14:06, Pablo de Castro escribió:
> Buenos dias Alicia,
>
> Estoy seguro de que el texto se referia a la ruta verde y no al 
> autoarchivo como tal (que son conceptos distintos, estaras conmigo), 
> pero seria de agradecer una mayor precision en ese punto en linea con 
> una redaccion por lo demas impoluta. En relacion con el debate sobre 
> si los repositorios son o no la principal fuente de acceso abierto, 
> comparto tus dudas, sobre todo en ambitos donde las plataformas de 
> revistas OA tipo SciELO o PLoS son muy relevantes.
>
> El aspecto novedoso del articulo no esta tanto en el analisis de la 
> deficiente visibilidad de los repositorios en Google/GS, algo que ya 
> examinó en mucho detalle el articulo (citado en la bibliografia) de 
> Arlitsch y OBrien en 2012,
> http://dx.doi.org/10.1108/07378831211213210
> [11], sino en la aplicacion de este analisis a los repositorios 
> latinoamericanos. No es muy estimulante el hecho de que no parezca 
> haberse avanzado gran cosa desde que se publico el trabajo citado 
> (fecha de recepcion Oct 2011 tal como figura en el paper). Tal como se 
> mencionó en los debates en su momento, es probable que los 
> repositorios necesiten abordar estrategias especificas orientadas a 
> mejorar su visibilidad en los buscadores, y que el modo de garantizar 
> la efectividad de estas estrategias sea trabajar desde una agregacion 
> de contenidos full-text, no desde cada plataforma particular.
>
> Sera interesante seguir la evolucion de esta linea de trabajo y ver si 
> desde Latinoamerica surge alguna aproximacion novedosa al tema.
>
> Un abrazo,
> Pablo
>
> 2014-06-26 11:54 GMT+01:00 Alicia López Medina <[log in para visualizar]
> [12]>:
>
>> Buenos días.
>>
>> Me permito contribuir a esta interesante "charla" con algunos
>> comentarios:
>>
>> - Pablo, yo creo que cuando Emilio utiliza el término "autoarchivo" 
>> no es en un sentido tan literal, como el procedimiento de depósito 
>> del documento y metadatos en el repositorio, sino en el sentido más 
>> amplio de "autoarchivo"= vía verde= repositorios de acceso abierto. 
>> Es decir, creo que en el sentido en que Emilio plantea la cuestión el 
>> hecho de que los documentos se hayan depositado en el repositorio por 
>> parte del autor, de forma delegada, o automáticamente a través de un 
>> CRIS, es irrelevante. Lo que creo que Emilio quiere poner de 
>> manifiesto es el papel relevante de los repositorios como vehículo 
>> principal de la materialización del acceso abierto. En este sentido, 
>> quizás no estoy tan segura respecto a que sean ese principal medio 
>> del OA, dado que los estudios en general reflejan que los 
>> repositorios representan un % bastante bajo de la producción 
>> científica en el mundo. Pero eso ya sería otra cuestión. Sí creo que 
>> su visibilidad en Google contribuiría a hacer de los repositorios una 
>> infraestructura más útil para los investigadores.
>>
>> - El punto central, entiendo, planteado por Emilio es resaltar que la 
>> visibilidad de los contenidos de los repositorios en Google es vital 
>> para que estos cumplan de forma relevante su función de difusión de 
>> los resultados científicos en OA. Y en ese sentido estoy 
>> completamente de acuerdo, porque lo queramos o no,  se busca a través 
>> de Google. Si no estás visible en Google es casi como si no 
>> existieras. Y es verdaderamente un handicap para los repositorios el 
>> hecho de que Google no nos indice bien (es decir, todos nuestros 
>> contenidos). Análisis como los de Emilio se agradecen y resultan muy 
>> útiles para los repositorios.
>>
>> - Respecto a las estadísticas que ofrecen las plataformas de los 
>> repositorios, precisamente ponen de manifiesto que el porcentaje 
>> mayor de accesos viene a través de Google (en nuestro caso, más del 
>> 80% de descargas se hacen a través de Google). Las estadísticas no 
>> dan visibilidad, la miden. Y lo mismo se aplica a las estadísticas 
>> que puedan ofrecer los agregadores de repositorios.
>>
>> - En mi opinión, los repositorios tienen no sólo que ESTAR en la web 
>> (ser accesibles a buscadores web) sino cada vez más SER de la web y 
>> me refiero a convertirse en datos enlazados en los que realmente el 
>> repositorio desaparece como tal, se hace invisible, para convertirse 
>> en un expositor de URI´s enlazadas en la web semántica. Pero eso ya 
>> es otra historia.
>>
>> un abrazo,
>> alicia
>>
>> Alicia López Medina
>> Coordinadora del Área de Servicios Digitales Biblioteca. UNED
>>
>> El 26/06/2014 9:29, Pablo de Castro escribió:
>>
>>> Estimado Emilio,
>>>
>>> Choca un tanto que la primera afirmacion del texto de presentacion 
>>> de un analisis tan concienzudo y valioso como el que ha llevado a 
>>> cabo vuestro grupo sea tan discutible. La declaracion de que 
>>> "existen evidencias empíricas que demuestran que el autoarchivo es 
>>> actualmente el principal medio de materialización del acceso 
>>> abierto" es --creo-- incorrecta a menos que se especifique que se 
>>> refiere expresamente a America Latina. Es un argumento interesante 
>>> éste sin embargo, sobre el que me permito aportar un par de 
>>> reflexiones.
>>>
>>> El autoarchivo entendido como el proceso por el cual un autor 
>>> deposita una copia de su trabajo y de los metadatos asociados al 
>>> mismo en un repositorio de acceso abierto es el modelo por defecto 
>>> del acceso abierto, y en su momento, al comienzo del movimiento OA, 
>>> fue mayoritario en todos los ambitos geograficos. A medida no 
>>> obstante que se generalizaba la renuencia de los autores a copiar 
>>> los metadatos de los trabajos en los formularios de archivo de los 
>>> repositorios, la variante de archivo delegado por la cual un cual un 
>>> servicio de apoyo (generalmente biblioteca) se ocupaba de la 
>>> descripcion de los archivos de texto completo facilitados por el 
>>> autor se fue haciendo cada vez mas habitual (y es de hecho muy 
>>> probable que sea ya mayoritaria tambien en determinados paises de 
>>> America Latina, algo que seria interesante averiguar).
>>>
>>> El factor principal que ha alterado la metodologia predominante de 
>>> deposito de trabajos en acceso abierto es sin embargo la integracion 
>>> de los repositorios con los sistemas institucionales de gestion de 
>>> la informacion cientifica o sistemas CRIS (tales como Universitas 
>>> XXI o Sigma CRIS en España y muchos otros en otros paises), que hace 
>>> que los metadatos no sean ya tampoco procesados por la biblioteca 
>>> como servicio de apoyo al archivo de los autores, sino incorporados 
>>> automaticamente mediante el intercambio de informacion entre 
>>> sistemas. Como resultado de este proceso evolutivo, en paises como 
>>> el Reino Unido, y crecientemente en España, la inmensa mayoria de 
>>> los trabajos se archiva de manera automatica, con la biblioteca 
>>> asegurandose tan solo de que el archivo de texto completo facilitado 
>>> por el autor este de acuerdo con las politicas de copyright de los 
>>> editores. Este mecanismo, aunque sigue perteneciendo a la llamada 
>>> ruta verde, dudosamente podria ser calificado como autoarchivo.
>>>
>>> En America Latina el indice de implantacion de estos sistemas CRIS 
>>> es por el momento relativamente bajo, lo que resulta en una mucha 
>>> mayor fuerza para el movimiento de acceso abierto basado en la 
>>> alimentacion "directa" de repositorios (probablemente siguiendo un 
>>> modelo mixto de autoarchivo puro y archivo delegado). A medida que 
>>> el panorama vaya evolucionando, puede ser interesante examinar el 
>>> impacto de la implantacion de procesos mas automatizados en los 
>>> modelos de archivo de trabajos en acceso abierto, por mucho que la 
>>> peculiar representacion de la produccion cientifica latinoamericana 
>>> en las anglofilas bases de datos internacionales haga mas complejo 
>>> adoptar mecanismos de ingestion automatica de referencias de 
>>> publicaciones (con novedades como la indexacion de SciELO por WoS 
>>> gradualmente evolucionando la situacion).
>>>
>>> En este sentido el analisis de los factores que dificultan la 
>>> visibilidad en la red de los trabajos disponibles en acceso abierto 
>>> en los repositorios latinoamericanos es sumamente interesante, y 
>>> cabe confiar que ayude a que se pongan los medios para mejorar la 
>>> situacion. Entretanto es gratificante comprobar los niveles de 
>>> visibilidad reales de los contenidos de los repositorios a traves de 
>>> la informacion facilitada por los modulos de estadisticas de las 
>>> propias plataformas, 
>>> http://www.bibliotecadigital.unicamp.br/indicadores/index.php [5] 
>>> (incluso teniendo en cuenta que Unicamp es un outlier tal como se 
>>> menciona en el trabajo). Una ampliacion de esta informacion 
>>> estadistica al nivel del agregador de LA Referencia, 
>>> http://www.lareferencia.info/vufind/ [6], del estilo de la que se 
>>> esta haciendo en otros ambitos geograficos podria ser de gran 
>>> utilidad en este aspecto.
>>>
>>> Un saludo,
>>>
>>> Pablo
>>>
>>> -----
>>> Pablo de Castro
>>> euroCRIS Board - Best Practice/DRIS Task Group Leader
>>>
>>> ORCID Technical Steering Group member
>>> http://orcid.org/0000-0001-6300-1033 [7]
>>>
>>> GrandIR Ltd.
>>> Company No. SC461215
>>>
>>> http://www.grandir.com/en/ [8]
>>>
>>> [log in para visualizar] [9]
>>>
>>> 2014-06-25 12:57 GMT+01:00 Emilio Delgado López-Cózar 
>>> <[log in para visualizar] [10]>:
>>>
>>>> Existen evidencias empíricas que demuestran que el autoarchivo es 
>>>> actualmente el principal medio de materialización del acceso 
>>>> abierto (OA) al conocimiento científico, lo que convierte a los 
>>>> repositorios en una pieza clave para el mantenimiento de éste.
>>>> Para asegurar que éstos cumplen adecuadamente su misión es 
>>>> fundamental conocer su presencia e impacto en la Web, especialmente 
>>>> en Google (motor de búsqueda por excelencia) y Google Scholar 
>>>> (herramienta cada vez más usada por los investigadores para buscar 
>>>> información científica).
>>>>
>>>> Por ello, el objetivo de este mensaje es anunciaros algunas de 
>>>> nuestras últimas indagaciones sobre la visibilidad de los 
>>>> repositorios en Google y Google Scholar.  En nuestro boletín Google 
>>>> Scholar Digest (http://googlescholardigest.blogspot.com.es [1]) nos 
>>>> hemos hecho eco de dos trabajos:
>>>>
>>>> - La indización de los informes del Banco Mundial en los susodichos 
>>>> buscadores
>>>>
>>>
>>
> 
> (http://googlescholardigest.blogspot.com.es/2014/06/world-banks-policy
> -reports-google-scholar.html
>>>> [2])
>>>> - La cobertura, visibilidad e impacto web de 127 repositorios de 
>>>> Latinoamericanos
>>>>
>>>
>>
> 
> (http://googlescholardigest.blogspot.com.es/2014/06/are-latin-american
> repositories.html
>>>> [3])
>>>>
>>>> Conseguir que los repositorios estén correctamente indizados para 
>>>> hacer visible la producción científica, académica e institucional 
>>>> es responsabilidad de todos. En estos trabajos se arroja algo de 
>>>> luz sobre los motivos por los que los buscadores academicos de 
>>>> Google no son capaces de indizar fielmente dichos
>>>> documentos:
>>>>
>>>> - Problemas en el propio robot de Google y de sus procedimientos 
>>>> para recuperar los documentos indizados
>>>> - Problemas en la arquitectura de los propios documentos o de los 
>>>> metadatos que los representen según las exigencies de GS:
>>>> carecer de resumen, problemas la denominación de los ficheros (me 
>>>> refiero tanto al titulo como a las extensiones .pdf), documentos 
>>>> escaneados como imagen y no como OCR, excesivo tamaño de los 
>>>> ficheros (Documents larger than 5MB), etc…
>>>> - Problemas en la arquitecturas de los sitios web que contienen los 
>>>> documentos (repositories, publishers): direcciones, estructura de 
>>>> las páginas, control de accesos, etc...
>>>>
>>>> En definitiva, nuestro objetivo último es poner encima todos estos 
>>>> problemas, concienciar a la comunidad y ayudar a que mejore la 
>>>> difusión y accesibilidad del conocimiento.
>>>>
>>>> Un abrazo,
>>>> Emilio Delgado López-Cózar
>>>>
>>>> ----------------------------------------------------
>>>> Para darse de baja INCYT pincha y envia el siguiente url 
>>>> mailto:[log in para visualizar] [4]
>>>> ----------------------------------------------------
>>>
>>> ----------------------------------------------------
>>> Si tiene algun problema con la utilizacion de la lista.
>>> Pongase en contacto con nosotros a traves de:
>>> [log in para visualizar]
>>> ----------------------------------------------------
>>
>> ----------------------------------------------------
>> Si tiene algun problema con la utilizacion de la lista.
>> Pongase en contacto con nosotros a traves de:
>> [log in para visualizar]
>> ----------------------------------------------------
>
> ----------------------------------------------------
> Si tiene algun problema con la utilizacion de la lista.
> Pongase en contacto con nosotros a traves de:
> [log in para visualizar]
> ----------------------------------------------------
>
>
>
> Links:
> ------
> [1] http://googlescholardigest.blogspot.com.es
> [2]
> 
> http://googlescholardigest.blogspot.com.es/2014/06/world-banks-policy-
> reports-google-scholar.html
> [3]
> 
> http://googlescholardigest.blogspot.com.es/2014/06/are-latin-americanr
> epositories.html [4] mailto:[log in para visualizar]
> [5] http://www.bibliotecadigital.unicamp.br/indicadores/index.php
> [6] http://www.lareferencia.info/vufind/
> [7] http://orcid.org/0000-0001-6300-1033
> [8] http://www.grandir.com/en/
> [9] mailto:[log in para visualizar]
> [10] mailto:[log in para visualizar]
> [11] http://dx.doi.org/10.1108/07378831211213210
> [12] mailto:[log in para visualizar]

----------------------------------------------------
Si tiene algun problema con la utilizacion de la lista.
Pongase en contacto con nosotros a traves de:
[log in para visualizar]
----------------------------------------------------

----------------------------------------------------
Los artículos de INCYT son distribuidos gracias al apoyo y colaboración 
técnica de RedIRIS - Red Académica española - (http://www.rediris.es)
------------------------------------------------------

ATOM RSS1 RSS2