Queridos compañeros,

En primer lugar, al igual que hiciera Emilio, quisiera comenzar dando las gracias a todas las personas que han intervenido, generando este interesante hilo argumental en torno a la visibilidad de los repositorios en los motores de búsqueda, en especial Google y Google Scholar. Todos los comentarios, aclaraciones terminológicas y discusiones en torno a este punto nos permiten seguir aprendiendo.

En cuanto a la presencia de los metadatos en Google, no puedo estar más de acuerdo con las palabras de Xavier, más cuando Google Scholar nos dice claramente que no le gusta Dublin Core. Mi pregunta aquí es clara aunque dura:

Si Google Scholar, primer buscador de información científica del mundo en la actualidad (in crescendo), nos dice claramente que no trabaja bien con Dublin Core, ¿por qué la inmensa mayoría de repositorios ofrecen los metadatos sólo en Dublin Core? 

Además, seamos claros, ¿cuántas personas entran en un repositorio a realizar búsquedas? La gente entra en Google Scholar (o simplemente en Google), hace una búsqueda y, entre los resultados obtenidos, pulsa en uno que quizás le lleve a los metadatos ofrecidos por un repositorio, o incluso acceda al texto completo directamente sin pasar siquiera por el repositorio. Por tanto, si no apareces en los resultados del buscador, las probabilidades de que te visiten se tornan remotas. Y parto de que el propósito de un repositorio es que los productos que ofrece sean consumidos.

Por otro lado, en cuanto al texto completo, nuestro trabajo confirma las palabras de Isabel (por cierto, esperamos la memoria anual 2013 con ganas). De hecho, la búsqueda con mejores resultados obtenidos es aquella realizada en Google, filtrando resultados en PDF. La razón principal: los 5M de tamaño máximo restringidos por Google Scholar, que Jorge Serrano nos recordaba en su mensaje (y que Google también nos dice claramente). Por tanto, veamos cuántos documentos cargados en los repositorios incumplen este requisito olvidado, y comprendamos por qué ciertos recursos están en Google, y no están en Google Scholar.

Esperamos haber aportado información de interés a este debate. Mientras, seguiremos tratando de descifrar las entrañas de Google Scholar y derivados.

Buen fin de semana!



Enrique Orduña
EC3 Research Group. Universidad Politécnica de Valencia (UPV).


----------------------------------------------------
Los artículos de INCYT son distribuidos gracias al apoyo y colaboración 
técnica de RedIRIS - Red Académica española - (http://www.rediris.es)
------------------------------------------------------