Queridos compañeros,

En primer lugar, al igual que hiciera Emilio, quisiera comenzar dando las
gracias a todas las personas que han intervenido, generando este
interesante hilo argumental en torno a la visibilidad de los repositorios
en los motores de búsqueda, en especial Google y Google Scholar. Todos los
comentarios, aclaraciones terminológicas y discusiones en torno a este
punto nos permiten seguir aprendiendo.

En cuanto a la presencia de los metadatos en Google, no puedo estar más de
acuerdo con las palabras de Xavier, más cuando Google Scholar nos dice
claramente que no le gusta Dublin Core. Mi pregunta aquí es clara aunque
dura:

Si Google Scholar, primer buscador de información científica del mundo en
la actualidad (in crescendo), nos dice claramente que no trabaja bien con
Dublin Core, ¿por qué la inmensa mayoría de repositorios ofrecen los
metadatos sólo en Dublin Core?

Además, seamos claros, ¿cuántas personas entran en un repositorio a
realizar búsquedas? La gente entra en Google Scholar (o simplemente en
Google), hace una búsqueda y, entre los resultados obtenidos, pulsa en uno
que quizás le lleve a los metadatos ofrecidos por un repositorio, o incluso
acceda al texto completo directamente sin pasar siquiera por el
repositorio. Por tanto, si no apareces en los resultados del buscador, las
probabilidades de que te visiten se tornan remotas. Y parto de que el
propósito de un repositorio es que los productos que ofrece sean consumidos.

Por otro lado, en cuanto al texto completo, nuestro trabajo confirma las
palabras de Isabel (por cierto, esperamos la memoria anual 2013 con ganas).
De hecho, la búsqueda con mejores resultados obtenidos es aquella realizada
en Google, filtrando resultados en PDF. La razón principal: los 5M de
tamaño máximo restringidos por Google Scholar, que Jorge Serrano nos
recordaba en su mensaje (y que Google también nos dice claramente). Por
tanto, veamos cuántos documentos cargados en los repositorios incumplen
este requisito olvidado, y comprendamos por qué ciertos recursos están en
Google, y no están en Google Scholar.

Esperamos haber aportado información de interés a este debate. Mientras,
seguiremos tratando de descifrar las entrañas de Google Scholar y derivados.

Buen fin de semana!



Enrique Orduña
EC3 Research Group. Universidad Politécnica de Valencia (UPV).


----------------------------------------------------
Los artículos de INCYT son distribuidos gracias al apoyo y colaboración 
técnica de RedIRIS - Red Académica española - (http://www.rediris.es)
------------------------------------------------------