Je n’ai jamais été fan de Google Scholar, cet outil destiné à rechercher des publications scientifiques. Il paraît que l’avantage de cette plateforme est qu’elle dispose de la base de données d’articles scientifiques la plus large. Il me semble, au contraire, que c’est là le problème. Je trouve que l’interface est abominable et qu’il est difficile de filtrer les résultats obtenus, de sorte que les résultats pertinents sont dilués dans la masse des publications provenant de divers domaines.
La base
Pour ma part, quand je cherche une information précise, ma base de recherche de prédilection est plutôt PubMed. J’utilise egalement parfois la plateforme francaise HAL, sur laquelle on peut retrouver notamment les theses soutenues en France.
Pour la veille, je garde un œil sur les plateformes de préprint bioRxiv, psyArXiv et medRxiv. D’ailleurs, je viens d’apprendre l’existence d’une plateforme de préprints rétractés de ces serveurs arXiv : withdrarXiv, une base de données dont l’objectif est de fournir des informations et des statistiques sur les raisons pour lesquelles ces préprints ont été rétractés :
Un article à ce propos dans Nature : Rao, D., Young, J., Dietterich, T., & Callison-Burch, C. (2024). WithdrarXiv: A Large-Scale Dataset for Retraction Study (arXiv:2412.03775). arXiv. https://doi.org/10.48550/arXiv.2412.03775
La base de données en question (qui est elle-même sous forme de préprint) : Singh Chawla, D. (2025). ‘WithdrarXiv’ database of 14,000 retracted preprints launches. Nature. https://doi.org/10.1038/d41586-025-00011-8
Les outils bases sur l’IA
Pour les 20 ans de Google Scholar, Nature a publié un article grand public sur… les outils basés sur l’IA qui pourraient remplacer Google Scholar. « S’il y a jamais eu un moment où Google Scholar pourrait être détrôné en tant que moteur de recherche principal, ce serait peut-être maintenant », y déclare Jevin West, spécialiste en sciences sociales computationnelles.
Mallapaty, S. (2024). Can Google Scholar survive the AI revolution? Nature, 635(8040), 797–798. https://doi.org/10.1038/d41586-024-03746-y
L’occasion de mettre à jour une liste des outils que vous et moi pouvons utiliser dans nos recherches bibliographiques ! J’utilise depuis un moment deja certains de ces outils. spécialisés qui s’appuient sur des LLM, tels que Elicit, Scite.ai (enfin, à l’époque où c’était gratuit…), ou encore Versa, qui est un outil interne à UCSF, basé sur ChatGPT, sécurisé en termes de confidentialité, et alimenté par de la littérature scientifique.
Mais j’ai découvert dans cet article l’existence de Consensus , un moteur de recherche base sur l’IA, ainsi que d’Undermind, qui se presente plutot comme un assistant de recherche. Je vais essayer dans les prochains jours.
Un LLM spécifique aux neurosciences
Enfin, voici un petit cadeau bonus pour les chercheuses et chercheurs en neurosciences : je vous présente BrainGPT.org ! Il s’agit d’un modèle génératif qui va encore un peu plus loin dans le processus, puisqu’il a pour objectif de synthétiser les données issues de la littérature neuroscientifique. Il permet de proposer des conceptions d’études et de générer des schémas de données probables, afin de faciliter l’évaluation des modèles et l’identification de résultats atypiques. Je n’en sais pas beaucoup plus pour le moment, mais je me suis inscrite pour tester l’outil. J’attends cela avec impatience !
Luo, X., Rechardt, A., Sun, G., Nejad, K. K., Yáñez, F., Yilmaz, B., Lee, K., Cohen, A. O., Borghesani, V., Pashkov, A., Marinazzo, D., Nicholas, J., Salatiello, A., Sucholutsky, I., Minervini, P., Razavi, S., Rocca, R., Yusifov, E., Okalova, T., … Love, B. C. (2024). Large language models surpass human experts in predicting neuroscience results. Nature Human Behaviour, 1–11. https://doi.org/10.1038/s41562-024-02046-9
Et vous, quels sont vos outils préférés ? Avez-vous d'autres recommandations ? Partagez-les en commentaire, je serais ravie de découvrir vos suggestions !
Comments