@DamienPetermann J’ai assisté hier à la présentation de BiblioRef lors des journées Abes, bravo pour ce gros boulot. Hâte de voir les briques open source que vous allez partager !
@enroweb Merci ! On est actuellement en train de finaliser le connecteur Sudoc et la documentation + partage dans un Git de plusieurs briques open source devrait pouvoir avoir lieu bientôt :)
@DamienPetermann Trop bien ! Si j’ai bien compris HAL et le Sudoc sont interrogés sur la base de l’IdRef… et OpenAlex ? Et comment vous avez fait pour avoir 100% de couverture pour IdRef ?
@enroweb Alors HAL est interrogé sur 3 identifiants : IdHAL, IdRef et ORCID. Si l'un de ces 3 ID est présent dans la notice AuréHAL de la personne, alors on récupère les publications liées. En revanche, si ce n'est pas le cas, on ne récupère rien. Et si certaines publis ne sont pas rattachés à ce profil AuréHAL, on ne les récupère pas (donc avec les collègues, on essaie de corriger ça : gros chantier de fusion de formes auteurs et de rattachement de publications aux bons profils).
Dans notre référentiel auteurs Lyon 3, j'ai ajouté les ID connus pour chacune des personnes. La difficulté, c'est la mise à jour des infos, ça nécessite de vérifier la création des nouveaux IdHAL/ORCID.
@enroweb pour OpenAlex, notre connecteur est fonctionnel mais le problème vient de la (très) mauvaise qualité des données d'affiliation et profil auteur dans OpenAlex. J'ai dû vérifier les formes auteurs de nos auteurs Lyon 3 dans OpenAlex, et au final j'ai validé seulement 10 % des profils (environ 150) pour lesquels on récupère les publications via leur OpenAlex Author ID.
Pour les autres, on préfère la prudence, donc on ne récupère rien via OpenAlex, car il y a trop d'erreurs et notamment des fusions de plusieurs personnes en un seul profil OpenAlex (homonymes mais pas seulement, donc grosse galère). Parfois, c'est le bon ORCID mais d'autres publis d'autres chercheurs sont présentes dans le profil...
Notre credo c'est : on préfère récupérer moins mais des données correctes et propres, plutôt que de récupérer trop large et de devoir désactiver des références dans BiblioRef (on peut le faire, je l'ai déjà fait pour des homonymes, mais c'est trop chronophage).
@DamienPetermann Merci pour ces explications, c’est très clair !
@enroweb je n'étais pas encore en poste mais il y a eu une volonté de la présidence de Lyon 3 à l'époque de disposer d'un outil de pilotage de la recherche/cartographie de la production scientifique. Ce sont la BU et la direction de la recherche qui ont porté le projet, mais il a débuté avec comme objectif d'utiliser l'outil Bibliolabs de Paris-Saclay qui était alors en cours d'évolution vers une v2. Pour diverses raisons, notamment des contraintes de calendrier, Lyon 3 a fait le choix de créer son propre outil, BiblioRef, à partir du printemps 2023. Nous avons un prestataire développeur, qui a tout redéveloppé (cœur, connecteurs, fonctionnalités) en fonction de nos besoins, et l'outil continue d'évoluer.
La première année du projet (mon contrat d'IGE contractuel + le développement externalisé) ont été financés par un dialogue de gestion via le rectorat, puis on a obtenu, à la suite d'un appel à projet, un financement Abes pour développer un connecteur avec l'un de ses services (c'est donc le Sudoc au final, après plusieurs pistes ).
@DamienPetermann Ah si, j’ai une autre question. Peux-tu me dire s’il y avait une volonté voire une commande politique à l’origine du projet ?