Follow

@DamienPetermann J’ai assisté hier à la présentation de BiblioRef lors des journées Abes, bravo pour ce gros boulot. Hâte de voir les briques open source que vous allez partager !

@enroweb Merci ! On est actuellement en train de finaliser le connecteur Sudoc et la documentation + partage dans un Git de plusieurs briques open source devrait pouvoir avoir lieu bientôt :)

@DamienPetermann Trop bien ! Si j’ai bien compris HAL et le Sudoc sont interrogés sur la base de l’IdRef… et OpenAlex ? Et comment vous avez fait pour avoir 100% de couverture pour IdRef ?

@enroweb Alors HAL est interrogé sur 3 identifiants : IdHAL, IdRef et ORCID. Si l'un de ces 3 ID est présent dans la notice AuréHAL de la personne, alors on récupère les publications liées. En revanche, si ce n'est pas le cas, on ne récupère rien. Et si certaines publis ne sont pas rattachés à ce profil AuréHAL, on ne les récupère pas (donc avec les collègues, on essaie de corriger ça : gros chantier de fusion de formes auteurs et de rattachement de publications aux bons profils).

Dans notre référentiel auteurs Lyon 3, j'ai ajouté les ID connus pour chacune des personnes. La difficulté, c'est la mise à jour des infos, ça nécessite de vérifier la création des nouveaux IdHAL/ORCID.

@enroweb pour OpenAlex, notre connecteur est fonctionnel mais le problème vient de la (très) mauvaise qualité des données d'affiliation et profil auteur dans OpenAlex. J'ai dû vérifier les formes auteurs de nos auteurs Lyon 3 dans OpenAlex, et au final j'ai validé seulement 10 % des profils (environ 150) pour lesquels on récupère les publications via leur OpenAlex Author ID.

Pour les autres, on préfère la prudence, donc on ne récupère rien via OpenAlex, car il y a trop d'erreurs et notamment des fusions de plusieurs personnes en un seul profil OpenAlex (homonymes mais pas seulement, donc grosse galère). Parfois, c'est le bon ORCID mais d'autres publis d'autres chercheurs sont présentes dans le profil...

Notre credo c'est : on préfère récupérer moins mais des données correctes et propres, plutôt que de récupérer trop large et de devoir désactiver des références dans BiblioRef (on peut le faire, je l'ai déjà fait pour des homonymes, mais c'est trop chronophage).

@enroweb et pour les IdRef, on est à 99% de couverture, pas 100 %. Et plus on intègre de doctorants, plus ça va faire baisser le taux de couverture car ils n'ont pas encore d'IdRef.

Mais BiblioRef nous sert de plus en plus pour gérer des effectifs par labo donc la direction de la recherche souhaitent que les doctorants soient présents dans le référentiel, là où au départ notre choix c'était de ne prendre que ceux qui ont un IdRef.

Sans ID, on ne peut rien récupérer via les sources pour ces personnes (pour l'instant).

Après, on incite les doctorants à se créer un IdHAL et un ORCID, mais ça comme partout, ça marche plus ou moins.

@DamienPetermann Ah si, j’ai une autre question. Peux-tu me dire s’il y avait une volonté voire une commande politique à l’origine du projet ?

@enroweb je n'étais pas encore en poste mais il y a eu une volonté de la présidence de Lyon 3 à l'époque de disposer d'un outil de pilotage de la recherche/cartographie de la production scientifique. Ce sont la BU et la direction de la recherche qui ont porté le projet, mais il a débuté avec comme objectif d'utiliser l'outil Bibliolabs de Paris-Saclay qui était alors en cours d'évolution vers une v2. Pour diverses raisons, notamment des contraintes de calendrier, Lyon 3 a fait le choix de créer son propre outil, BiblioRef, à partir du printemps 2023. Nous avons un prestataire développeur, qui a tout redéveloppé (cœur, connecteurs, fonctionnalités) en fonction de nos besoins, et l'outil continue d'évoluer.

La première année du projet (mon contrat d'IGE contractuel + le développement externalisé) ont été financés par un dialogue de gestion via le rectorat, puis on a obtenu, à la suite d'un appel à projet, un financement Abes pour développer un connecteur avec l'un de ses services (c'est donc le Sudoc au final, après plusieurs pistes ).

@DamienPetermann @enroweb Je m'incruste dans la discussion, j'espère que vous ne m'en voudrez pas :)

On parle bien ici de pouvoir rappatrier des textes/docs qui sont detectés par IDREF sur d'autres plateforme au sein de HAL ?

Je travaille avec des auteurs/autrices avec IDRef (type Colette Cauvin par ex.) qui dispose de plus de contenu sur Persée que sur HAL, donc je suis hautement intéressé par une telle brique logicielle permettant le versement de l'un vers l'autre. Jusqu'à présent côté HAL on m'indiquait que ce n'était pas possible.

cc @RaphaelleK

@SReyCoyrehourcq @enroweb @RaphaelleK Bonjour, l'outil BiblioRef qu'on développe depuis 2 ans à la BU Lyon 3 sert à récupérer et centraliser les références des publications provenant de HAL et OpenAlex (et bientôt du Sudoc, via un 3e connecteur, qui passe par data.idref donc avec l'IdRef des personnes).

Nous n'avons pas développé de connecteur pour Persée car ce n'était pas une source prioritaire (il y a surtout des publications anciennes sur Persée, et notre période prise en compte est 2014-aujourd'hui). Mais les publications présentes dans Persée peuvent remonter dans différentes bases bibliographiques grâce à leur DOI Crossref.

Par exemple, on peut récupérer une de mes publis présente sur Persée via OpenAlex : openalex.org/works/w4289008988

@SReyCoyrehourcq @enroweb @RaphaelleK
Mais on ne peut pas verser directement et automatiquement dans HAL des publis venant de Persée, en tout cas à ma connaissance.

Ce que permet notre outil BiblioRef - pour l'instant uniquement pour le périmètre Lyon 3 - c'est de rassembler les références des publis + métadonnées (dont liens, statut open access, etc.) puis de proposer diverses fonctionnalités (création de biblio thématique, export, dataviz par labo ou chercheur, etc.).

@DamienPetermann @enroweb @RaphaelleK Ok ! Merci pour ces clarifications, c'est intéressant de voir qu'il y a des initiatives pour réconcilier les différentes sources.

@SReyCoyrehourcq @enroweb @RaphaelleK de rien !
Les identifiants auteurs sont vraiment l'élément pivot, mais il y a plusieurs freins importants :
- le manque de création d'identifiants type IdHal/ORCID par les chercheurs eux-mêmes
- la mauvaise qualité des données/profils auteurs et structures dans certaines sources/bases biblio
- le manque de recouvrement/passerelles entre les sources

L'avantage de HAL, c'est qu'en tant que responsable/administrateur d'un portail HAL, on peut corriger les références et les profils, ajouter des IdRef ou autre ID dans les profils auteurs (AuréHAL), mais tout ça est très chronophage !

@DamienPetermann @enroweb @RaphaelleK En tant que personnel amené,comme beaucoup d'entre nous, a faire des synthèse biblio a l'échelle labo, n'importe quel outil permettant d'améliorer l'agrégation de sources multiples est accueilli avec champagne et petit four ! Je rigole, mais en vrai je pense qu'on va sûrement passer sous Zotero pour établir notre "single source of true", aussi pour se simplifier la vie au niveau des affiliations auteurs/autrices..

@SReyCoyrehourcq @enroweb @RaphaelleK oui c'est l'idée à l'échelle de l'université pour nous, et justement on a mis en place des exports au format RIS pour Zotero, car l'outil peut aussi être utile côté BU pour mes collègues responsable de collections, qui doivent faire des bibliographies thématiques.
Ça fonctionne déjà même si la conversion au format RIS fait perdre quelques petites données (la pagination notamment mais ça c'est assez souvent le cas dans les bases biblios que je connais, c'est l'info la moins stable/bien récupérée)

@DamienPetermann @SReyCoyrehourcq @enroweb@qoto.org @RaphaelleK je m'incruste brutalement pour savoir si l'outil est amené à pouvoir être utilisé par d'autres universités ? (moi je bosse pas sur ces sujets directement mais ça pourrait intéresser des collègues...) Merci !!

@lenascameo @SReyCoyrehourcq @RaphaelleK l'outil est open source et on doit mettre en ligne une partie du code et de la documentation prochainement, donc oui l'idée c'est qu'il puisse être installé et utilisé par d'autres établissements voire des labos.
Mais je ne connais pas encore les modalités qui vont être choisies concrètement.

Le principe de l'application, c'est qu'il y a des connecteurs en python pour les sources et qu'il faut construire un référentiel structures et un référentiel personnes, c'est ça la partie la plus chronophage et qui nécessite suivi et mise à jour des données (ID chercheurs, grades, affiliations, diplômes, etc.).

Sign in to participate in the conversation
Qoto Mastodon

QOTO: Question Others to Teach Ourselves
An inclusive, Academic Freedom, instance
All cultures welcome.
Hate speech and harassment strictly forbidden.