🤯 Voici les corpus sur lesquels a été entraîné Galactica :
---
RT @DrJimFan
Galactica capitalizes on the clean nature of such data and collects 106B tokens (!!), > 80% of which are from 48M academic papers. If Stable Diffusion is an intelligent compression of all human art, then Galactica is its counterpart for science. 4/🧵
https://twitter.com/DrJimFan/status/1592683282092941313
Certains dangers pointent déjà le bout de leur nez (via @moreymat)
---
RT @Michael_J_Black
This could usher in an era of deep scientific fakes. Alldieck and Pumarola will get citations to papers they didn't write. These papers will then be cited by others in real papers. What a mess this will be. (7/9)
https://twitter.com/Michael_J_Black/status/1593133744143360001
@enroweb ce sera intéressant de voir comment les gens l'utilisent.
@pac Il y aura des usages désirables, et d'autres moins… les détectives des articles bidonnés comme Guillaume Cabanac auront fort à faire !
@enroweb il y a déjà de quoi faire de bonnes parodies.
C'est ici pour utiliser Galactica : http://galactica.org
Il m'a proposé un très bon syllabus sur les impacts économiques de la science ouverte, dont je vais m'inspirer pour mon cours dans le parcours "IA et biomarqueurs" du Master Biologie Santé d'@univamu !