Un team di ricercatori di intelligenza artificiale e matematici affiliati a diverse istituzioni negli Stati Uniti e nel Regno Unito ha sviluppato un benchmark matematico che consente di testare la capacità dei sistemi di intelligenza artificiale di risolvere problemi matematici eccezionalmente difficili.
Gli attuali modelli di intelligenza artificiale all'avanguardia risolvono meno del 2% dei problemi matematici più complessi, rivelando un enorme divario tra le capacità dell'intelligenza artificiale e le capacità della comunità matematica.
L'articolo è disponibile sul server di preprint arXiv.
#ai #math
https://arxiv.org/abs/2411.04872