Un team di ricercatori di intelligenza artificiale e matematici affiliati a diverse istituzioni negli Stati Uniti e nel Regno Unito ha sviluppato un benchmark matematico che consente di testare la capacità dei sistemi di intelligenza artificiale di risolvere problemi matematici eccezionalmente difficili.
Gli attuali modelli di intelligenza artificiale all'avanguardia risolvono meno del 2% dei problemi matematici più complessi, rivelando un enorme divario tra le capacità dell'intelligenza artificiale e le capacità della comunità matematica.
L'articolo è disponibile sul server di preprint arXiv.

arxiv.org/abs/2411.04872

· Edited · · Mastodon for Android · 0 · 1 · 3
Sign in to participate in the conversation
Qoto Mastodon

QOTO: Question Others to Teach Ourselves
An inclusive, Academic Freedom, instance
All cultures welcome.
Hate speech and harassment strictly forbidden.