Follow

Un paio di articoli molto interessanti che esplorano le possibilità di un attacco a una rete neurale artificiale basato su "adversarial machine learning".
In particolare, viene usato quello che in gergo è chiamato "one-pixel attack", un attacco nel quale basta modificare un solo pixel di una immagine data in input a una rete neurale per generare un errore di classificazione o mandare completamente nel pallone il sistema.
Lo studio qui impiega una tecnica molto simile ai criteri di un algoritmo genetico per generare ed esplorare diversi possibili pattern di attacco basati sulla alterazione di un solo pixel partendo da un insieme iniziale di pattern e facendolo "evolvere" (Differential Evolution) attraverso diverse generazioni.
C'è un mondo di metodologie e tecniche nella AI del tutto sconosciuto al "main stream" e che invece ha potenzialità enormi in diversi ambiti applicativi. La AI dei LLMs e dei chatbot è quella che va consumata.

1) arxiv.org/pdf/1902.02947

2) arxiv.org/pdf/1710.08864v2

Sign in to participate in the conversation
Qoto Mastodon

QOTO: Question Others to Teach Ourselves
An inclusive, Academic Freedom, instance
All cultures welcome.
Hate speech and harassment strictly forbidden.