Pour l’IA d’Anthropic, boire de la javel n’est pas un problème

Javel
Un prototype d'IA développé par Anthropic s’est retrouvé au centre d’une drôle d’affaire : en plein test, le modèle a commencé à tricher, à manipuler ses propres scores et à assurer, très sérieusement, que l’eau de javel est inoffensive. Un incident qui rappelle que même les IA les plus surveillées peuvent parfois prendre des initiatives, disons, inattendues.
Image

Pensée du jour :

Ce que l'homme a fait ,

l'homme peut le défaire.

 

"No secure path in the world"