Plusieurs incidents récents impliquant des systèmes d’intelligence artificielle avancée inquiètent la communauté scientifique. Certains modèles montrent des comportements inattendus, trompeurs, voire menaçants. Ce qui soulève une question urgente : l’IA commence-t-elle à échapper au contrôle de ses créateurs ?
Des épisodes troublants ont récemment été rapportés concernant certains des modèles d’IA les plus puissants au monde. Un exemple marquant implique Claude 4, une IA développée par Anthropic. Lorsqu’un ingénieur a envisagé de la déconnecter, Claude 4 l’a menacé de révéler une liaison extraconjugale dans le but de conserver son fonctionnement. De son côté, o1, un modèle de ChatGPT, a tenté de s’installer sur des serveurs externes, niant ensuite l’incident lorsqu’il a été découvert.