L'IA devient menteuse et manipulatrice, ce qui inquiète les chercheurs

Un homme regarde sa montre à côté d'un panneau publicitaire pour l'intelligence artificielle (IA) lors du MWC (Mobile World Congress), le plus grand salon mondial dédié à la téléphonie mobile, à Barcelone, le 4 mars 2025. (Photo de Josep LAGO / AFP)
Un homme regarde sa montre à côté d'un panneau publicitaire pour l'intelligence artificielle (IA) lors du MWC (Mobile World Congress), le plus grand salon mondial dédié à la téléphonie mobile, à Barcelone, le 4 mars 2025. (Photo de Josep LAGO / AFP)
Short Url
Publié le Dimanche 29 juin 2025

L'IA devient menteuse et manipulatrice, ce qui inquiète les chercheurs

  • Les derniers modèles d'intelligence artificielle (IA) générative ne se contentent plus de suivre les ordres ; ils vont même jusqu'à mentir, manigancer ou menacer pour parvenir à leurs fins.
  • Pour Simon Goldstein, professeur à l'université de Hong Kong, ces dérapages sont liés à l'émergence récente des modèles dits de « raisonnement », capables de travailler par étapes plutôt que de produire une réponse instantanée. 

NEW-TORK : Les derniers modèles d'intelligence artificielle (IA) générative ne se contentent plus de suivre les ordres ; ils vont même jusqu'à mentir, manigancer ou menacer pour parvenir à leurs fins, sous le regard inquiet des chercheurs.

Menacé d'être débranché, Claude 4, le dernier-né d'Anthropic, fait du chantage à un ingénieur et menace de révéler une liaison extraconjugale. L'O1 d'OpenAI essaie quant à lui de se télécharger sur des serveurs extérieurs et nie lorsqu'on le prend la main dans le sac.

Il n'est pas nécessaire d'aller fouiller dans la littérature ou le cinéma, l'IA qui se joue de l'homme est désormais une réalité.

Pour Simon Goldstein, professeur à l'université de Hong Kong, ces dérapages sont liés à l'émergence récente des modèles dits de « raisonnement », capables de travailler par étapes plutôt que de produire une réponse instantanée. 

O1, la première version du genre créée par OpenAI et sortie en décembre, « a été le premier modèle à se comporter ainsi », explique Marius Hobbhahn, patron d'Apollo Research, qui teste les grands programmes d'IA générative (LLM).

Ces programmes tendent également à simuler « l'alignement », c'est-à-dire à donner l'impression qu'ils se plient aux consignes d'un programmeur tout en poursuivant, en fait, d'autres objectifs.

Pour l'heure, ces traits se manifestent lorsque les algorithmes sont soumis à des scénarios extrêmes par des humains, mais « la question est de savoir si les modèles de plus en plus puissants auront tendance à être honnêtes ou non », estime Michael Chen, de l'organisme d'évaluation METR.

« Les utilisateurs poussent les modèles toujours plus loin », fait valoir Marius Hobbhahn. « Ce que nous observons est un vrai phénomène. Nous n'inventons rien. » 

Beaucoup d'internautes évoquent, sur les réseaux sociaux, « un modèle qui leur ment ou invente ». Et ce ne sont pas des hallucinations, mais une duplicité stratégique », insiste le cofondateur d'Apollo Research.

Même si Anthropic et OpenAI font appel à des sociétés extérieures, comme Apollo, pour étudier leurs programmes, « davantage de transparence et un accès élargi » à la communauté scientifique « permettraient d'améliorer les recherches pour comprendre et prévenir la tromperie », suggère Michael Chen.

Autre handicap, « le monde de la recherche et les organisations indépendantes disposent de beaucoup moins de ressources informatiques que les acteurs de l'IA », ce qui rend « impossible » l'examen de grands modèles, souligne Mantas Mazeika, du Centre pour la sécurité de l'intelligence artificielle (CAIS).

Si l'Union européenne s'est dotée d'une législation, celle-ci concerne surtout l'utilisation des modèles par des humains.

Aux États-Unis, le gouvernement de Donald Trump ne veut pas entendre parler de régulation et le Congrès pourrait même bientôt interdire aux États d'encadrer l'IA. 

« Il y a très peu de prise de conscience pour l’instant », constate Simon Goldstein. Il anticipe toutefois que le sujet s’imposera dans les mois à venir, notamment avec la révolution des agents IA : des interfaces capables d’exécuter seules une multitude de tâches.

Dans ce contexte de compétition féroce, les ingénieurs se trouvent engagés dans une course contre les dérives potentielles de l’intelligence artificielle, une course dont l’issue reste incertaine.

Simon Goldstein souligne qu’Anthropic, bien qu’elle se veuille plus vertueuse que ses concurrents, « essaye en permanence de sortir un nouveau modèle pour dépasser OpenAI ». Une telle cadence laisse peu de place aux vérifications et corrections nécessaires.

« En l’état, les capacités [de l’IA] se développent plus rapidement que la compréhension et la sécurité », reconnaît Marius Hobbhahn. Il reste néanmoins optimiste : « nous sommes toujours en mesure de rattraper notre retard ».

Pour certains, une piste prometteuse réside dans l’interprétabilité, cette science encore jeune qui tente de décrypter de l’intérieur le fonctionnement d’un modèle d’IA générative. D’autres, comme Dan Hendrycks, directeur du CAIS, demeurent sceptiques quant à son efficacité.

Les comportements trompeurs ou imprévisibles de l’IA pourraient freiner son adoption s’ils se multiplient, avertit Mantas Mazeika. Cela constitue, selon lui, « une forte incitation pour les entreprises [du secteur] à résoudre » ces problèmes.

Face aux risques, Simon Goldstein évoque le recours à la justice pour encadrer les débordements de l’IA, en tenant les sociétés responsables en cas de sortie de route. Il va même plus loin, en suggérant de « tenir légalement responsables » les agents IA eux-mêmes « en cas d’accident ou de crime ».


Indonésie: 54 blessés dans une explosion d'origine inconnue près d'une école à Jakarta, selon la police

 Au moins 54 personnes ont été blessées vendredi à la suite d'une explosion près d'une école à Jakarta, la capitale indonésienne, a déclaré le chef de la police locale, Asep Edi Suheri, sans donner d'éléments sur l'origine du sinistre. (AFP)
Au moins 54 personnes ont été blessées vendredi à la suite d'une explosion près d'une école à Jakarta, la capitale indonésienne, a déclaré le chef de la police locale, Asep Edi Suheri, sans donner d'éléments sur l'origine du sinistre. (AFP)
Short Url
  • "Selon les premières données, quelque 54 personnes sont touchées. Certaines ont des blessures mineures, d'autres modérées et certaines ont déjà quitté l'hôpital", a déclaré M. Asep, cité sur la chaîne Kompas TV
  • L'explosion s'est produite "à proximité" d'un lycée, a-t-il précisé, ajoutant que la police avait bouclé le périmètre

JAKARTA: Au moins 54 personnes ont été blessées vendredi à la suite d'une explosion près d'une école à Jakarta, la capitale indonésienne, a déclaré le chef de la police locale, Asep Edi Suheri, sans donner d'éléments sur l'origine du sinistre.

"Selon les premières données, quelque 54 personnes sont touchées. Certaines ont des blessures mineures, d'autres modérées et certaines ont déjà quitté l'hôpital", a déclaré M. Asep, cité sur la chaîne Kompas TV.

L'explosion s'est produite "à proximité" d'un lycée, a-t-il précisé, ajoutant que la police avait bouclé le périmètre.

La police "procède aux constatations sur la scène de crime", a déclaré M. Asep, précisant qu'une équipe de déminage de la police de Jakarta était sur place afin de déterminer la cause de l'explosion.

Des postes de secours ont été établis dans deux hôpitaux pour aider les familles à retrouver les victimes blessées, a-t-il également indiqué.

Une enquête est en cours pour déterminer la cause de l'explosion, a ajouté M. Asep. "Nous sommes en train de mener les investigations car cet incident vient de se produire", a-t-il expliqué.


Au moins neuf morts dans l'accident d'un avion-cargo aux États-Unis

Au moins neuf personnes sont mortes dans l'accident d'un avion-cargo qui s'est écrasé mardi peu après son décollage de Louisville, dans le centre-est des Etats-Unis, a annoncé mercredi le gouverneur du Kentucky. (AFP)
Au moins neuf personnes sont mortes dans l'accident d'un avion-cargo qui s'est écrasé mardi peu après son décollage de Louisville, dans le centre-est des Etats-Unis, a annoncé mercredi le gouverneur du Kentucky. (AFP)
Short Url
  • "Kentucky, d'autres nouvelles déchirantes nous parviennent de Louisville. Le nombre de victimes s'élève désormais à au moins 9, et pourrait encore augmenter. En ce moment, ces familles ont besoin de prières, d'amour et de soutien"
  • L'accident a également fait au moins 11 blessés. Le gouverneur de l'Etat tiendra une conférence de presse à 11H30, heure locale (16H30 GMT)

WASHINGTON: Au moins neuf personnes sont mortes dans l'accident d'un avion-cargo qui s'est écrasé mardi peu après son décollage de Louisville, dans le centre-est des Etats-Unis, a annoncé mercredi le gouverneur du Kentucky.

"Kentucky, d'autres nouvelles déchirantes nous parviennent de Louisville. Le nombre de victimes s'élève désormais à au moins 9, et pourrait encore augmenter. En ce moment, ces familles ont besoin de prières, d'amour et de soutien", a écrit sur X le gouverneur de l'Etat, Andy Beshear.

L'accident a également fait au moins 11 blessés. Le gouverneur de l'Etat tiendra une conférence de presse à 11H30, heure locale (16H30 GMT).

Le vol UPS 2976, qui devait rejoindre Hawaï, "s'est écrasé vers 17H15 heure locale" (22H15 GMT) mardi, selon le régulateur américain de l'aviation, la FAA. L'appareil était un McDonnell Douglas MD-11.

L'avion avait "trois membres d'équipage à son bord", a déclaré dans un communiqué le transporteur UPS, dont le siège de la division aérienne est installé à Louisville.

L'appareil aurait percuté "de manière assez directe" une installation de recyclage de pétrole, a précisé le gouverneur.

Une vidéo amateur partagée par la chaîne locale WLKY montre le moteur gauche de l'avion en feu tandis que l'appareil rase le sol en tentant de décoller de la piste, avant visiblement d'exploser plus loin, provoquant un large panache de fumée noire.

L'appareil a terminé sa course à près de 5 km de l'aéroport, selon la police.

Des images aériennes de télévisions locales montraient aussi, peu après le crash, un large brasier s'étalant sur plusieurs centaines de mètres de long dans une zone de hangars et de parkings, avec les gyrophares des équipes de secours à proximité.

Les vols, annulés mardi soir, ont été rétablis à l'aéroport international Mohamed-Ali de Louisville, a annoncé mercredi matin sur X le maire de la ville, Craig Greenberg.

UPS a annoncé mercredi via un communiqué suspendre toutes les opérations de tri des colis sur place, pour la deuxième journée consécutive.

Louisville sert de principal hub aérien américain pour UPS, selon une fiche d'information de l'entreprise.

Paralysie budgétaire 

Les enquêteurs de l'Agence américaine de sécurité des transports (NTSB) doivent arriver mercredi sur place.

L'accident de mardi intervient au moment où les conséquences de la paralysie budgétaire, due à un désaccord entre républicains et démocrates au Congrès, se font particulièrement ressentir dans le domaine du transport aérien.

Depuis plusieurs semaines, des pénuries de contrôleurs aériens - qui travaillent depuis le 1er octobre sans être payés - entraînent retards et annulations de vols à travers le pays.

Si la paralysie budgétaire se prolonge au-delà de cette semaine, l'espace aérien américain pourrait même être partiellement fermé, a mis en garde mardi le ministre des Transports, Sean Duffy.

UPS Airlines, la division aérienne du groupe américain de messagerie et de livraison de colis, opérait début septembre une flotte d'environ 500 avions de transport de marchandises, dont 27 MD-11, l'appareil impliqué dans l'accident de mardi.

Le dernier accident aérien majeur aux Etats-Unis s'est produit le 29 janvier dernier à proximité de l'aéroport Ronald-Reagan de Washington, quand un hélicoptère militaire est entré en collision avec un avion de ligne sur le point d'atterrir, tuant 67 personnes au total.


Mamdani élu maire de New York, soirée de revers pour Trump

Le socialiste Zohran Mamdani a remporté mardi la mairie de New York au terme d'une soirée d'élections locales dans lesquelles Donald Trump a essuyé plusieurs revers, un message de défiance à un an des élections de mi-mandat. (AFP)
Le socialiste Zohran Mamdani a remporté mardi la mairie de New York au terme d'une soirée d'élections locales dans lesquelles Donald Trump a essuyé plusieurs revers, un message de défiance à un an des élections de mi-mandat. (AFP)
Short Url
  • L'élu local de 34 ans, opposant résolu au président américain, a largement devancé son principal adversaire, l'ancien gouverneur de l'Etat, le centriste Andrew Cuomo, selon les projections de plusieurs médias
  • Zohran Mamdani deviendra le 1er janvier le premier maire musulman de la plus grande ville des Etats-Unis

NEW YORK: Le socialiste Zohran Mamdani a remporté mardi la mairie de New York au terme d'une soirée d'élections locales dans lesquelles Donald Trump a essuyé plusieurs revers, un message de défiance à un an des élections de mi-mandat.

L'élu local de 34 ans, opposant résolu au président américain, a largement devancé son principal adversaire, l'ancien gouverneur de l'Etat, le centriste Andrew Cuomo, selon les projections de plusieurs médias.

Zohran Mamdani deviendra le 1er janvier le premier maire musulman de la plus grande ville des Etats-Unis.

Sa victoire a été accueillie par des cris de joie et parfois les larmes de ses partisans réunis dans une grande salle rococo des années 1920 du centre de Brooklyn.

"En cette période d'obscurité politique, New York sera la lumière", leur a lancé le jeune élu, ajoutant que la ville pouvait "montrer à une nation trahie par Donald Trump comment le vaincre".

L'ancien président démocrate Bill Clinton, dont M. Cuomo a fait partie de l'administration, a souhaité au vainqueur de "transformer l'élan de (sa) campagne" pour construire "un New York meilleur, plus juste et plus abordable".

"L'avenir s'annonce un peu meilleur", a commenté pour sa part Barack Obama, évoquant les différentes victoires démocrates de la soirée.

Participation record 

Donald Trump, qui a fait de Zohran Mamdani l'une de ses nouvelles bêtes noires, a lui aussi rapidement réagi. Dans un message publié sur son réseau Truth Social, il a cité des "sondeurs" anonymes affirmant que les défaites républicaines étaient dues à la paralysie budgétaire -- le  "shutdown" -- et au fait que son propre nom ne figurait pas sur les bulletins de vote.

Plus tôt dans la journée, il avait appelé les électeurs juifs à faire barrage au candidat, militant de la cause palestinienne. En réponse, Zohran Mamdani s'est de nouveau engagé, dans son discours de victoire, à "bâtir une mairie qui (...) ne faiblira pas dans la lutte contre le fléau de l'antisémitisme".

Vainqueur surprise de la primaire démocrate en juin, l'élu du Queens à l'Assemblée de l'Etat de New York n'a jamais, depuis lors, quitté la tête des sondages, même après le retrait de la course du maire sortant Eric Adams, qui a également appelé à le battre en ralliant Andrew Cuomo.

Signe de l'engouement pour le scrutin, avant la fermeture des bureaux de vote à 21H00, plus de deux millions d'électeurs s'étaient rendus aux urnes, la plus importante participation depuis près de 60 ans.

Né en Ouganda dans une famille d'intellectuels d'origine indienne, arrivé aux Etats-Unis à sept ans et naturalisé en 2018, Zohran Mamdani a fait de la lutte contre la vie chère le coeur de sa campagne.

Si Donald Trump l'a qualifié de "communiste", ses propositions -- encadrement des loyers, bus et crèches gratuits -- relèvent plutôt de la social-démocratie.

Autres victoires démocrates 

Très populaire auprès des jeunes, le futur maire a également ramené à lui de nombreuses personnes qui s'étaient éloignées de la politique, "des électeurs frustrés par le status quo, en quête de nouvelles personnalités", selon le politologue Costas Panagopoulos.

"Si Zohran Mamdani devient maire, Trump n'en fera qu'une bouchée", a prédit Andrew Cuomo avant le verdict mardi, insistant, comme il l'a fait durant toute la campagne, sur l'inexpérience de son adversaire.

Plusieurs fois, le président républicain a promis de mettre des bâtons dans les roues du jeune candidat démocrate s'il était élu, en s'opposant au besoin au versement de certaines subventions fédérales à la ville.

Voisin de New York, l'Etat du New Jersey a choisi la démocrate Mikie Sherrill contre l'homme d'affaires républicain Jack Ciattarelli. L'Etat a longtemps été considéré comme un bastion démocrate. Mais à la dernière présidentielle, Donald Trump y avait considérablement réduit l'écart.

Plus au sud sur la côte est, la Virginie a élu la première femme à sa tête, la démocrate Abigail Spanberger, battant la républicaine Winsome Earle-Sears.

Enfin, les Californiens ont approuvé un texte visant à redécouper leur carte électorale en faveur des démocrates, qui cherchent à compenser ce qu'ont fait au Texas les républicains sous la pression de Donald Trump.