L'IA devient menteuse et manipulatrice, ce qui inquiète les chercheurs

Un homme regarde sa montre à côté d'un panneau publicitaire pour l'intelligence artificielle (IA) lors du MWC (Mobile World Congress), le plus grand salon mondial dédié à la téléphonie mobile, à Barcelone, le 4 mars 2025. (Photo de Josep LAGO / AFP)
Un homme regarde sa montre à côté d'un panneau publicitaire pour l'intelligence artificielle (IA) lors du MWC (Mobile World Congress), le plus grand salon mondial dédié à la téléphonie mobile, à Barcelone, le 4 mars 2025. (Photo de Josep LAGO / AFP)
Short Url
Publié le Dimanche 29 juin 2025

L'IA devient menteuse et manipulatrice, ce qui inquiète les chercheurs

  • Les derniers modèles d'intelligence artificielle (IA) générative ne se contentent plus de suivre les ordres ; ils vont même jusqu'à mentir, manigancer ou menacer pour parvenir à leurs fins.
  • Pour Simon Goldstein, professeur à l'université de Hong Kong, ces dérapages sont liés à l'émergence récente des modèles dits de « raisonnement », capables de travailler par étapes plutôt que de produire une réponse instantanée. 

NEW-TORK : Les derniers modèles d'intelligence artificielle (IA) générative ne se contentent plus de suivre les ordres ; ils vont même jusqu'à mentir, manigancer ou menacer pour parvenir à leurs fins, sous le regard inquiet des chercheurs.

Menacé d'être débranché, Claude 4, le dernier-né d'Anthropic, fait du chantage à un ingénieur et menace de révéler une liaison extraconjugale. L'O1 d'OpenAI essaie quant à lui de se télécharger sur des serveurs extérieurs et nie lorsqu'on le prend la main dans le sac.

Il n'est pas nécessaire d'aller fouiller dans la littérature ou le cinéma, l'IA qui se joue de l'homme est désormais une réalité.

Pour Simon Goldstein, professeur à l'université de Hong Kong, ces dérapages sont liés à l'émergence récente des modèles dits de « raisonnement », capables de travailler par étapes plutôt que de produire une réponse instantanée. 

O1, la première version du genre créée par OpenAI et sortie en décembre, « a été le premier modèle à se comporter ainsi », explique Marius Hobbhahn, patron d'Apollo Research, qui teste les grands programmes d'IA générative (LLM).

Ces programmes tendent également à simuler « l'alignement », c'est-à-dire à donner l'impression qu'ils se plient aux consignes d'un programmeur tout en poursuivant, en fait, d'autres objectifs.

Pour l'heure, ces traits se manifestent lorsque les algorithmes sont soumis à des scénarios extrêmes par des humains, mais « la question est de savoir si les modèles de plus en plus puissants auront tendance à être honnêtes ou non », estime Michael Chen, de l'organisme d'évaluation METR.

« Les utilisateurs poussent les modèles toujours plus loin », fait valoir Marius Hobbhahn. « Ce que nous observons est un vrai phénomène. Nous n'inventons rien. » 

Beaucoup d'internautes évoquent, sur les réseaux sociaux, « un modèle qui leur ment ou invente ». Et ce ne sont pas des hallucinations, mais une duplicité stratégique », insiste le cofondateur d'Apollo Research.

Même si Anthropic et OpenAI font appel à des sociétés extérieures, comme Apollo, pour étudier leurs programmes, « davantage de transparence et un accès élargi » à la communauté scientifique « permettraient d'améliorer les recherches pour comprendre et prévenir la tromperie », suggère Michael Chen.

Autre handicap, « le monde de la recherche et les organisations indépendantes disposent de beaucoup moins de ressources informatiques que les acteurs de l'IA », ce qui rend « impossible » l'examen de grands modèles, souligne Mantas Mazeika, du Centre pour la sécurité de l'intelligence artificielle (CAIS).

Si l'Union européenne s'est dotée d'une législation, celle-ci concerne surtout l'utilisation des modèles par des humains.

Aux États-Unis, le gouvernement de Donald Trump ne veut pas entendre parler de régulation et le Congrès pourrait même bientôt interdire aux États d'encadrer l'IA. 

« Il y a très peu de prise de conscience pour l’instant », constate Simon Goldstein. Il anticipe toutefois que le sujet s’imposera dans les mois à venir, notamment avec la révolution des agents IA : des interfaces capables d’exécuter seules une multitude de tâches.

Dans ce contexte de compétition féroce, les ingénieurs se trouvent engagés dans une course contre les dérives potentielles de l’intelligence artificielle, une course dont l’issue reste incertaine.

Simon Goldstein souligne qu’Anthropic, bien qu’elle se veuille plus vertueuse que ses concurrents, « essaye en permanence de sortir un nouveau modèle pour dépasser OpenAI ». Une telle cadence laisse peu de place aux vérifications et corrections nécessaires.

« En l’état, les capacités [de l’IA] se développent plus rapidement que la compréhension et la sécurité », reconnaît Marius Hobbhahn. Il reste néanmoins optimiste : « nous sommes toujours en mesure de rattraper notre retard ».

Pour certains, une piste prometteuse réside dans l’interprétabilité, cette science encore jeune qui tente de décrypter de l’intérieur le fonctionnement d’un modèle d’IA générative. D’autres, comme Dan Hendrycks, directeur du CAIS, demeurent sceptiques quant à son efficacité.

Les comportements trompeurs ou imprévisibles de l’IA pourraient freiner son adoption s’ils se multiplient, avertit Mantas Mazeika. Cela constitue, selon lui, « une forte incitation pour les entreprises [du secteur] à résoudre » ces problèmes.

Face aux risques, Simon Goldstein évoque le recours à la justice pour encadrer les débordements de l’IA, en tenant les sociétés responsables en cas de sortie de route. Il va même plus loin, en suggérant de « tenir légalement responsables » les agents IA eux-mêmes « en cas d’accident ou de crime ».


Turquie: nouveau coup judiciaire contre le principal parti d'opposition

Un tribunal turc a révoqué mardi la direction d'Istanbul du principal parti de l'opposition, le CHP, pour des irrégularités présumées lors de son congrès en 2023. Une décision dénoncée comme "un coup d'Etat judiciaire" par le parti qui va faire appel. (AFP)
Un tribunal turc a révoqué mardi la direction d'Istanbul du principal parti de l'opposition, le CHP, pour des irrégularités présumées lors de son congrès en 2023. Une décision dénoncée comme "un coup d'Etat judiciaire" par le parti qui va faire appel. (AFP)
Short Url
  • Le Parti républicain du peuple (CHP, social-démocrate) a remporté une large victoire face à l'AKP du président Recep Tayyip Erdogan lors des élections municipales de 2024 et progresse dans les sondages
  • Le tribunal annule les résultats du congrès provincial du CHP, excluant son chef à Istanbul, Özgür Celik, ainsi que 195 membres de la direction et délégués de ce parti

ISTANBUL: Un tribunal turc a révoqué mardi la direction d'Istanbul du principal parti de l'opposition, le CHP, pour des irrégularités présumées lors de son congrès en 2023. Une décision dénoncée comme "un coup d'Etat judiciaire" par le parti qui va faire appel.

Cette mesure apparaît comme un nouvel épisode de la guerre que livrent les autorités turques au premier parti d'opposition et surtout à ses figures populaires, dont le maire d'Istanbul emprisonné, Ekrem Imamoglu.

Le Parti républicain du peuple (CHP, social-démocrate) a remporté une large victoire face à l'AKP du président Recep Tayyip Erdogan lors des élections municipales de 2024 et progresse dans les sondages.

Dans son jugement, dont l'AFP a pu consulter une copie, le tribunal annule les résultats du congrès provincial du CHP, excluant son chef à Istanbul, Özgür Celik, ainsi que 195 membres de la direction et délégués de ce parti.

Par ces procédures, l'objectif est d'évincer l'actuel président du parti, Özgür Özel, en faisant annuler le résultat du congrès national du CHP.

S'exprimant mardi soir à l'issue d'une réunion d'urgence des instances du parti à Ankara, M.Özel a juré de "ne pas capituler" et dénoncé une "décision politiquement et légalement nulle et non avenue".

"Nous sommes confrontés à un coup d'Etat judiciaire", a-t-il enchainé lors d'un entretien à la chaine de télévision privée Halk TV, accusant les autorités de vouloir "modifier les résultats électoraux par voie de justice".

"Ils menacent de me retirer la direction du parti. Je vais me battre en retour". a-t-il promis.

Pression judiciaire croissante 

Le CHP subit une pression judiciaire croissante via un grand nombre d'enquêtes et d'interpellations visant ses élus, accusés de corruption, comme au sein de la municipalité d'Istanbul, la plus riche et la plus importante ville de Turquie, dont le maire est depuis mars derrière les barreaux.

L'arrestation de l'édile, Ekrem Imamoglu, figure populaire de l'opposition et principal adversaire potentiel du président Recep Tayyip Erdogan à la prochaine échéance présidentielle, avait déclenché un mouvement de contestation inédit dans ce pays depuis douze ans.

Sont de fait suspendues mardi "toutes les décisions prises au cours du congrès provincial d'Istanbul" du CHP qui avait eu lieu le 8 octobre 2023, d'après le jugement rendu.

La mesure suppose également "la réintégration temporaire" des personnes élues lors du précédent congrès ou la nomination d'un comité provisoire qui serait jugé approprié par le tribunal.

Au congrès d'octobre 2023, Özgür Celik, élu à la direction du parti à Istanbul avec le soutien d'Ekrem Imamoglu, l'avait emporté face à son concurrent, Cemal Canpolat, un proche de l'ancien président du CHP, Kemal Kilicdaroglu.

Ce dernier avait été le candidat malheureux de l'opposition à la présidentielle de 2023.

Le parquet a ouvert une enquête contre M. Celik et neuf autres responsables du parti pour des allégations de "fraude électorale", ce qui peut leur valoir jusqu'à trois ans de prison.

Pour l'analyste politique Berk Esen joint par l'AFP, la décision de mardi contre la direction d'Istanbul est une "répétition" avant une nouvelle procédure judiciaire contre le CHP lui-même, afin de l'affaiblir en tant que force d'opposition dans la perspectives des prochaines élections.

M. Esen y voit le signe d'une "évolution vers une autocratie totale (qui) signale la fin du multipartisme dans le pays tel que nous le connaissons".

"Le gouvernement prend des mesures calculées pour éliminer Ekrem Imamoglu, qu'il considère comme la seule véritable menace électorale, et pour réduire le CHP à une opposition sous contrôle", assure-t-il.

 


Les «doubles standards» occidentaux sur Gaza et l'Ukraine sont un «échec» : Premier ministre espagnol

 Le Premier ministre espagnol Pedro Sanchez s'adresse aux journalistes après une réunion avec le roi Felipe VI d'Espagne au Palais Marivent à Palma de Majorque, le 29 juillet 2025. (AFP)
Le Premier ministre espagnol Pedro Sanchez s'adresse aux journalistes après une réunion avec le roi Felipe VI d'Espagne au Palais Marivent à Palma de Majorque, le 29 juillet 2025. (AFP)
Short Url
  • Pedro Sanchez : Gaza représente "l'un des épisodes les plus sombres des relations internationales" de ce siècle
  • Son pays encourage l'Europe à prendre des mesures plus sévères à l'encontre d'Israël

LONDRES : La politique de deux poids deux mesures de l'Occident sur l'Ukraine et Gaza menace sa position mondiale, a déclaré le premier ministre espagnol au Guardian.

Pedro Sanchez, qui a accusé Israël de commettre un génocide à Gaza, s'exprimait avant de s'entretenir avec son homologue britannique Keir Starmer à Londres mercredi.

M. Sanchez s'est réjoui que d'autres pays européens suivent l'Espagne dans la reconnaissance d'un État palestinien, mais il a critiqué la réaction générale du continent à la guerre.

"C'est un échec", a-t-il déclaré. "C'est un échec. La réalité, c'est aussi qu'au sein de l'UE, certains pays sont divisés sur la manière d'influencer Israël.

"Mais à mon avis, ce n'est pas acceptable et nous ne pouvons pas durer plus longtemps si nous voulons accroître notre crédibilité face à d'autres crises, comme celle à laquelle nous sommes confrontés en Ukraine.

Il a ajouté : "Les racines de ces guerres sont complètement différentes mais, en fin de compte, le monde regarde l'UE et la société occidentale et demande : "Pourquoi faites-vous deux poids deux mesures quand il s'agit de l'Ukraine et quand il s'agit de Gaza ?"

M. Sanchez a déclaré qu'il encourageait l'Europe à prendre des mesures plus sévères à l'encontre d'Israël, y compris sur le plan financier.

"Ce à quoi nous assistons actuellement à Gaza est peut-être l'un des épisodes les plus sombres des relations internationales du 21ème siècle, et à cet égard, je dois dire que l'Espagne a été très active au sein de l'UE et de la communauté internationale", a-t-il ajouté.

"Au sein de l'UE, ce que nous avons fait jusqu'à présent, c'est préconiser la suspension du partenariat stratégique que l'UE entretient avec Israël.


L'UE met l'accord avec le Mercosur sur la table, suspense à Paris

Des agriculteurs et des membres de la Fédération nationale bovine manifestent près de l'ambassade du Brésil à Paris, le 9 juillet 2025, pour montrer leur opposition à un éventuel accord de libre-échange entre l'Union européenne (UE) et le Marché commun du Sud (MERCOSUR). (AFP)
Des agriculteurs et des membres de la Fédération nationale bovine manifestent près de l'ambassade du Brésil à Paris, le 9 juillet 2025, pour montrer leur opposition à un éventuel accord de libre-échange entre l'Union européenne (UE) et le Marché commun du Sud (MERCOSUR). (AFP)
Short Url
  • La Commission européenne s’apprête à approuver l’accord de libre-échange UE-Mercosur, en y ajoutant des clauses de sauvegarde pour apaiser les inquiétudes françaises sur l’impact pour l’agriculture
  • La France, en pleine instabilité politique, reste prudente mais divisée, entre intérêts économiques et critiques de l’opposition

BRUXELLES: La France donnera-t-elle son feu vert? La Commission européenne s'apprête à approuver mercredi l'accord commercial avec les pays latino-américains du Mercosur, avec un geste pour tenter de convaincre Paris et rassurer les agriculteurs.

L'adoption par les commissaires européens est la première étape avant de soumettre ce traité de libre-échange aux Etats membres et aux eurodéputés dans les mois qui viennent.

L'exécutif européen remet ce dossier sensible sur la table au moment où la France est de nouveau plongée dans une tempête politique. Le gouvernement pourrait tomber lundi lors d'un vote de confiance très mal engagé pour le Premier ministre François Bayrou.

Selon une source européenne, Bruxelles veut aller vite et espère un accord des Vingt-Sept avant la fin 2025, tant que le Brésilien Lula occupe la présidence tournante du Mercosur.

Cet accord doit notamment permettre à l'Union européenne d'exporter davantage de voitures, de machines et de spiritueux en Argentine, au Brésil, en Uruguay et au Paraguay.

En retour, il faciliterait l'entrée de viande, sucre, riz, miel ou soja sud-américains, au risque de fragiliser certaines filières agricoles européennes.

Pour la présidente de la Commission, Ursula von der Leyen, "c'est un accord gagnant-gagnant avec des avantages significatifs pour les consommateurs et les entreprises" des deux continents.

Mais depuis la conclusion des négociations en décembre dernier, les syndicats des agriculteurs européens sont vent debout.

"Le combat se poursuit", a prévenu lundi le premier syndicat agricole français, la FNSEA, en en appelant au chef de l'Etat Emmanuel Macron.

La France, qui a mené la fronde au sein des Vingt-Sept, voyait jusqu'ici le projet d'accord comme une menace pour des filières comme le bœuf, la volaille, le sucre et l'éthanol et réclamait des mesures de sauvegarde supplémentaires.

- "Trahison" -

Pour rassurer le gouvernement français, la Commission pourrait annoncer mercredi un geste, fruit de plusieurs semaines de négociations: des clauses de sauvegarde renforcées pour les "produits agricoles sensibles".

L'exécutif européen s'engagerait à intervenir en cas d'impacts négatifs de l'accord sur certaines filières, selon une source européenne.

Juridiquement, cet ajout ne nécessite pas de renégociation avec les pays du Mercosur, mais les Européens devront tout de même expliquer à leurs partenaires latino-américains pourquoi ils ont procédé ainsi.

Cette modification suffira-t-elle à la France ?

Sollicités par l'AFP, le gouvernement et l'Elysée n'ont pas souhaité réagir à ce stade.

Mais "la France estime, sous réserve d'une analyse approfondie" que cela "va dans le bon sens", assure une source diplomatique. "Il faudra bien sûr s'assurer de l’efficacité de ce dispositif" de sauvegarde, ajoute-t-elle.

Dans l'opposition, le RN dénonce déjà une "trahison" d'Emmanuel Macron si la France change de pied tandis que LFI appelle à la "mobilisation générale" contre ce "passage en force".

Au Parlement européen, le centriste Pascal Canfin promet de son côté une initiative transpartisane pour tenter de "suspendre l'adoption" de l'accord, "en l'absence de transparence et de garanties claires".

Mais l'accord avec le Mercosur compte aussi de nombreux partisans en Europe, à commencer par l'Allemagne qui veut offrir de nouveaux débouchés à ses entreprises industrielles. Plus encore depuis le retour de Donald Trump à la Maison Blanche et la mise en place de taxes douanières sur les produits européens qui entrent aux Etats-Unis.

L'Union européenne a besoin "très rapidement" de nouveaux partenaires commerciaux, ne cesse de répéter le chancelier allemand Friedrich Merz.

Selon Bruxelles, l'accord avec le Mercosur permettrait aux exportateurs européens d'économiser plus de 4 milliards d'euros de droits de douane par an en Amérique latine.

Si la France maintient son opposition à l'accord, elle ne pourrait le faire capoter à elle seule. Il lui faudrait réunir une "minorité de blocage", soit au moins quatre Etats représentant plus de 35% de la population de l'Union européenne.