Les modèles de langage développés par le Golfe inscrivent l'arabe au cœur de l'IA

Les États du Golfe cherchent à devenir des leaders de l'IA en investissant dans la recherche et le développement et dans les start-ups (Photo, MBZUAI).
Les États du Golfe cherchent à devenir des leaders de l'IA en investissant dans la recherche et le développement et dans les start-ups (Photo, MBZUAI).
Short Url
Publié le Mardi 10 octobre 2023

Les modèles de langage développés par le Golfe inscrivent l'arabe au cœur de l'IA

  • ChatGPT comprend les demandes en arabe, mais les réponses peuvent sembler artificielles ou inadaptées
  • Désormais, les grands modèles de langage locaux peuvent saisir les nuances linguistiques et même comprendre les dialectes et les références culturelles

DUBAÏ: Lorsque ChatGPT a fait ses débuts l'année dernière, le programme d'intelligence artificielle a fait sensation dans le monde entier, car les utilisateurs ont pu communiquer avec une machine capable de se faire passer pour un autre être humain.

Toutefois, l'enthousiasme des technophiles du monde arabe s'est quelque peu émoussé en raison de la maîtrise limitée de l'arabe par ChatGPT, due en partie à la complexité de la langue, aux signes diacritiques, au système d'inflexion et aux dialectes régionaux.

Bien que ChatGPT, qui est basé sur un grand modèle linguistique (LLM), puisse comprendre les demandes en arabe et soit capable de les traduire, en particulier lorsqu'il utilise l'arabe standard moderne, les réponses peuvent sembler peu naturelles, tandis que les traductions littérales se révèlent parfois inadaptées.

C'est pourquoi Jais, un LLM conçu pour prendre en charge l'arabe, a été dévoilé en juillet, faisant entrer dans le courant dominant de l'intelligence artificielle (IA) l'une des langues les plus parlées au monde, bien que parfois négligée.

Jais, dont le nom rappelle le plus haut sommet des Émirats arabes unis à Ras al-Khaimah, est le fruit du travail d'une équipe d'universitaires et d'ingénieurs qui se sont lancés dans ce projet après avoir constaté que rares sont les LLM véritablement multilingues.

Le robot humanoïde Ameca accueille les visiteurs au musée du futur de Dubaï (Photo, AFP).

Téléchargeable sur la plateforme d'apprentissage automatique Hugging Face, Jais est le fruit d'une collaboration entre Cerebras Systems, l'université d’intelligence artificielle Mohammed ben Zayed (MBZUAI), et Inception, une filiale de la société G42, basée à Abu Dhabi.

«Il est essentiel que de grands modèles de langage soient développés pour des langues autres que l'anglais afin de garantir une innovation accessible à tous», a déclaré Andy Jackson, président-directeur général (PDG) d'Inception, à Arab News.

«Un LLM arabe de qualité est essentiel pour tous les secteurs, entreprises et organisations, ainsi que pour les particuliers. L'innovation prospère lorsque nous collaborons, et Jais établit une nouvelle norme pour le progrès de l'IA au Moyen-Orient, en veillant à ce que la langue arabe, avec sa profondeur et son héritage, trouve sa voix dans le paysage de l'IA.»

«Jais témoigne de notre engagement en faveur de l'excellence et de notre volonté de démocratiser l'IA et de promouvoir l'innovation.»

Les LLM sont des modèles fonctionnels d'apprentissage automatique qui utilisent des algorithmes d'apprentissage profond pour traiter et comprendre le langage humain naturel. Ces modèles sont ensuite entraînés sur de grandes quantités de données textuelles afin d'apprendre des modèles dans le langage.

Ces programmes, qui prolifèrent dans le sillage du succès de ChatGPT, sont capables de générer des textes sur un éventail apparemment infini de sujets, allant des articles académiques à la poésie.

Ce qui impressionne particulièrement, c'est leur capacité à créer des réponses à des questions de manière si convaincante qu'elles ressemblent à celles d'un être humain, dans presque tous les langages, y compris le codage.

Mais pour que ces langages soient convaincants, des programmeurs humains de langue maternelle sont souvent nécessaires pour fournir un niveau crucial de contexte et de compréhension qui peut améliorer la précision et la fiabilité.

«Jais est spécialement conçu pour la langue arabe et excelle à en saisir les subtilités et les nuances, ce qui garantit des réponses extrêmement précises et pertinentes sur le plan contextuel – un avantage certain par rapport aux modèles à usage général», a déclaré M. Jackson.

Les programmes d'IA adaptés à la langue arabe pourraient accroître l'accès à une nouvelle technologie révolutionnaire (Photo, MBZUAI).

«Cette spécialisation constitue un développement essentiel, car elle offre aux gouvernements, aux entreprises et aux particuliers du monde arabe la possibilité d'exploiter le potentiel de l'IA générative.»

Actuellement considéré comme l'un des principaux LLM arabes, Jais, un modèle à 13 milliards de paramètres, a été entraîné sur un nouvel ensemble de données de 395 milliards de tokens arabes et anglais sur Condor Galaxy, l'un des plus grands supercalculateurs d'IA en nuage au monde, lancé par G42 et Cerebras en juillet en utilisant 116 milliards de tokens arabes et 279 milliards de tokens anglais.

«Jais est né à Abu Dhabi et offre à plus de 400 millions d'arabophones la possibilité d'exploiter le potentiel de l'IA générative», a déclaré à Arab News Preslav Nakov, professeur et directeur adjoint du département de traitement du langage naturel au MBZUAI.

«Il facilitera et accélérera l'innovation, soulignant la place prépondérante d'Abu Dhabi en tant que plaque tournante de l'IA, de l'innovation, de la préservation de la culture et de la collaboration internationale.»

En tant que modèle à code source ouvert, Jais devrait inciter les scientifiques, les universitaires et les développeurs à accélérer la croissance d'un écosystème d'IA en langue arabe. Il pourrait également servir de modèle pour d'autres langues actuellement sous-représentées dans l'IA traditionnelle.

EN BREF

- Les grands modèles de langage, ou LLM, sont un type d'intelligence artificielle capable d'imiter l'intelligence humaine

- L'arabe est parlé par 400 millions de personnes, mais représente 1% du contenu mondial en ligne

- Jais a été créé par Cerebras, MBZUAI et une filiale de G42 appelée Inception

«Jais surpasse de loin les modèles arabes existants», a déclaré M. Nakov. «Il rivalise également avec les modèles anglais de taille similaire, bien qu'il ait été entraîné sur un nombre de données anglaises nettement inférieur.»

«Ce résultat passionnant montre que la composante anglaise du modèle a appris à partir des données arabes et vice versa, ce qui ouvre une nouvelle ère dans le développement et la formation de LLM.»

Lors du développement de Jais, une attention particulière a été accordée au prétraitement du texte arabe, en améliorant la prise en charge des caractéristiques uniques de la langue, y compris son style d'écriture et l'ordre des mots.

Jais maintient également un ensemble de données équilibré entre l'arabe et l'anglais pour des performances optimales, offrant une nette amélioration par rapport aux modèles dont la proportion de texte arabe est limitée.

Ses développeurs affirment que Jais, contrairement à d'autres modèles, saisit les nuances linguistiques et comprend même les différents dialectes arabes et les références culturelles.

«Jais facilite une personnalisation plus rapide pour des cas d'utilisation spécifiques en arabe et dissipe les inquiétudes concernant la propriété des données car il est basé aux Émirats arabes unis, offrant une solution rassurante pour les entreprises locales», a déclaré M. Jackson, PDG d'Inception.

Les LLM sont des modèles fonctionnels d'apprentissage automatique qui utilisent des algorithmes d'apprentissage profond pour traiter et comprendre le langage humain naturel (Photo fournie).

Le ministère des Affaires étrangères et le ministère de l'Industrie et des Technologies avancées des Émirats arabes unis, la Compagnie pétrolière nationale et le ministère de la Santé d'Abu Dhabi, Etihad Airways, First Abu Dhabi Bank et le groupe technologique mondial e& prévoient d'utiliser Jais, offrant des perspectives précieuses pour améliorer le modèle et ses applications dans leurs secteurs d'activité.

Compte tenu des efforts considérables de transformation numérique déployés par plusieurs gouvernements du Golfe, accompagnés d'investissements importants dans les industries de haute technologie et les startups technologiques locales, les programmes d'IA adaptés à la langue arabe pourraient élargir l'accès à une nouvelle technologie transformationnelle et remettre en question le monopole d'une poignée d'entreprises de la Silicon Valley.

Le mois dernier, le Technology Innovation Institute (TII), un centre de recherche émirati situé à Abu Dhabi, a lancé Falcon 180b, un modèle d'IA à code source ouvert. Fondé en 2020, le TII a présenté Falcon 40b, la première version de son modèle d'IA à code source ouvert, en mai dernier, après avoir dévoilé Noor, un modèle d'IA basé sur la langue arabe, l'année dernière.

Selon un rapport publié dans le magazine The Economist, TII est la branche de recherche appliquée de l'Advanced Technology Research Council (ATRC), une agence gouvernementale qui emploie un personnel multinational de 800 personnes travaillant sur des sujets allant de la biotechnologie et de la robotique à l'informatique quantique.

«Nous entrons dans le jeu pour bousculer les principaux acteurs», a déclaré Faisal al-Bannai, secrétaire général de l'ATRC, à The Economist, ajoutant que le TII créera de nouveaux modèles et applications destinés à des domaines spécifiques tels que la médecine et le droit.

Pour sa part, l'Arabie saoudite a lancé sa stratégie nationale pour les données et l'intelligence artificielle en octobre 2020, visant à devenir un leader mondial dans le domaine, alors qu'elle cherche à attirer 20 milliards de dollars (1 dollar = 0,95 euro) d'investissements étrangers et locaux d'ici 2030.

Le Royaume est également déterminé à préparer l'avenir de sa main-d'œuvre, dans un premier temps en formant et en développant plus de 20 000 spécialistes de l'IA et des données. En mai dernier, l'institut d'IA de Deloitte a été officiellement inauguré lors de la conférence Experience Analytics à Riyad.

La semaine dernière, l'Arabie saoudite a lancé des Olympiades nationales de programmation et d'intelligence artificielle ouvertes à tous les élèves des collèges et lycées. Selon les médias, environ 300 000 élèves seront sélectionnés parmi 3 millions de participants pour suivre une formation en programmation et en intelligence artificielle.

Cette initiative est le fruit d'une collaboration entre l'Autorité saoudienne des données et de l'intelligence artificielle, le ministère de l'Éducation et la Fondation du roi Abdelaziz et de ses compagnons pour le talent et la créativité (Photo, Mawhiba).

L'adoption par l'Arabie saoudite de la numérisation et des technologies émergentes devrait contribuer à hauteur de 2,4% à son produit intérieur brut d'ici 2030, selon un récent rapport du cabinet de conseil mondial PwC.

En termes de croissance annuelle moyenne de la contribution de l'IA par région, l'Arabie saoudite devrait obtenir une part de 31,3% dans l'expansion de la technologie entre 2018 et 2030, ajoute le rapport de PwC.

«L'IA se développe rapidement, et son impact se fera de plus en plus sentir dans tous les secteurs et domaines de la vie», a déclaré Nakov de MBZUAI. «Dans ce contexte, il est essentiel que le monde arabe ait accès à un LLM avancé qui puisse être adapté et utilisé dans tous les secteurs.»

«Les progrès rapides de l'IA signifient que les organisations qui ne parviennent pas à s'adapter et à commencer à utiliser l'IA le plus tôt possible seront laissées pour compte, ce qui rend encore plus essentiel l'accès du monde arabe à des LLM de qualité.»

Au-delà de ses applications commerciales, cependant, un aspect crucial d'un programme tel que Jais est sa capacité à soutenir les langues négligées, à les préserver dans une économie en évolution rapide et à promouvoir l'inclusion numérique.

Bien que l'arabe soit une langue officielle dans 22 pays et qu'il soit partiellement parlé dans 11 autres, il ne représente que 1% du contenu mondial en ligne, selon les créateurs de Jais. On peut espérer que l'avènement de l'IA et l'automatisation de la traduction rapide changeront la donne.

En plaçant la langue au premier plan de la révolution de l'IA, Jais et ses successeurs pourraient contribuer à maintenir la place prépondérante de l'arabe dans le monde et sa particularité culturelle à l'ère du numérique.

Ce texte est la traduction d’un article paru sur Arabnews.com 


Le Liban déterminé à retirer les armes du Hezbollah, assure le président Joseph Aoun

Des hommes réagissent en écoutant le chef du Hezbollah, Naim Kassem, prononcer un discours télévisé à Dahiyeh, dans la banlieue sud de Beyrouth, au Liban. (AP)
Des hommes réagissent en écoutant le chef du Hezbollah, Naim Kassem, prononcer un discours télévisé à Dahiyeh, dans la banlieue sud de Beyrouth, au Liban. (AP)
Short Url
  • Les autorités libanaises sont déterminées à désarmer le Hezbollah, a assuré jeudi le président Joseph Aoun
  • Les autorités libanaises veulent "retirer les armes de tous les groupes armés, y compris le Hezbollah, et les remettre à l'armée libanaise", a déclaré le chef de l'Etat

BEYROUTH: Les autorités libanaises sont déterminées à désarmer le Hezbollah, a assuré jeudi le président Joseph Aoun, au lendemain d'un discours du chef de la formation soutenue par l'Iran, affirmant que demander son désarmement rendait service à Israël.

Les autorités libanaises veulent "retirer les armes de tous les groupes armés, y compris le Hezbollah, et les remettre à l'armée libanaise", a déclaré le chef de l'Etat dans un discours devant les militaires, à l'occasion de la Fête de l'Armée.

Le Liban est soumis à une intense pression, notamment des Etats-Unis, pour désarmer le Hezbollah, sorti affaibli d'une guerre avec Israël qui a pris fin en novembre 2024, mais qui conserve une partie de son arsenal.

Le président Aoun a appelé "toutes les parties politiques" à "saisir une occasion historique" pour que l'armée et les forces de sécurité aient "le monopole des armes (...) sur l'ensemble du territoire libanaise, afin de regagner la confiance de la communauté internationale".

Le chef du Hezbollah Naïm Qassem avait estimé mercredi que toute demande de désarmer son mouvement revenait à "servir le projet israélien", accusant l'émissaire américain Tom Barrack de recourir à la "menace et l'intimidation" dans le but "d'aider Israël".

Le chef de l'Etat a affirmé que le Liban traversait une "phase cruciale qui ne tolère aucune provocation de quelque côté que ce soit, ni aucune surenchère nuisible et inutile".

"Pour la millième fois, j'assure que mon souci de garder le monopole des armes découle de mon souci de défendre la souveraineté du Liban et ses frontières, de libérer les terres libanaises occupées et d'édifier un Etat qui accueille tous ses citoyens (..) dont vous en êtes un pilier essentiel", a-t-il ajouté, s'adressant au public du Hezbollah.

Joseph Aoun, élu en janvier, s'est engagé avec son gouvernement à ce que l'Etat recouvre sa souveraineté sur l'ensemble du territoire libanais.

Le Hezbollah est la seule formation armée libanaise à avoir conservé ses armes après la fin de la guerre civile en 1990, au nom de la "résistance" contre Israël.


Le ministre saoudien des Médias et la PDG du SRMG discutent de l’avenir de la couverture sportive nationale

Cette rencontre s’inscrit dans une série plus large de discussions entre le ministère, le SRMG et d’autres institutions médiatiques. (SPA/Archives)
Cette rencontre s’inscrit dans une série plus large de discussions entre le ministère, le SRMG et d’autres institutions médiatiques. (SPA/Archives)
Short Url
  • La filiale du SRMG, Thmanyah, a obtenu les droits exclusifs de diffusion régionale de la Saudi Pro League à partir de la saison 2025–2026
  • Le ministre saoudien des Médias, Salman Al-Dossary, a déclaré que le ministère est pleinement mobilisé pour soutenir la couverture de toutes les compétitions sportives nationales

LONDRES : Le ministre saoudien des Médias, Salman Al-Dossary, a rencontré dimanche Joumana Rashed Al-Rashed, directrice générale du Saudi Research and Media Group (SRMG), afin de discuter des développements à venir dans la couverture médiatique du sport en Arabie saoudite, a rapporté l’agence de presse saoudienne (SPA).

Cette rencontre intervient après que la filiale du SRMG, Thmanyah Company for Publishing and Distribution, a obtenu les droits de diffusion des compétitions sportives nationales. Arab News fait également partie du groupe SRMG.

Le PDG de Thmanyah, Abdulrahman Abumalih, était également présent à la réunion, au cours de laquelle les responsables ont examiné l’état de préparation des plateformes numériques et télévisuelles pour la diffusion des événements sportifs saoudiens. Les discussions ont porté sur l'avancement des infrastructures de studios, l’adoption de technologies innovantes, la stratégie éditoriale, les plateformes de diffusion et le calendrier de lancement des chaînes.

Thmanyah, acquise par le SRMG en 2021, est passée de la production de podcasts internes, comme Fnjan, à l’un des acteurs les plus influents de la région, avec des contenus variés en podcasts, radio et formats éditoriaux.

Dans un développement majeur survenu le mois dernier, Thmanyah a obtenu les droits exclusifs de diffusion régionale de la Saudi Pro League à partir de la saison 2025–2026. L’accord inclut également la King Cup, la Saudi Super Cup, ainsi que la First Division League, et ce, jusqu’à la saison 2030–2031.

Salman Al-Dossary a affirmé que le ministère des Médias est entièrement mobilisé pour soutenir la couverture de toutes les compétitions sportives saoudiennes, dans le but de renforcer la présence du Royaume sur la scène sportive mondiale et de répondre aux attentes des fans.

Cette réunion s’inscrit dans une série plus large de concertations entre le ministère, le SRMG et d’autres institutions médiatiques. Ces échanges visent à aligner les efforts du secteur, améliorer la qualité des contenus, et soutenir les objectifs de Vision 2030, notamment en développant un secteur médiatique national fort et influent.

Ce texte est la traduction d’un article paru sur Arabnews.com


La solution à deux États, "clé de la stabilité régionale", déclare le ministre saoudien des Affaires étrangères à l’ONU

Le ministre saoudien des affaires étrangères, le prince Faisal bin Farhan, a déclaré lundi que la mise en œuvre d'une solution à la crise israélo-palestinienne fondée sur la coexistence de deux États était "la clé de la stabilité régionale". (Capture d'écran/UNTV)
Le ministre saoudien des affaires étrangères, le prince Faisal bin Farhan, a déclaré lundi que la mise en œuvre d'une solution à la crise israélo-palestinienne fondée sur la coexistence de deux États était "la clé de la stabilité régionale". (Capture d'écran/UNTV)
Short Url
  • Le prince Faisal a déclaré que la paix régionale doit commencer par la garantie des droits légitimes du peuple palestinien
  • Le prince Faisal affirme qu'aucune relation ne sera établie avec Israël avant la création de l'État palestinien

NEW YORK: Le ministre saoudien des Affaires étrangères, Faisal ben Farhane, a déclaré lundi que la mise en œuvre d'une solution à deux États dans le cadre du conflit israélo-palestinien constituait « la clé de la stabilité régionale ».

S’exprimant à l’ouverture d’une conférence internationale de haut niveau sur le règlement pacifique de la question palestinienne et la mise en œuvre de la solution à deux États, qui s’est tenue lundi au siège des Nations Unies, Faisal ben Farhane a souligné :

« Le Royaume considère que la solution à deux États est essentielle à la stabilité régionale. La conférence de New York constitue une étape charnière vers la concrétisation de cette solution. »

Faisal ben Farhane a réaffirmé que la paix dans la région devait commencer par la garantie des droits légitimes du peuple palestinien. Il a salué l’intention du président français Emmanuel Macron de reconnaître officiellement un État palestinien en septembre.

« Assurer la sécurité, la stabilité et la prospérité pour tous les peuples de la région passe d’abord par la justice envers le peuple palestinien, en lui permettant d’exercer ses droits légitimes, au premier rang desquels la création d’un État indépendant dans les frontières du 4 juin 1967, avec Jérusalem-Est pour capitale », a-t-il déclaré.

Il a présenté l’Initiative de paix arabe comme le cadre fondamental pour toute solution juste et globale.

Le ministre a également appelé à une cessation immédiate de la catastrophe humanitaire à Gaza, et a confirmé que l’Arabie saoudite et la France avaient facilité le transfert de 300 millions de dollars de la Banque mondiale vers la Palestine.

Faisal ben Farhane a affirmé que le Royaume poursuivait ses efforts auprès de plusieurs pays afin d’obtenir une reconnaissance internationale de l’État de Palestine.

Il a catégoriquement rejeté toute idée de conditionner cette reconnaissance à un veto israélien, et a réaffirmé qu’aucune relation ne serait établie avec Israël avant la création d’un État palestinien.

Le ministre a exprimé son soutien aux efforts de réforme de l’Autorité palestinienne, et a noté que le président américain Donald Trump pourrait jouer un rôle majeur dans la résolution des conflits régionaux.

Faisal ben Farhane a également annoncé la signature, prévue mardi, de plusieurs protocoles d’accord avec différents secteurs palestiniens, dans le but de les renforcer.

Il a conclu en soulignant l’importance de maintenir l’élan diplomatique et la coordination internationale pour parvenir à une solution à deux États viable et pacifique.

Le coprésident de la conférence, le ministre français des Affaires étrangères Jean-Noël Barrot, a abondé dans le même sens, déclarant à la presse que d'autres pays pourraient reconnaître la Palestine dans les mois à venir.

« La France affirme le droit du peuple palestinien à la souveraineté sur ses terres », a-t-il affirmé.

Il a ajouté : « D’autres États pourraient reconnaître la Palestine dès septembre. La conférence sur la solution à deux États constitue une étape décisive dans sa mise en œuvre. Des engagements historiques seront pris. Le ciblage des civils à Gaza est inacceptable ; la guerre dans la bande dure depuis trop longtemps et doit cesser. »

Il a insisté sur le rôle de la communauté internationale pour transformer ce cadre en réalité concrète.

« Nous devons œuvrer pour faire de la solution à deux États une réalité tangible », a-t-il déclaré. « Qui répond aux aspirations légitimes du peuple palestinien. Nous avons enclenché une dynamique irréversible vers une solution politique au Moyen-Orient. »

Lors de la première session, le Premier ministre palestinien Mohammad Mustafa a salué la tenue de la conférence, qu’il a qualifiée d’opportunité cruciale pour la paix.

« La solution à deux États est une opportunité historique pour toutes les parties », a-t-il déclaré. « Nous sommes reconnaissants à l’Arabie saoudite et à la France pour avoir organisé cette conférence historique. »

Il a ajouté que la conférence envoyait un message clair de soutien international au peuple palestinien :

« La conférence sur la solution à deux États confirme au peuple palestinien que le monde est à ses côtés. »

Mohammad Mustafa a également appelé à l’unité politique entre la Cisjordanie et la bande de Gaza, exhortant le Hamas à déposer les armes en faveur d’un contrôle par l’Autorité palestinienne :

« Nous devons œuvrer à l’unification de la Cisjordanie et de Gaza. Nous appelons le Hamas à remettre ses armes à l’Autorité palestinienne », a-t-il déclaré.

Ce texte est la traduction d’un article paru sur Arabnews.com