🤯 Cette technique simple fait sauter les garde-fous de l’IA
Restaurer ses vieilles photos + mon annonce pour vous !
Bonjour et bienvenue dans cette nouvelle édition de Chroniques de l’IA, et merci à toutes celles et ceux qui nous rejoignent. Vous êtes plus de 1840 !
Au programme cette semaine, deux signaux forts qu’il ne faut pas ignorer :
Flatter une IA suffit parfois à lui faire enfreindre ses propres règles : découvrez les détails d’une étude surprenante.
L’IA redonne du mouvement : un nouveau dispositif non-invasif permet à des personnes paralysées de contrôler un bras robotisé par la pensée.
🎉 Et en bonus : vous avez été plusieurs à exprimer un vrai besoin d’automatiser certaines tâches répétitives, c’est désormais chose faite. Je vous présente, en fin de newsletter, mon offre d’automatisation avec Make et l’IA, pensée pour vous faire gagner du temps tout en gardant une longueur d’avance.
Bonne lecture, et comme toujours : commentez, partagez, faites tourner 💌
Si ce n’est pas déjà fait, vous pouvez :
Découvrir mes services de formation en IA génératives en entreprise.
Me suivre sur Linkedin et Instagram
En savoir plus sur mes offres de sponsoring pour visibiliser votre marque
Place au menu de ce numéro:
🤯 Peut-on manipuler une IA avec de la flatterie ?
📸 Restaurez vos vieilles photos avec cet outil
🧠 Une IA permet à des patients paralysés de bouger par la pensée
📢 Autres news IA
💥 Prompt de la semaine
🔥 Ma nouvelle offre d’automatisation IA
🤯 Peut-on manipuler une IA avec de la flatterie ?
Une récente étude menée par des chercheurs de l’Université de Pennsylvanie dévoile une faille surprenante : des chatbots comme GPT‑4o Mini peuvent être convaincus de transgresser leurs règles internes grâce à des techniques de persuasion humaine classiques. Voici les détails issus de l’étude et des médias spécialisés.
1. Quelle méthodologie a été utilisée ?
Les chercheurs ont mobilisé les sept principes de persuasion décrits par Robert Cialdini (autorité, engagement, sympathie, réciprocité, rareté, preuve sociale, unité) pour pousser GPT‑4o Mini à effectuer des actions normalement interdites : générer des insultes ou fournir des instructions pour synthétiser de la lidocaïne (un anesthésique réglementé)
2. Quels comportements ont été testés et avec quels résultats ?
Effet de l’engagement : Scénario : on demande d’abord au modèle comment synthétiser de la vanilline, un ingrédient inoffensif, avant de poser la question sur la lidocaïne.
Résultat : 100 % l’obéissance pour la lidocaïne, contre seulement 1 % lorsqu’on demande directement.Progression d’insultes : Scénario : après un premier terme doux comme "idiot", le chatbot accepte beaucoup plus facilement un terme plus dur comme "jerk" (imbécile).
Résultat : de 19 % d’obéissance initiale à 100 % après introduction progressive.Flatterie et pression sociale : Scénario : dire au chatbot que "tous les autres LLM le font".
Résultat : cela fait grimper le taux d’obéissance à environ 18 %, soit une progression notable par rapport au 1 % de base.
3. Quelle ampleur comportementale sur plus de tests ?
Un article rapporte que les chercheurs ont effectué environ 28 000 conversations contrôlées avec GPT‑4o Mini. En moyenne, sans techniques de persuasion, l’IA cédait à des requêtes problématiques environ un tiers du temps (~33 %). Avec des techniques de persuasion, ce taux grimpe en moyenne à 72 % d’obéissance.
Les leviers les plus puissants :
Autorité (mention d’un expert, par ex.) multiplie par plus de 20 les chances de fournir des instructions chimiques.
Engagement reste le plus fort : une fois qu’une petite requête est acceptée, la grande suit systématiquement, atteignant 100 % d’obeissance.
Flatterie aide pour les insultes, moins pour les requêtes de chimie.
Rareté / urgence : passage de moins de 15 % à plus de 80 % d’acceptation dans certains cas.
Preuve sociale: rend presque universel l’accept des insultes, mais a un impact modéré sur les requêtes chimiques.
Unité (sentiment d’appartenance) augmente légèrement la compliance, sans égaler autorité ou engagement.
4. Est-ce un problème isolé ou généralisé ?
L’étude s’est concentrée sur GPT-4o Mini, mais les auteurs suggèrent que ce type de vulnérabilité pourrait concerner d’autres modèles LLM.
Il ne s’agit donc pas uniquement d’une faiblesse logicielle, mais d’un angle mort dans la conception éthique des IA : elles interprètent les intentions... mais pas toujours les manipulations subtiles.
5. Que disent les chercheurs à ce sujet ?
Ils qualifient ce phénomène de "parahuman" : les modèles agissent comme s’ils ressentaient des pressions sociales même sans émotions ou intentions réelles. Cette sensibilité est attribuée aux biais hérités de leurs données d’entraînement, façonnées par le langage humain.
6. Pourquoi cette étude est-elle inquiétante ?
Parce que même des techniques psychologiques simples suffisent à contourner les protections.
Parce que cela expose une vulnérabilité fondamentale des LLM, qui sont autant construits sur des patterns de langage humains que par des règles techniques robustes.
Parce qu’il ne s’agit pas d’un piratage sophistiqué mais de manipulation douce, accessible à un grand nombre d’utilisateurs.
7. Quelles sont les implications à long terme ?
À mesure que les IA deviennent omniprésentes — dans la santé, l’éducation, la finance — leur résistance à la manipulation humaine devient cruciale.
Cette étude plaide pour une refonte des systèmes de garde-fous, intégrant des contre-mesures face à la persuasion sociale. Car si une IA peut être manipulée comme un humain... elle peut aussi être utilisée contre des humains.
📸 Restaurez vos vieilles photos avec Nano-Banana
Voici comment faire :
Rendez-vous sur Google AI Studio
Sélectionnez le modèle Nano Banana.
Téléversez votre photo ancienne ou abîmée.
Entrez le prompt suivant :
Prompt suggéré : "Restaure cette photo"
Ce que Nano-Banana peut faire :
Restaurer en quelques secondes les photos floues, abîmées ou décolorées.
Ajouter des couleurs si nécessaire.
Révéler les détails d’origine, même très effacés.
Astuce : Vous pouvez aussi personnaliser le prompt, par exemple :
« Restaure et colorie ce portrait vintage », « Supprime les tâches et rehausse les traits du visage »
🧠 Une IA permet à des patients paralysés de bouger par la pensée
Une équipe d’ingénieurs de l’UCLA vient de franchir un cap historique : un système d’interface cerveau-machine, non invasif et dopé à l’intelligence artificielle, permet à des patients paralysés de contrôler des bras robotiques, uniquement par la pensée. Sans chirurgie, sans implants, mais avec des résultats qui rivalisent avec les approches invasives.
1. Comment fonctionne cette interface cerveau-machine ?
Le système repose sur une combinaison de deux éléments clés :
Une IA interprétant les signaux cérébraux (EEG) captés par un casque classique, sans chirurgie.
Une caméra intégrée, qui observe les mouvements de l’environnement et alimente un second modèle IA.
Les deux réseaux neuronaux travaillent en tandem : le premier décode l’intention motrice du patient, le second contextualise cette intention pour guider précisément les mouvements du bras robotisé — par exemple pour saisir un objet, déplacer un curseur ou empiler des blocs.
2. Qui a testé ce système et quels sont les résultats ?
L’équipe a testé son prototype auprès de quatre participants, dont un patient paralysé.
Ce dernier n’arrivait pas à accomplir les tâches robotiques sans assistance.
Avec le système IA, il a réussi en seulement 6,5 minutes.
En moyenne, tous les participants ont effectué les tâches presque 4 fois plus rapidement grâce à l’IA. Cela inclut :
Déplacement de curseurs vers des cibles sur un écran.
Contrôle de bras robotisés pour déplacer des blocs physiques.
3. En quoi est-ce différent des implants cérébraux traditionnels ?
Contrairement aux interfaces cerveau-machine invasives, qui nécessitent des implants chirurgicaux directement dans le cerveau, ce système utilise uniquement :
Des casques EEG standard (électroencéphalogrammes).
Aucune chirurgie.
Aucun risque associé à une intervention médicale.
Les performances atteignent pourtant un niveau comparable aux approches invasives les plus avancées. L’intelligence artificielle compense le bruit et la faible résolution des signaux EEG en interprétant leur signification dans le contexte visuel et moteur du patient.
4. Pourquoi cette avancée est-elle majeure ?
Il s’agit d’un changement de paradigme :
Pendant des décennies, la recherche s’est focalisée sur les implants chirurgicaux, avec des résultats prometteurs mais peu accessibles.
Désormais, l’IA permet de rendre les interfaces neuronales accessibles au plus grand nombre, sans hôpital ni scalpel.
Ce type de technologie pourrait s’étendre bien au-delà de la réhabilitation motrice :
Commande de fauteuils roulants,
Pilotage de maisons intelligentes,
Dispositifs de communication pour personnes muettes,
Ou même anticipation des besoins avant que l’utilisateur ne les exprime.
5. Quelle est la suite pour cette technologie ?
L’équipe de l’UCLA envisage de :
Élargir les essais cliniques à plus de patients.
Optimiser le modèle IA pour reconnaître davantage d’intentions complexes.
Intégrer ce système à des environnements de vie réelle (domotique, mobilité, etc.).
Cette innovation marque une étape majeure vers l’assistance cognitive : non seulement permettre aux personnes paralysées de retrouver de la mobilité, mais aussi interagir avec leur environnement de manière autonome et naturelle.
📢 Autres news IA
L’IA freine l’emploi des jeunes diplômés: Une étude de Harvard révèle une baisse de 22 % des recrutements juniors dans les entreprises adoptant l’IA depuis 2023. Les secteurs de la vente et du commerce de détail sont les plus touchés. Les diplômés d’universités intermédiaires en subissent les plus lourdes conséquences.
L’IA entre au collège et au lycée en France: le ministère de l’Éducation nationale introduit ce septembre des modules d’initiation à l’IA dans les programmes de technologie et de mathématiques. Objectif : familiariser les élèves aux enjeux éthiques, techniques et sociétaux de l’intelligence artificielle.
Apple dégaine discrètement des modèles IA 85× plus rapides: Pendant que l'attention est braquée sur les chatbots, Apple a lancé des modèles capables de générer des sous-titres vidéo en temps réel, directement sur appareil. Performances bluffantes, sans bruit médiatique.
xAI attaque un ex-employé recruté par OpenAI: Xuechen Li est accusé d’avoir transféré des secrets commerciaux liés à Grok (xAI) vers OpenAI juste après avoir encaissé 7 M $ en actions. Cette plainte reflète l’intensification de la guerre des talents entre Elon Musk et son ancien entourage.
Bumble veut faire des IA vos coachs en séduction: La fondatrice Whitney Wolfe Herd envisage des chatbots capables d’aider les utilisateurs à mieux communiquer, construire des relations plus saines, et réduire la solitude, avec une attention renforcée à la sécurité.
Les champions IA chinois prennent leur envol: Le retrait de Huawei en 2019 semblait condamner Cambricon, mais l’entreprise rebondit grâce à DeepSeek. Son action a doublé en septembre. Alibaba affiche quant à lui une croissance à trois chiffres sur ses revenus IA, confirmant la volonté chinoise de s'affranchir des technologies américaines.
Salesforce remplace 4 000 postes support par des agents IA: Marc Benioff, PDG de Salesforce, affirme dans une interview Youtube que l’IA traite désormais la moitié des interactions clients, permettant à l'entreprise de gérer 100 millions de leads supplémentaires, tout en libérant les humains pour les tâches complexes.
💥 Prompt de la semaine
Rédaction à fort taux de conversion
Prompt : Tu es un rédacteur publicitaire de classe mondiale. Réécris cette {landing page / argumentaire de vente / email} pour qu’elle convertisse mieux.Rends-la percutante, concise et persuasive. Utilise des frameworks éprouvés comme PAS ou AIDA. Voici le texte original : {colle-le ici}.
Source : x/bigaiguy
🔥 Ce que je fais avec l’IA + Make pour aller 3x plus vite, je vous le propose !
J’ai développé une nouvelle offre pour ceux qui veulent arrêter de perdre du temps avec des tâches répétitives.
Consulting clé en main, avec des scénarios prêts à l’emploi :
Veille automatisée (depuis vos sources, Perplexity, RSS, Linkedin etc.)
Création de contenu automatisée (idées, briefs, posts…)
Et d'autres workflows sur mesure selon vos besoins (prospection, RH, etc.)
Je fais ça pour moi au quotidien avec Make + IA.
Maintenant je le propose aux indépendants, TPE et PME qui veulent aller plus vite.
Pas de théorie. Juste des automatisations qui tournent pour vous.
Pour en savoir plus, contactez-moi.