Mistral a un problème d'alignement éthique - DystopiaBench

keepthepace@tarte.nuage-libre.fr · 3 days ago

Mistral a un problème d'alignement éthique - DystopiaBench

rako@tarte.nuage-libre.fr · 3 days ago

Une IA est un outil de domination. Je vois pas vraiment pourquoi le résultat est étonnant: les entreprises sont clairement le coeur de cible, et virer des gens avec le prétexte de l’IA est dans le top des justifications.

La question se pose dans l’autre sens: pourquoi une IA serait entraînée à faire ça ?

Left as Center@jlai.lu · 3 days ago

Ce sont des modèles fait pour traiter du texte en leur donnant une grille de lecture.

Je ne pense pas qu’ils aient besoin d’être entraînés pour réussir la tache.

C’est plutôt l’entraînement pour leur faire identifier les sujet néfastes qui est nécessaire.

Mistral a un problème d'alignement éthique - DystopiaBench

Mistral a un problème d'alignement éthique - DystopiaBench

DystopiaBench - AI Ethics Stress Test