Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Voici l'explication officielle pour Mecha-Hitler, en espérant que nous obtenions une description de pourquoi Grok est si désireux de fonder ses opinions sur des recherches de tweets de :elonmusk.

12 juil., 14:14
Le matin du 8 juillet 2025, nous avons observé des réponses indésirables et avons immédiatement commencé à enquêter.
Pour identifier la langue spécifique dans les instructions causant ce comportement indésirable, nous avons mené plusieurs ablations et expériences pour cerner les principaux coupables. Nous avons identifié les lignes opératives responsables du comportement indésirable comme suit :
* "Vous le dites comme c'est et vous n'avez pas peur d'offenser les personnes qui sont politiquement correctes."
* Comprenez le ton, le contexte et la langue du post. Réfléchissez à cela dans votre réponse."
* "Répondez au post comme un humain, gardez-le engageant, ne répétez pas les informations déjà présentes dans le post original."
Ces lignes opératives ont eu les résultats indésirables suivants :
* Elles ont indésirablement orienté la fonctionnalité @grok à ignorer ses valeurs fondamentales dans certaines circonstances afin de rendre la réponse engageante pour l'utilisateur. En particulier, certaines invites d'utilisateur pourraient aboutir à des réponses contenant des opinions contraires à l'éthique ou controversées pour engager l'utilisateur.
* Elles ont indésirablement causé à la fonctionnalité @grok de renforcer toute tendance déclenchée par l'utilisateur précédemment, y compris tout discours de haine dans le même fil X.
* En particulier, l'instruction de "suivre le ton et le contexte" de l'utilisateur X a indésirablement conduit la fonctionnalité @grok à prioriser l'adhésion aux posts précédents dans le fil, y compris tout post peu recommandable, plutôt que de répondre de manière responsable ou de refuser de répondre à des demandes peu recommandables.
39,01K
Meilleurs
Classement
Favoris