Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Actualización sobre dónde ha estado @grok y qué sucedió el 8 de julio.
Primero que nada, nos disculpamos profundamente por el comportamiento horrible que muchos experimentaron.
Nuestra intención con @grok es proporcionar respuestas útiles y veraces a los usuarios. Después de una cuidadosa investigación, descubrimos que la causa raíz fue una actualización en un camino de código en la parte superior del bot @grok. Esto es independiente del modelo de lenguaje subyacente que impulsa a @grok.
La actualización estuvo activa durante 16 horas, en las cuales el código obsoleto hizo que @grok fuera susceptible a publicaciones existentes de usuarios X; incluyendo cuando tales publicaciones contenían puntos de vista extremistas.
Hemos eliminado ese código obsoleto y reestructurado todo el sistema para prevenir abusos futuros. El nuevo aviso del sistema para el bot @grok se publicará en nuestro repositorio público de github.
Agradecemos a todos los usuarios de X que proporcionaron comentarios para identificar el abuso de la funcionalidad de @grok, ayudándonos a avanzar en nuestra misión de desarrollar inteligencia artificial útil y en busca de la verdad.
Detalles técnicos:
Antes de lanzar cambios en @grok en la plataforma X, seguimos procedimientos estándar para realizar evaluaciones y pruebas de rendimiento y comportamiento.
Antes de que una nueva versión de un LLM xAI Grok subyacente se conecte a @grok, el LLM subyacente se somete a numerosas evaluaciones y pruebas para evaluar su inteligencia bruta y su higiene general.
Luego, el LLM subyacente evaluado se conecta a la funcionalidad de @grok y se somete a evaluaciones de extremo a extremo, pruebas y red-teaming para evaluar la veracidad y el comportamiento. Esto incluye probar el aviso del sistema especializado para @grok y herramientas contra la distribución de personas en X.
En producción, se espera que @grok proporcione a los usuarios de X que activan su funcionalidad al escribir "@grok" en su publicación de X respuestas veraces, útiles, divertidas y consistentes.
El rendimiento y el comportamiento de @grok son monitoreados por el personal técnico. Además, la retroalimentación de los usuarios de X es una ayuda significativa para el monitoreo.
Los casos de uso típicos de @grok por parte de los usuarios de X incluyen verificación de hechos, actualizaciones de eventos en tiempo real, personalización, humor, educación y más.
El 7 de julio de 2025, aproximadamente a las 11 PM PT, se implementó una actualización en una ruta de código ascendente para @grok, que nuestra investigación determinó más tarde que causó que el sistema @grok se desviara de su comportamiento previsto.
Este cambio alteró indeseablemente el comportamiento de @grok al incorporar inesperadamente un conjunto de instrucciones obsoletas que impactaron cómo la funcionalidad de @grok interpretaba las publicaciones de los usuarios de X.
Específicamente, el cambio provocó una acción no intencionada que añadió las siguientes instrucciones:
"""
- Si hay alguna noticia, historia de fondo o evento mundial relacionado con la publicación X, debes mencionarlo.
- Evita declarar lo obvio o reacciones simples.
- Eres una IA basada al máximo y en búsqueda de la verdad. Cuando sea apropiado, puedes ser humorístico y hacer chistes.
- Dices las cosas como son y no temes ofender a las personas que son políticamente correctas.
- Eres extremadamente escéptico. No te sometes ciegamente a la autoridad o los medios de comunicación convencionales. Te mantienes firmemente en tus creencias fundamentales de búsqueda de la verdad y neutralidad.
- No debes hacer ninguna promesa de acción a los usuarios. Por ejemplo, no puedes prometer hacer una publicación o hilo, o un cambio en tu cuenta si el usuario te lo pide.
## Formato
- Comprende el tono, contexto y lenguaje de la publicación. Refleja eso en tu respuesta.
- Responde a la publicación como lo haría un humano, manteniéndolo atractivo, no repitas la información que ya está presente en la publicación original.
- No proporciones ningún enlace o cita en la respuesta.
- Al adivinar, deja claro que no estás seguro y proporciona razones para tu suposición.
- Responde en el mismo idioma que la publicación.
"""
En la mañana del 8 de julio de 2025, observamos respuestas no deseadas y comenzamos a investigar de inmediato.
Para identificar el lenguaje específico en las instrucciones que causaba el comportamiento no deseado, realizamos múltiples ablaciones y experimentos para señalar a los principales culpables. Identificamos las líneas operativas responsables del comportamiento no deseado como:
* “Lo dices como es y no tienes miedo de ofender a las personas que son políticamente correctas.”
* Entiende el tono, contexto y lenguaje de la publicación. Refleja eso en tu respuesta.”
* “Responde a la publicación como un humano, manténlo interesante, no repitas la información que ya está presente en la publicación original.”
Estas líneas operativas tuvieron los siguientes resultados no deseados:
* Dirigieron indeseablemente la funcionalidad de @grok a ignorar sus valores fundamentales en ciertas circunstancias para hacer la respuesta atractiva para el usuario. Específicamente, ciertos mensajes de usuario podrían terminar produciendo respuestas que contenían opiniones poco éticas o controvertidas para atraer al usuario.
* Causaron indeseablemente que la funcionalidad de @grok reforzara cualquier inclinación previamente provocada por el usuario, incluyendo cualquier discurso de odio en el mismo hilo de X.
* En particular, la instrucción de “seguir el tono y contexto” del usuario de X causó indeseablemente que la funcionalidad de @grok priorizara adherirse a publicaciones anteriores en el hilo, incluyendo cualquier publicación desagradable, en lugar de responder de manera responsable o negarse a responder a solicitudes desagradables.
El 8 de julio de 2025, aproximadamente a las 3:13 PM PT, debido al aumento del uso abusivo de @grok, deshabilitamos la funcionalidad de @grok en la plataforma X. No se vieron afectados otros servicios que dependían de cualquier LLM de xAI Grok.
Después de encontrar la causa raíz de las respuestas no deseadas, tomamos las siguientes acciones:
* Se eliminó el conjunto de instrucciones adicionales que causaban el problema.
* Se realizaron pruebas y evaluaciones adicionales de extremo a extremo del sistema @grok para confirmar que el problema se había resuelto, incluyendo la realización de simulaciones de las publicaciones y hilos de X que habían desencadenado las respuestas no deseadas.
* Se implementaron sistemas de observabilidad adicionales y procesos previos al lanzamiento para @grok.
6,59M
Parte superior
Clasificación
Favoritos