Límites en Gemini desatan quejas y Google responde

Escrito por titular.com | 03/06/26

La actualización en las cuotas de uso de los modelos avanzados de IA paralizó flujos de trabajo. Ante la presión, la empresa prometió revisar las restricciones.

A partir del 20 de mayo de 2026, Google implementó ajustes estructurales en las cuotas de uso de su ecosistema de inteligencia artificial, Gemini. La decisión redujo drásticamente la disponibilidad de tokens, afectando a usuarios gratuitos y suscriptores de planes como Google AI Pro. La medida desató fuertes críticas en la comunidad de desarrolladores y obligó a la compañía a plantear una revisión urgente del sistema.

El origen del descontento y el peso de Gemini 3.5 Flash

Durante los últimos días, plataformas como Reddit y medios especializados como 9to5Google documentaron interrupciones abruptas en el servicio tras los anuncios del evento I/O 2026. El problema central radica en la transición hacia un modelo de límites de uso vinculados al consumo de recursos.

Anteriormente, los desarrolladores disfrutaban de un margen amplio y poco monitoreado. Ahora, tras un correo electrónico informativo que formalizó las medidas, las cuotas se actualizan cada cinco horas y toman en cuenta múltiples variables: la complejidad de la instrucción (prompt), la longitud de la conversación y el uso de funciones pesadas. De hecho, los reportes tempranos indican que modelos recientes como Gemini 3.5 Flash demandan tantos recursos que una sola consulta compleja logra consumir un porcentaje significativo del bloque disponible para esas cinco horas.

Los suscriptores también expresaron su profunda frustración respecto al valor económico. Muchos usuarios de Google AI Pro señalaron que su plan técnicamente ofrece menos uso por dólar en comparación con el nivel intermedio Plus, lo que genera dudas sobre la rentabilidad de las suscripciones más costosas. En el entorno de desarrollo la situación resulta crítica: miles de programadores reportaron el Error 429 (Too Many Requests), un fallo que paraliza aplicaciones enteras dependientes del enrutamiento de la API de Gemini.

La respuesta oficial: justificación y promesa de revisión

Frente a la lluvia de reclamos, los voceros de la compañía salieron a aclarar la situación. Según la respuesta oficial en los canales de soporte, la empresa justificó la medida por el inmenso consumo de servidores que implica integrar Gemini en absolutamente todos sus productos, incluyendo la reconstrucción de su motor de búsqueda.

"Google utiliza límites de uso basados en computación para las aplicaciones web y móviles de Gemini, rastreando cosas como la complejidad de las instrucciones, la longitud de la conversación y el uso intenso de funciones", detalló el soporte técnico en su comunicado.

Sin embargo, ante el descontento generalizado, Google reconoció parcialmente que las restricciones resultaron demasiado severas y adelantó que revisará los límites actuales para encontrar un mayor equilibrio. Como primera medida de alivio y en señal de buena voluntad, la compañía ya triplicó de forma permanente los límites de solicitudes en Antigravity, una clara concesión hacia los desarrolladores más afectados.

Para los creadores de contenido y agencias, estos topes representan un desafío enorme. Como analizamos frecuentemente al explorar nuevas tácticas digitales y de productividad en el blog de Titular, la adopción de herramientas de IA resulta fundamental para escalar la producción, pero la dependencia exclusiva de un solo proveedor genera riesgos operativos evidentes frente a estos cambios unilaterales.

¿Será que el fin de la "inteligencia artificial ilimitada y económica" llegó? Si es así, a partir de ahora, la eficiencia en el diseño de prompts dejará de ser una simple habilidad deseable para convertirse en un estricto requisito financiero

Ver post completo