Saltar al contenido principal
abril 10, 2025

Google Cloud Next 2025: Novedades y lanzamientos

Google Cloud Next 2025 ha comenzado con aún más fuerza que las ediciones anteriores y ya hemos podido ver las apuestas más fuertes de la compañía, los cuales están centrados en IA generativa, infraestructuras cloud, chips, agentes, etc.

En Plain Concepts no queríamos perder detalle y nos hemos trasladado a Las Vegas para seguir todo lo que se va a anunciar durante el evento. ¡Aquí tenéis el resumen de los highlights!

Resumen Google Cloud Next 2025

Ha pasado exactamente un año desde la última edición del Google Cloud Next, y la de 2025 ha sido todo un espectáculo de novedades, alianzas, apuesta por el futuro y el presente.

Hace doce meses compartieron una visión sobre cómo la IA puede transformar radicalmente las organizaciones, pero hoy, esa visión no es solo una posibilidad, es una realidad que están construyendo.

Actualmente, más de 4 millones de desarrolladores utilizan Gemini, a lo que se suma un aumento de 20 veces en el uso de Vertex AI o los más de 2 millones de asistencias de IA proporcionadas a usuarios mensuales. Además, han ampliado su infraestructura a 42 regiones, contando con más de 200 puntos de presencia (PoP) en más de 200 países y territorios, creando una base verdaderamente global y resiliente.

Para los que no pudisteis asistir, os dejamos por aquí el vídeo de la Keynote de Thomas Kurian, CEO de Google Cloud, y repasamos los momentos más importantes:

Hipercomputadora de IA e Ironwood

Su hipercomputadora de IA es un revolucionario sistema de supercomputación diseñado para simplificar la implementación de la IA, mejorar el rendimiento y optimizar los costos.

En el evento presentaron la Ironwood, su TPU de séptima generación, la cual representa su TPU más grande y potente hasta la fecha, con una mejora de más de 10 veces con respecto a la anterior con el rendimiento más eficiente. Con más de 9000 chips por pod, Ironwood ofrece la asombrosa cantidad de 42,5 exaflops de cómputo por pod, satisfaciendo así las crecientes demandas de los modelos de pensamiento más sofisticados, como Gemini 2.5.

También hablaron de Cluster Director, el cual permite a las empresas implementar y administrar un gran número de aceleradores como una única unidad de computación unificada, maximizando el rendimiento, la eficiencia y la resiliencia.

Asociación con NVIDIA

Google se ha asociado con NVIDIA para integrar Gemini en sus sistemas Blackwell, con Dell como socio clave, para que pueda usarse localmente en entornos conectados y aislados.

De aquí surgen nuevas opciones de hardware de IA, como su cartera de GPU con la disponibilidad de máquinas virtuales A4 y A4X impulsadas por las innovadoras GPU Blackwell B200 y GB200 de NVIDIA. O también ser uno de los primeros en ofrecer las GPU Vera Rubin de próxima generación de NVIDIA, que ofrecen hasta 15 exaflops de rendimiento de inferencia FP4 por rack.

Mejoras para la inferencia de IA

Fueron 3 las mejoras significativas para la inferencia de IA presentadas durante el evento:

  • Inferencia de Google Kubernetes Engine (GKE): las nuevas capacidades de inferencia en GKE, incluidas las funciones de escalamiento y equilibrio de carga con reconocimiento de inteligencia artificial, pueden reducir los costos de servicio hasta en un 30%, disminuir la latencia de cola hasta en un 60 % y aumentar el rendimiento hasta en un 40 % según puntos de referencia internos.
  • Disponibilidad de Pathways: es el entorno de ejecución de aprendizaje automático distribuido de Google, ya está disponible por primera vez para los clientes de la nube, y que permite una inferencia multihost de vanguardia para un escalado dinámico con un rendimiento excepcional a un coste óptimo.
  • Disponibilidad de vLLM: están implementando vLLM en las TPU. Esto permite a los clientes que han optimizado PyTorch con vLLM para GPU ejecutar sus cargas de trabajo en TPU de forma sencilla y rentable, maximizando así su inversión y flexibilidad.

Gemini y nuevos modelos de IA

Anunciaron la llegada de Gemini 2.5 Flash, su modelo de referencia optimizado específicamente para baja latencia y rentabilidad, a Vertex AI. Este es ideal para para casos de uso cotidianos, como proporcionar respuestas rápidas durante interacciones con clientes de alto volumen, donde se requieren resúmenes en tiempo real o acceso rápido a documentos.

El modelo ajusta la profundidad del razonamiento según la complejidad de las indicaciones y permite controlar el rendimiento según el presupuesto del cliente. Estas nuevas funciones hacen que la IA sea más fácil de usar y asequible para todo tipo de casos de uso.

Además, anunciaron otros avances innovadores:

  • Imagen 3: su modelo de texto a imagen de máxima calidad cuenta ahora con funciones mejoradas de generación de imágenes y retoque para reconstruir las partes faltantes o dañadas de una imagen. También mejora la eliminación de objetos, lo que supone una experiencia de edición más natural y fluida.
  • Chirp 3: su modelo de generación de audio ahora incluye una nueva forma de crear voces personalizadas con tan solo 10 segundos de entrada de audio, lo que permite a las empresas personalizar sus centros de llamadas, desarrollar contenido accesible y otras funciones de transcripción.
  • Lyria: se trata del primero modelo de texto a música de la industria, el cual puede transformar simples indicaciones de texto en clips musicales, lo que abre nuevas vías para la expresión creativa.
  • Veo 2: es su nuevo modelo de generación de vídeo que ahora incluye nuevas funciones que ayudan a las organizaciones a crear vídeos, editarlos y añadir efectos visuales.

Cloud WAN

Se trata de una red global de nueva generación asistida por IA y con una latencia prácticamente nula. Ofrece soporte a servicios esenciales de Google y abarca más de tres millones de kilómetros de fibra óptica, repartida a lo largo de más de 200 países y territorios.

Esta red está ahora a disposición de empresas de todo el mundo, y está optimizada para maximizar el rendimiento de las aplicaciones. Es hasta un 40% más rápida y reduce el coste total de propiedad también en un 40%.

Avances en Google DeepMind

En su afán por conseguir la nube más apta para la investigación y el descubrimiento científico a nivel globa, están combinando lo mejor de Google DeepMind y Google Research con una nueva infraestructura y capacidad de IA que incluyen:

  • AlphaFold 3: puede predecir la estructura y las interacciones de todas las moléculas con una precisión sin precedentes. La nueva solución de alto rendimiento AlphaFold 3, disponible para uso no comercial e implementable a través de Google Cloud Cluster Toolkit, permite el procesamiento eficiente por lotes de hasta decenas de miles de secuencias de proteínas, a la vez que minimiza los costos mediante una infraestructura de escalado automático.
  • Los modelos de IA de WeatherNext: permiten realizar pronósticos meteorológicos rápidos y precisos, y ya están disponibles en Vertex AI Model Garden.

Vertex AI

Vertex AI Model Garden cuenta ahora con más de 200 modelos, incluyendo modelos de Google, modelos de terceros de empresas como Anthropic, AI21 y Mistral, y modelos abiertos como Gemma y Llama. Recientemente, han añadido modelos de CAMB.AI, Qodo y la cartera completa de modelos de código abierto de The Allen Institute.

El uso de Vertex AI ha experimentado un crecimiento explosivo, incrementándose 20 veces el año pasado, empoderando a las empresas para obtener nuevas e importantes eficiencias al automatizar y acelerar procesos rutinarios y de misión crítica.

Para ello, también anunciaron nuevos avances, como paneles de IA, capacidades de entrenamiento y ajuste, optimizador de modelos, API en vivo, entre otros. Además, han presentado nuevas capacidades para avanzar hacia un ecosistema de múltiples agentes:

  • Kit de Desarrollo de Agentes (ADK): marco de código abierto que simplifica el proceso de creación de sistemas multiagente sofisticados, manteniendo un control preciso sobre el comportamiento de los agentes.
  • Protocolo Agente a Agente (A2A): Google se convierte en el primer hiperescalador en crear un protocolo Agente a Agente (A2A) abierto para ayudar a las empresas a soportar ecosistemas multiagente, de modo que los agentes puedan comunicarse entre sí, independientemente de la tecnología subyacente.
  • Agent Garden: es una colección de ejemplos y herramientas listas para usar, accesibles directamente desde ADK.
  • Interoperabilidad: con Vertex AI, se puede gestionar sin problemas agentes creados en múltiples marcos de agentes, como LangGraph y Crew AI.

Google Agentspace

Agentspace integra la búsqueda empresarial con calidad de Google, la IA conversacional, Gemini y agentes externos para que los empleados puedan encontrar y sintetizar información dentro de sus organizaciones, interactuar con agentes de IA y tomar medidas con sus aplicaciones empresariales.

Ahora incluye nuevas mejoras:

  • Chrome Enterprise: ahora también está perfectamente integrado con Chrome Enterprise, lo que permite a los empleados buscar y acceder a todos los recursos empresariales directamente desde el cuadro de búsqueda en Chrome, lo que agiliza los flujos de trabajo y aumenta la productividad.
  • Agent Gallery: esto proporciona a los empleados una vista única de los agentes disponibles en toda la empresa, lo que hace que los agentes sean fáciles de descubrir y usar.
  • Agent Designer: una interfaz sin código para crear agentes personalizados que automatizan las tareas laborales diarias. Ayuda a los empleados a adaptar los agentes a sus flujos de trabajo y necesidades individuales.
  • Idea Generation agent: este agente utiliza un marco estilo torneo para clasificar eficazmente las ideas según criterios definidos por los empleados y puede ayudarlos a refinar o generar nuevas ideas.
  • Deep Research agent: este agente explora temas complejos en nombre de los empleados y les proporciona resultados en un informe completo y fácil de leer.

Google Workspace

Con el objetivo de empoderar a los usuarios de IA, se han incluido nuevas innovaciones en Workspace:

  • Help Me Analyze: esta función transforma Google Sheets en un analista de negocios personal, identificando de forma inteligente información de tus datos para ayudar a tomar decisiones fiables.
  • Docs Audio Overview: se pueden crear lecturas de audio de alta calidad o resúmenes estilo podcast de tus documentos.
  • Google Workspace Flows: ayuda a automatizar el trabajo diario y las tareas repetitivas, como administrar aprobaciones, investigar clientes, organizar tu email, resumir tu agenda, etc.

Google Unified Security (GUS)

Esta nueva solución de seguridad emplea Gemini para mejorar la eficiencia en todos los aspectos de la experiencia de los profesionales de ciberseguridad. Crea una red unificada de datos de seguridad, escalable y con opciones de búsqueda, que cubre toda la superficie que puede ser atacada.

Además, ofrece visibilidad y capacidad de detección, así como respuesta en redes, endpoints, cloud y aplicaciones. También enriquece automáticamente los datos de seguridad con inteligencia avanzada de Google.

Y hasta aquí el resumen del primer día. ¡Mañana volveremos con más novedades!

Elena Canorea
Autor
Elena Canorea
Communications Lead