Google Cloud Next 23 | Resumen
Un día después de que OpenAI lanzara la versión empresarial de su modelo ChatGPT, arrancó el Google Cloud Next 2023, donde se mostraron los más recientes lanzamientos de los productos de la compañía y que ejemplificaron la carrera existente por ocupar la posición más dominante en el campo de la IA.
Desde Plain Concepts no quisimos perdernos el evento que, tras tres años, volvía a su formato presencial en la ciudad de San Francisco. A continuación os resumimos algunas de las novedades más relevantes.
AI platforms and tools
Duet AI
Duet AI, la innovadora plataforma de inteligencia artificial de Google Cloud diseñada para revolucionar la forma en que los usuarios trabajan con la nube tiene el objetivo de mejorar la productividad, proporcionar ventajas competitivas y aumentar la eficiencia operativa. A través de su expansión, Duet AI se ha integrado en una amplia variedad de servicios y aplicaciones de Google Cloud.
Una de las áreas clave de enfoque para Duet AI es el desarrollo de aplicaciones. La plataforma ofrece asistencia experta en todo el ciclo de vida del desarrollo de software, incluyendo la generación de código, citación de fuentes, pruebas y diseño de APIs. Los desarrolladores pueden utilizar lenguaje natural para comprender y mejorar el código, así como para generar pruebas unitarias. Esta asistencia está disponible en varios entornos de desarrollo, lo que permite mantener el flujo de trabajo y minimizar las interrupciones.
Duet AI también agiliza la modernización de aplicaciones al ayudar en la refactorización de código. Por ejemplo, puede acelerar la migración de aplicaciones heredadas a Google Cloud, simplificando tareas como la conversión de código de un lenguaje a otro. Esta característica es especialmente valiosa para empresas que desean actualizar sus sistemas tecnológicos de manera más eficiente.
La plataforma se integra en la gestión de APIs, lo que permite diseñar y publicar APIs utilizando solicitudes en lenguaje natural. Esto simplifica la orquestación de comunicaciones entre servicios y facilita la integración de aplicaciones en un entorno empresarial.
Duet AI también se utiliza para simplificar la operación y gestión de infraestructura y aplicaciones. Ayuda a automatizar implementaciones, configurar aplicaciones correctamente y resolver problemas de manera eficiente. Por ejemplo, en Cloud Monitoring, puede traducir solicitudes en lenguaje natural en consultas PromQL para analizar métricas de series temporales, facilitando la identificación de problemas y su resolución.
En el ámbito del análisis de datos, Duet AI es una herramienta valiosa para los analistas. En BigQuery, proporciona asistencia contextual para escribir SQL y Python, lo que permite un análisis más rápido y efectivo. Puede generar funciones completas, sugerir completaciones de código y proporcionar explicaciones detalladas de las consultas SQL, lo que facilita la comprensión de los datos y sus patrones. Duet AI también se integra con Vertex AI, lo que permite una mayor optimización de las consultas de datos y análisis de texto. Esto facilita la búsqueda semántica y las consultas de recomendación basadas en datos de BigQuery.
Duet AI también se está introduciendo en Looker para ayudar a los usuarios comerciales a analizar datos de manera más eficiente. Ofrece análisis de datos conversacionales, generación automática de presentaciones y resúmenes de texto basados en informes, lo que permite una comprensión más rápida de los datos y la creación de modelos LookML.
Por último, Duet AI desempeña un papel importante en la ciberseguridad al resumir y clasificar rápidamente información sobre amenazas, reducir la carga de trabajo de los profesionales de seguridad y mejorar la detección y respuesta a incidentes. Se integra en productos de seguridad como Chronicle Security Operations, Mandiant Threat Intelligence y Security Command Center.
En resumen, Duet AI es una plataforma de inteligencia artificial que tiene un amplio impacto en el desarrollo de aplicaciones, la operación de infraestructura, el análisis de datos y la ciberseguridad. Su capacidad para comprender el lenguaje natural y ofrecer asistencia contextual promete mejorar la eficiencia y la productividad en una gran variedad de áreas dentro de Google Cloud.
Vertex AI
Vertex AI, la plataforma de aprendizaje automático basada en la nube desarrollada por Google Cloud ofrece un flujo de trabajo completo para crear, entrenar y poner en marcha modelos de aprendizaje automático. Proporciona soporte para diversos tipos de tareas de machine learning, ofrece herramientas para el procesamiento y análisis de datos, e incluye modelos pre-entrenados para casos de uso comunes. Vertex AI facilitará la gestión de la infraestructura, permitiendo que los desarrolladores, científicos de datos e investigadores se concentren en sus tareas de aprendizaje automático. Con Vertex AI, los usuarios pueden entrenar y desplegar modelos en la infraestructura de Google Cloud, que incluye AI Platform, Kubernetes y AutoML.
Vertex Platform
En Google Cloud Next se han anunciado mejoras en las capacidades de Vertex AI, incluyendo nuevos modelos en Model Garden, actualizaciones en modelos propios, y herramientas para personalizar y mejorar los modelos. Se destacan nuevos modelos, como Llama 2 y Claude 2, así como mejoras en modelos como PaLM 2, Codey e Imagen.
Además, se introduce la funcionalidad de marca de agua digital para Imagen. Se han presentado Vertex AI Extensions, que permiten la conexión de modelos a APIs para datos en tiempo real y acciones del mundo real. Todo diseñado para facilitar la experimentación y la construcción de aplicaciones con modelos de base, personalización con datos empresariales y despliegue en aplicaciones con características de privacidad, seguridad y IA responsable integradas. Estas actualizaciones buscan atender tanto a desarrolladores como a científicos de datos, sin importar su nivel de experiencia en IA, y acelerar la adopción de la IA generativa en empresas de diversos sectores.
Vertex AI Search and Conversation
Vertex AI Search y Conversation de Google Cloud, llegan para impulsar la creación de aplicaciones de búsqueda y chat generativas. Estos productos permiten a desarrolladores con poca experiencia en IA construir motores de búsqueda y chatbots que pueden interactuar con los clientes y responder preguntas de manera efectiva. Además de la disponibilidad general, se han agregado características como la búsqueda de múltiples turnos y extensiones para tomar acciones en tiempo real.
Vertex AI Search permite búsquedas multimodales de alta calidad, y Vertex AI Conversation facilita la creación de chatbots y voicebots de sonido natural. Estas herramientas son fundamentales para acelerar la adopción de la IA generativa y mejorar la experiencia del usuario en una variedad de aplicaciones empresariales.
Vertex Colab
Hace tres años, Google lanzó Vertex AI con el objetivo de proporcionar la mejor plataforma de IA/ML para acelerar las cargas de trabajo de IA. Desde entonces, Vertex AI ha ampliado sus capacidades, incluido el soporte para IA generativa y productos amigables para desarrolladores para casos de uso comunes de IA generativa. También se han agregado más de 100 modelos grandes de Google, contribuyentes de código abierto y terceros. A pesar de esta ampliación, se mantiene el enfoque en la ciencia de datos y la ingeniería de aprendizaje automático.
Se ha lanzado Colab Enterprise en versión preliminar pública, que combina la facilidad de uso de los cuadernos Colab de Google con capacidades empresariales de seguridad y cumplimiento. También se ha anunciado el soporte de Ray en Vertex AI para escalar eficientemente cargas de trabajo de IA. Además, se están avanzando las capacidades de MLOps para la IA generativa con ajustes en modelos, evaluación de modelos y una nueva versión de Vertex AI Feature Store con soporte para incrustaciones.
Colab Enterprise permite a los científicos de datos colaborar y acelerar flujos de trabajo de IA, con acceso a las capacidades de Vertex AI, integración con BigQuery y generación de código. Ray on Vertex AI ofrece eficiencia y escalabilidad, y es ideal para entrenar modelos de IA generativa. Además, se han anunciado características como la evaluación de modelos y el soporte de incrustaciones en Vertex AI Feature Store para mejorar la gestión de modelos de IA generativa en producción.
Estas nuevas características y productos están diseñados para ayudar a las organizaciones a avanzar en su práctica de IA, especialmente en el contexto de la IA generativa, y se centran en la colaboración, la escalabilidad y la gestión eficiente de modelos.
Vertex AI with Colab Enterprise and MLOps for generative AI
Como decíamos hay un avance significativo en MLOps para IA generativa con ajustes y evaluación de modelos, y una nueva versión de Vertex AI Feature Store con soporte para incrustaciones. Con estas capacidades, los clientes pueden aprovechar las características que necesitan en todo el flujo de trabajo de IA/ML, desde la prototipación y experimentación hasta la implementación y gestión de modelos en producción.
En cuanto a MLOps, se destacan áreas clave como la gestión de infraestructura de IA, la personalización con nuevas técnicas, la administración de nuevos tipos de artefactos, la supervisión de la salida generada y la conexión con datos empresariales. Se presenta un nuevo Marco de MLOps para IA predictiva y generativa para abordar estos desafíos.
Seguridad
En este evento de Google Cloud Next no podía quedar atrás otro de los grandes escenarios que preocupan a todo tipo de empresas: la seguridad. Se detalló su enfoque en la seguridad y cómo están abordando los desafíos más apremiantes en el ámbito de la tecnología de la información. Google Cloud está utilizando la inteligencia artificial (IA), específicamente Duet AI, para fortalecer sus soluciones de seguridad y proteger contra las crecientes amenazas cibernéticas.
El enfoque es integral y abarca desde la gestión y control de la seguridad en las cargas de trabajo de IA hasta la incorporación de la IA en sus productos de seguridad para hacerlos más efectivos. Además, están proporcionando herramientas y plataformas, como la Google Cloud Security AI Workbench, que permiten a sus clientes aprovechar la IA para mejorar la seguridad en sus propias aplicaciones y operaciones.
Duet AI en Mandiant Threat Intelligence
Ayuda a identificar tácticas, técnicas y procedimientos (TTPs) utilizados por actores de amenazas contra organizaciones, resumiendo la inteligencia de amenazas de Google de manera comprensible. Proporciona información sobre las amenazas más recientes y cómo hacer que la inteligencia de amenazas sea accionable en toda la organización.
Duet AI en Chronicle Security Operations
Simplifica la detección, investigación y respuesta a amenazas cibernéticas. Proporciona resúmenes claros de casos, contexto y orientación sobre amenazas importantes, así como recomendaciones sobre cómo responder. También permite búsquedas en lenguaje natural para acelerar la obtención de resultados.
Duet AI en Security Command Center
Facilita el análisis de hallazgos de seguridad y posibles rutas de ataque con un análisis casi instantáneo de las conclusiones de seguridad. Esto simplifica cuestiones complejas para que incluso los no especialistas puedan defender sus organizaciones.
Google Cloud
Google Cloud también está introduciendo capacidades adicionales para mejorar la ciberseguridad en entornos de Google Cloud, como el escaneo de vulnerabilidades sin agente, Cloud Firewall Plus con capacidades de firewall de última generación y Network Service Integration Manager.
Seguridad de datos
Se anunció la vista previa privada de Confidential Computing en CPUs Intel Xeon Scalable de 4ta generación con tecnología TDX, junto con integraciones mejoradas para la protección de datos sensibles en servicios como Dataplex y Dialogflow.
Modernización de infraestructuras cloud
Finalmente Google reconoció que estamos en un momento de inflexión en la computación, donde las demandas de cargas de trabajo como la IA generativa y modelos de lenguaje grande (LLMs) están creciendo exponencialmente, y la infraestructura tradicional ya no es suficiente. Y bajo ese prisma cayeron las siguientes novedades:
Infraestructura Optimizada para la IA
Google Cloud ha estado liderando la IA durante dos décadas y ha creado soluciones de infraestructura optimizada para la IA. Se ofrecen soluciones completas para la IA, desde la infraestructura de cómputo hasta el software y los servicios para entrenar, ajustar y servir modelos a escala global.
Nuevas Mejoras en la Infraestructura:
- Cloud TPU v5e: Google anunció el Cloud TPU v5e, que es altamente eficiente en costos y versátil para entrenamiento e inferencia a gran escala. Ofrece un rendimiento de entrenamiento hasta 2 veces mayor por dólar y un rendimiento de inferencia hasta 2.5 veces mayor por dólar para LLMs y modelos de gen AI en comparación con el TPU v4. Es más económico que su predecesor, lo que permite a más organizaciones entrenar y desplegar modelos de IA más grandes y complejos. Ofrece una gran flexibilidad con soporte para ocho configuraciones de máquinas virtuales diferentes.
- A3 VMs: Estas máquinas virtuales basadas en las GPU NVIDIA H100 estarán disponibles próximamente. Son ideales para entrenar y servir cargas de trabajo de IA exigentes. Ofrecen un rendimiento tres veces mayor y un ancho de banda de red diez veces mayor en comparación con la generación anterior. Las A3 VMs funcionan a gran escala, lo que permite a los usuarios escalar modelos a decenas de miles de GPU NVIDIA H100.
Operavibilidad de TPUs
Google Cloud está haciendo más sencillo operar TPUs con la disponibilidad general de Cloud TPUs en Google Kubernetes Engine (GKE). Los clientes pueden mejorar la productividad del desarrollo de IA utilizando GKE para gestionar la orquestación de cargas de trabajo de IA a gran escala en el Cloud TPU v5e.
Soporte Ampliado para Frameworks de IA
Google Cloud ofrece soporte para varios frameworks de IA como JAX, PyTorch y TensorFlow, además de herramientas de código abierto populares. También anunciaron un fortalecimiento del soporte para PyTorch con la próxima versión PyTorch/XLA 2.1.
Escalabilidad de Entrenamiento
Se introdujo la tecnología «Multislice» en versión preliminar, que permite escalar fácilmente modelos de IA más allá de los límites de las pods físicas de TPU.
En resumen, Google Cloud está brindando una infraestructura optimizada para la IA que es más eficiente en costos y escalable, lo que permitirá a las organizaciones abordar las demandas cada vez mayores de la IA generativa y los LLMs, acelerando así el progreso en el campo de la IA y el aprendizaje profundo.
Infraestructura de Dockers
Se anunciaron ciertos avances en la infraestructura de contenedores y la inteligencia artificial (IA) con un enfoque en GKE Enterprise, TPU en GKE y Duet AI en GKE y Cloud Run.
GKE Enterprise
Google Cloud presentó GKE Enterprise, una plataforma de contenedores integrada e intuitiva que combina lo mejor de GKE y Anthos. Esta edición incluye una nueva característica llamada «fleets», que permite a los ingenieros de plataforma agrupar cargas de trabajo similares en clústeres dedicados, aplicar configuraciones personalizadas y políticas específicas por grupo, aislar cargas de trabajo sensibles y delegar la gestión de clústeres a otros equipos. GKE Enterprise también ofrece características de seguridad gestionadas, como información avanzada sobre vulnerabilidades de cargas de trabajo, controles de gobierno y políticas, y un servicio de malla de servicios gestionado. Además, admite entornos híbridos y multinube para ejecutar cargas de trabajo de contenedores en GKE, otras nubes públicas o localmente con Google Distributed Cloud.
TPU en GKE
Google presentó Cloud TPU v5e, un acelerador de IA más eficiente en costos y escalable que puede escalar a decenas de miles de chips. Ofrece un rendimiento de entrenamiento hasta 2 veces mayor y un rendimiento de inferencia hasta 2.5 veces mayor por dólar en comparación con Cloud TPU v4. Permite aprovechar características como el escalado automático y la orquestación de cargas de trabajo. También se anunció el soporte de A3 VM con NVIDIA H100 GPU.
Duet AI en GKE y Cloud Run
Duet AI, colaborador de IA de Google, ahora está disponible en GKE y Cloud Run. Ayuda a los equipos de plataforma a reducir el trabajo manual y repetitivo al ejecutar contenedores en Google Cloud.
En general, estos anuncios muestran el compromiso de Google Cloud de proporcionar una infraestructura de contenedores de vanguardia y capacidades de IA que ayudarán a las empresas a aumentar su productividad, eficiencia y escalabilidad. Los clientes, como Equifax, ya han experimentado mejoras significativas en la seguridad y eficiencia con GKE Enterprise, lo que les permite gestionar cientos de clústeres de manera eficiente. Además, los avances en TPU y Duet AI prometen acelerar la adopción de la IA en diversas aplicaciones empresariales.