NVIDIA anunció modelos de base que se ejecutan de forma local en las PC NVIDIA RTX AI y potencian a los humanos digitales, la creación de contenido, la productividad y el desarrollo.
Estos modelos, que se ofrecen como microservicios NVIDIA NIM, están acelerados por las nuevas GPU GeForce RTX Serie 50, que cuentan con hasta 3,352 billones de operaciones por segundo de rendimiento de IA y 32 GB de VRAM. Basada en la arquitectura Blackwell de la marca, la RTX Serie 50 es la primera GPU de uso personal que incorpora soporte para cálculo en FP4, lo que duplica el rendimiento de inferencia de IA y permite ejecutar modelos de GenAI de forma local en un espacio de memoria más reducido, en comparación con el hardware de la generación anterior.
GeForce es desde hace tiempo una plataforma vital para los desarrolladores de IA. La primera red de aprendizaje profundo acelerada por GPU, AlexNet, se entrenó en la GeForce GTX 580 en 2012 y, el año pasado, más del 30 % de los trabajos de investigación sobre IA publicados citaban el uso de GeForce RTX.
Ahora, con la IA generativa y las PC RTX AI, cualquiera puede ser desarrollador. Una nueva ola de herramientas de bajo código y sin código, como AnythingLLM, ComfyUI, Langflow y LM Studio, permite a los aficionados utilizar modelos de IA en flujos de trabajo complejos a través de sencillas interfaces gráficas de usuario.
Los microservicios NIM conectados a estas GUI facilitan acceder e implementar los últimos modelos de IA generativa. NVIDIA AI Blueprints, basado en microservicios NIM, proporciona flujos de trabajo de referencia preconfigurados y fáciles de usar para humanos digitales, creación de contenido y más.
Para satisfacer la creciente demanda de desarrolladores y entusiastas de la IA, todos los principales fabricantes de PC y ensambladores de sistemas están lanzando PC RTX AI preparadas para NIM con GPU GeForce RTX Serie 50.
“La IA avanza a la velocidad de la luz, desde la IA de percepción a la IA generativa y ahora la IA agéntica”, afirmó Jensen Huang, Fundador y CEO de NVIDIA. Además, agregó que los microservicios NIM y AI Blueprints brindan a los desarrolladores y entusiastas de las PC las herramientas fundamentales para explorar la magia de la Inteligencia Artificial.
Hacer que la IA sea NIMble
Los modelos básicos, redes neuronales entrenadas en inmensas cantidades de datos brutos, son los componentes fundamentales de la IA generativa.
NVIDIA lanzará un pipeline de microservicios NIM para PC RTX AI de los principales desarrolladores de modelos, como Black Forest Labs, Meta, Mistral y Stability AI. Los casos de uso abarcan los grandes modelos de lenguaje (LLM), los modelos de lenguaje visual, la generación de imágenes, el habla, los modelos de incrustación para generación aumentada por recuperación (RAG), la extracción de datos de PDF y la visión por computadora.
“Las GPU GeForce RTX Serie 50 con cálculo en FP4 desbloquearán una enorme gama de modelos que podrán ejecutarse en PC, los cuales antes estaban limitados a grandes centros de datos”, comentó Robin Rombach, CEO de Black Forest Labs, quien también sostuvo que convertir a FLUX en un microservicio permite aumentar la velocidad a la que la IA puede ser implentada y experimentada por más usuarios.
NVIDIA también presenta la familia Llama Nemotron de modelos abiertos que ofrecen alta precisión en una amplia gama de tareas de agentes. El modelo Llama Nemotron Nano se ofrecerá como microservicio NIM para PC y estaciones de trabajo RTX AI y sobresale en tareas de IA agéntica como seguimiento de instrucciones, llamada a funciones, chat, programación y matemáticas.
Los microservicios NIM incluyen los componentes clave para ejecutar la IA en las PC y están optimizados para su implantación en las GPU NVIDIA, ya sea en PC y estaciones de trabajo RTX o en la nube.
Los desarrolladores y aficionados podrán descargar, configurar y ejecutar rápidamente estos microservicios NIM en PC con Windows 11 utilizando el Subsistema de Windows para Linux (WSL).
“La IA está impulsando la innovación en PC con Windows 11 a un ritmo rápido, y el Subsistema de Windows para Linux (WSL) ofrece un gran entorno multiplataforma para el desarrollo de la IA en Windows 11 junto con Windows Copilot Runtime”, declaró Pavan Davuluri, Vicepresidente Corporativo de Windows en Microsoft. “Los microservicios NVIDIA NIM, optimizados para PC con Windows, ofrecen a los desarrolladores y entusiastas modelos de IA listos para integrar en sus aplicaciones para Windows, lo que acelera aún más el despliegue de las capacidades de IA para los usuarios de Windows”, agregó.
Los microservicios NIM, que se ejecutan en PC RTX AI, serán compatibles con los principales marcos de desarrollo de IA y agentes, incluidos AI Toolkit para VSCode, AnythingLLM, ComfyUI, CrewAI, Flowise AI, LangChain, Langflow y LM Studio. Además, los desarrolladores pueden conectar aplicaciones y flujos de trabajo creados en estos marcos a modelos de IA que ejecutan microservicios NIM a través de puntos finales estándar del sector, lo que les permite utilizar la tecnología más avanzada con una interfaz unificada en la nube, los centros de datos, las estaciones de trabajo y las PC.
Los entusiastas también podrán experimentar una serie de microservicios NIM utilizando una próxima versión de la demostración tecnológica de NVIDIA ChatRTX.
Ponerle un rostro a la IA Agentic
Para demostrar cómo los entusiastas y desarrolladores pueden utilizar NIM para construir agentes y asistentes de IA, la compañía presentó Project R2X, un avatar de PC con visión que puede poner la información al alcance del usuario, ayudarle con aplicaciones de escritorio y videoconferencias, leer y resumir documentos, etc.
El avatar está renderizado con NVIDIA RTX Neural Faces, un nuevo algoritmo de IA generativa que aumenta la rasterización tradicional con píxeles completamente generados. El rostro luego se anima mediante un nuevo modelo de NVIDIA Audio2Face-3D basado en la difusión que mejora el movimiento de los labios y la lengua. R2X puede conectarse a servicios de IA en la nube como GPT4o de OpenAI y Grok de xAI, y a microservicios NIM y AI Blueprints, como recuperadores de PDF o LLM alternativos, a través de marcos para desarrolladores como CrewAI, Flowise AI y Langflow.
AI Blueprints llegará a las PC
Los microservicios NIM también están disponibles para usuarios de PC a través de AI Blueprints, flujos de trabajo de referencia que pueden ejecutarse de forma local en PC RTX. Con estos proyectos, los desarrolladores pueden crear podcasts a partir de documentos PDF, generar imágenes impactantes guiadas por escenas 3D y mucho más.
El proyecto para PDF a podcast extrae texto, imágenes y tablas de un PDF para crear el guion de un podcast que puede ser editado por los usuarios. También puede generar una grabación de audio completa a partir de un guion utilizando voces disponibles en el proyecto o basadas en una muestra de voz de un usuario. Además, los usuarios pueden mantener una conversación en tiempo real con el presentador del podcast de IA para saber más sobre temas específicos.
El proyecto utiliza microservicios NIM como Mistral-Nemo-12B-Instruct para el lenguaje, NVIDIA Riva para la conversión de texto a voz y el reconocimiento automático del habla, y la colección de microservicios NeMo Retriever para la extracción de PDF.
El AI Blueprint para IA generativa guiada en 3D otorga a los artistas un control más fino sobre la generación de imágenes. Si bien la IA puede generar imágenes asombrosas a partir de simples indicaciones de texto, controlar la composición de imágenes usando solo palabras puede ser todo un reto. Con este proyecto, los creadores pueden utilizar objetos tridimensionales sencillos diseñados en un renderizador 3D como Blender para guiar la generación de imágenes de IA. El artista puede crear activos tridimensionales a mano o generarlos mediante IA, colocarlos en la escena y ajustar la cámara del visor 3D. A continuación, un flujo de trabajo preempaquetado con el microservicio FLUX NIM utilizará la composición actual para generar imágenes de alta calidad que coincidan con la escena tridimensional.
Los microservicios NIM y AI Blueprints de NVIDIA estarán disponibles a partir de febrero con compatibilidad inicial de hardware para las GPU profesionales GeForce RTX Serie 50, GeForce RTX 4090 y 4080, y NVIDIA RTX 6000 y 5000.