IA generativa: claves para controlar y optimizar su coste

Si bien las posibilidades que se vislumbran para ChatGPT y la Inteligencia Artificial (IA) generativa son muchas, el alto coste que puede suponer para las organizaciones es un tema del que no siempre se habla. Sin embargo, es necesario profundizar para que controlar su coste.

Por lo general, son las grandes empresas como Microsoft, Meta y Google las que están invirtiendo grandes cantidades para desarrollar su ventaja tecnológica aprovechando la IA. No obstante, si el margen para las aplicaciones de IA es normalmente más pequeño que los márgenes del software como servicio, debido al alto costo de la informática, podría frenar el auge actual.

Incluso cuando el software está construido o entrenado, todavía requiere mucha computación para ejecutar grandes modelos de lenguaje porque hacen miles de millones de cálculos cada vez que devuelven una respuesta a un aviso. En comparación, servir aplicaciones o páginas web requiere mucho menos cálculo.

Estos cálculos también requieren hardware especializado. Si bien los procesadores tradicionales pueden ejecutar modelos de aprendizaje automático, son lentos. La mayor parte del entrenamiento ahora se lleva a cabo en procesadores de gráficos o GPU, que inicialmente estaban destinados a juegos en 3D, pero se han convertido en el estándar para las aplicaciones de Inteligencia Artificial porque pueden hacer muchos cálculos simples simultáneamente.

Modelos de entrenamiento de IA

Los analistas estiman que el proceso de entrenar un modelo de lenguaje como GPT-3 de OpenAI podría costar más de 4 millones de dólares. Los modelos de lenguaje más avanzados podrían multiplicar esta cifra.

Las organizaciones que construyen grandes modelos de lenguaje deben ser cautelosas porque cuesta mucho

El modelo LLaMA más grande de Meta lanzado el mes pasado, por ejemplo, usó 2048 GPU Nvidia A100 para entrenar en 1,4 billones de tokens (750 palabras son aproximadamente 1000 tokens), lo que llevó alrededor de 21 días.

Se necesitaron alrededor de un millón de horas de GPU para entrenar. Con precios exclusivos de AWS, costaría más de 2,4 millones de dólares. Y con 65.000 millones de parámetros, es más pequeño que los modelos GPT actuales en OpenAI, como ChatGPT-3, que tiene 175.000 millones de parámetros.

Las organizaciones que construyen grandes modelos de lenguaje deben ser cautelosas cuando vuelven a entrenar el software, lo que ayuda a mejorar sus capacidades, porque cuesta mucho.

Más uso, mayor pago

Para usar un modelo de aprendizaje automático entrenado para hacer predicciones o generar texto, los ingenieros usan el modelo en un proceso llamado «inferencia», que puede ser mucho más costoso que el entrenamiento ya que es posible que deba ejecutarse millones de veces al popularizarse.

Un producto como ChatGPT, que se estima que alcanzó los 100 millones de usuarios activos mensuales en enero, podría haberle costado a OpenAI 40 millones procesar los millones de mensajes que las personas introdujeron en el software ese mes.

Los costes se disparan cuando estas herramientas se utilizan miles de millones de veces al día. Los analistas financieros prevén que el chatbot Bing AI de Microsoft, que funciona con un modelo OpenAI ChatGPT, necesita al menos 4.000 mil millones de dólares en infraestructura para ofrecer respuestas a todos los usuarios de Bing.

Cómo podría cambiar

No está claro si la computación en Inteligencia Artificial seguirá siendo costosa a medida que se desarrolle la industria. Las empresas que fabrican los modelos básicos, los fabricantes de semiconductores y las nuevas empresas ven oportunidades en la reducción del precio de ejecución del software de IA.

Cada vez más empresas se centrarán en el desarrollo de modelos más pequeños y específicos para optimizar costes

Nvidia, que tiene alrededor del 95% del mercado de chips de Inteligencia Artificial, sigue desarrollando versiones potentes diseñadas específicamente para el aprendizaje automático, pero las mejoras en la potencia de los chips en toda la industria se han ralentizado en los últimos años.

Algunas empresas se han centrado en el alto coste de la IA como una oportunidad de negocio y cada vez más empresas se centrarán en el desarrollo de modelos más pequeños y específicos. Estos son más baratos de entrenar y operar, en lugar de los modelos de lenguaje que, como ChatGPT, consiguen atraer gran parte de la atención.

Mientras tanto, OpenAI anunció el mes pasado que está reduciendo el coste para que las empresas accedan a sus modelos GPT. Ahora cobra una quinta parte de un centavo por unas 750 palabras de producción.

Imagen inicial | Negative Space

Proofpoint inicia su programa global Proofpoint Partner Network

Westcon-Comstor y UiPath acelerarán el crecimiento de sus partners europeos en IA

ReeVo: “El canal es el eje sobre el que construimos todo nuestro modelo de negocio y crecimiento”

Trend Micro posiciona TrendAI para su negocio enterprise

Los proveedores cloud emergen y se especializan al calor de la IA

Los proveedores cloud emergen y se especializan al calor de la IA

Epson se asocia con DLL para ampliar su programa de leasing a nivel global

Applivery camina hacia un modelo 100% indirecto para impulsar su negocio

Legrand | AV refuerza su alianza con TD Synnex Maverick en Europa

Westcon-Comstor acuerda con Meter llevar su solución de redes empresariales al canal de EMEA

Proofpoint inicia su programa global Proofpoint Partner Network

Palo Alto: «Necesitamos partners que nos acompañen en nuestra transformación»

V-Valley abre una nueva edición de su programa de formación en IA para el canal

Devoteam consigue el nivel Diamante en el nuevo programa de partners de Google Cloud

Westcon-Comstor facilita a sus partners el impulso a clientes

Infinigate afianza sus 30 años de historia para avanzar en el negocio español

Westcon-Comstor adquiere el mayorista de ciberseguridad REAL Security

Ezratis, nueva marca de Exertis tras su adquisición por el grupo francés We.Connect

EET España roza los 40 millones de euros en 2025

El Simposium de Ingram Micro 2026 será el 21 de octubre

La UE impondrá un arancel en los envíos de compras online fuera de Europa

miMediaMarkt, el club de fidelización de MediaMarkt, cumple un año

ICP Pharma, logística que salva vidas

DIGI abre dos nuevas tiendas en Madrid y ya supera las 70 en toda España

El retail crece un 4% en ventas en España hasta septiembre de 2025

QNAP amplía la compatibilidad de Airgap+ a algunos switches

Virtual Cable se blinda con firmas digitales post-cuánticas

Solo un 37,2% de usuarios de Windows en España ha migrado a Windows 11

PNY pone a disposición del canal la gama NVIDIA RTX PRO Blackwell para IA profesional

Snom amplía su gama de terminales IP D8xx con tres nuevos modelos

Consultoría estratégica, un valor al alza en impresión

El negocio smartphone podría caer un 1% en 2026

Solo un 37,2% de usuarios de Windows en España ha migrado a Windows 11

El negocio TI europeo crecerá un 11% en 2026

La GenAI espera subidas del 76% para 2025

V-Valley abre una nueva edición de su programa de formación en IA para el canal

AUSAPE se consolida como centro formativo de SAP

Stormshield, comprometido con la educación en ciberseguridad

Cómo conseguir que la formación en ciberseguridad funcione

LG forma y certifica al canal en su plataforma de cartelería digital

Seidor, Altim o Deloitte, entre el ecosistema de excelencia de SAP

Virtual Cable se postula como la gran alternativa europea de Citrix y Horizon

OVHcloud ofrecerá servicios cloud soberano a instituciones educativas

DMI Computer regresa a Aslan 2026 con varios partners estratégicos

Nunsys se corona como partner del año de SonicWall

ReeVo: “El canal es el eje sobre el que construimos todo nuestro modelo de negocio y crecimiento”

ASUS: «Somos una marca profesional, estable y que viene para quedarse»

Kyocera: “Es el momento de potenciar las capacidades consultivas, de ir más allá del producto”

Exclusive Networks: “Garantizamos al canal una propuesta de servicio robusta, dinámica y rentable”

ICP Tech.Solutions: “Simplificamos toda la postventa, reducimos tiempos y aportamos control, eficiencia y una experiencia superior”

VASS nombra a Alfredo Ávila Responsable de ventas para Iberia

Pablo Collantes se pone al frente de WatchGuard en Iberia

Bitdefender nombra a Gianluca Meomartini Vicepresidente regional de ventas para el sur de EMEA

Boldyn Networks refuerza la estructura comercial en España

Enrique Lores se despide de 36 años en HP para ser CEO de PayPal

Cómo los partners de canal españoles pueden aprovechar la ola de la era de las redes de IA

Beneficio y confianza mutua, bases en la relación de Canon con sus Partners

Soluciones financieras para el canal, porque la ciberseguridad no puede detenerse

La seguridad de uno es la seguridad de todos

SOC como servicio, la alternativa de ciberseguridad avanzada

El valor del software cambia y puede dar más poder al MSP

El centro de datos: una palanca estratégica de negocio para el canal

El mercado TI reclama más especialización e impulso del negocio

Vender hardware ¿Cómo enfrentamos el gran reto de 2026?

¿Qué búsquedas se hacen en la IA?

Cómo asegurarte de que tu inversión en marketing está bien dirigida

Cuando el marketing no funcionó: cómo identificar los fallos más comunes y corregirlos

Las redes sociales siguen funcionando para atraer clientes

4 consejos para la fidelización del cliente

El peligro de las rutas grises en el envío de SMS

El valor del software cambia y puede dar más poder al MSP

Ya está aquí la Guía del Partner 2026: 10 años conectando al canal TI

El 2025 del canal TI, a ojos de las noticias de MuyCanal

El mercado de componentes tecnológicos en 2026: escasez de stock y subida de precio

Las cinco tendencias clave de la gestión empresarial de IA en 2026

Modelos de entrenamiento de IA

Más uso, mayor pago

Cómo podría cambiar

Más en muycanal

Suscríbete gratis a MuyCanal