Os últimos meses têm sido recheados de lançamentos de modelos IA abertos, com capacidades cada vez mais incríveis e tamanhos relativamente reduzidos.
Será, portanto, de esperar que cada vez mais organizações olhem para o uso dos seus próprios modelos de IA como uma alternativa viável aos custos imprevisíveis dos grandes modelos de IA. A Trippz, uma empresa sedeada nos Países Baixos, é um caso interessante de estudo que merece ser partilhado.
O uso de IA na Trippz
Na Trippz o uso de IA começou a ser feito no final de 2024 e tem tido uma integração e expansão permanente. A IA serve para assistir a equipa em workflows que exigem processamento de uma elevada quantidade de documentos (em diferentes formatos e idiomas) assim como transformação desse conteúdos em dados complexos e estruturados.
Existem ainda tarefas programadas de monitorização de documentos, websites e geração automática de relatórios que são já quase 100% autónomas, geridas por IA.
Além disso, em 2025 a Trippz adoptou também o Claude Code, para a sua equipa de programadores.
Com a expansão das zonas geográficas cobertas pela empresa e necessidades crescentes de monitorização permanente, o custo da utilização de APIs de IA esteve sempre em crescimento contínuo.
A poupança drástica com modelos de IA abertos
Ao analisar os custos crescentes, quer com APIs quer com as licenças Claude Code, a equipa começou a procurar alternativas que fossem igualmente eficientes e mais económicamente viáveis.
As licenças e uso do Claude Code representavam cerca de 1200$ mensais, com o uso da API a atingir 2000-4000$ mensais, e sempre com tendência a subir. Isto representava um custo mensal de 3-5 mil dólares, dependendo do mês.
Após algumas semanas de experimentação, pesquisa e testes - tanto a nível de hardware como de modelos de IA - a equipa da Trippz encontrou uma solução ideal.
Como parte da infraestrutura da empresa, inclui-se agora um GPU (por enquanto, alugado) em território Europeu, nomeadamente um NVIDIA H200. O modelo Qwen3.5-27B foi a solução que melhor se adaptou às necessidades da empresa, tanto a nível de velocidade, qualidade e capacidades multi-modais.
Com esta solução, que representa um custo de 2mil dólares, a empresa começou logo a poupar entre 1-3mil dólares por mês, estando agora beneficiada por uso ilimitado da sua própria IA e sem preocupações de privacidade e partilha de dados.
A equipa de desenvolvimento continua a usar Claude Code mas ligado ao seu próprio servidor de IA, não sendo necessárias quaisquer licenças. A equipa relata ainda um aumento significativo de velocidade na leitura e geração de código, por uma redução pouco significativa de qualidade. Esta combinação de GPU e modelo consegue processar dezenas de pedidos simultâneos em paralelo e com contexto até 256K.
A opção do NVIDIA H200, um GPU bastante poderoso, foi feita com vista a uma crescente utilização das capacidades de IA para outras áreas, já que os custos mensais são fixos e o uso é potencialmente "infinito". Neste momento, a Trippz está com um projecto piloto com o OpenWebUI, para que todos os colaboradores possam substituir também a sua licença paga do ChatGPT.
Cada caso é um caso
Embora estes valores possam estar acima daquilo que muitas pequenas empresas gastam, convém mencionar que a IA local pode ter valores bem diferentes. Necessidades mais simples representam também hardware mais simples. Há inclusivé empresas que já estão a fazer testes com modelos pequenos no seu próprio hardware com GPUs "domésticas". Tudo depende da capacidade necessária do modelo, velocidade, paralelismo de processamento e os custos que se pretendem abater.
