Modelo Rio 3.5 Open 397B, desenvolvido pela IplanRio, foi liberado em código aberto e gerou debate sobre soberania tecnológica.
A prefeitura do Rio de Janeiro deu um passo pouco comum entre administrações públicas brasileiras ao publicar, em código aberto, um modelo próprio de inteligência artificial de grande porte. O Rio 3.5 Open 397B foi disponibilizado pela IplanRio, empresa de tecnologia da administração municipal, com pesos abertos e licença permissiva do tipo MIT, o que permite que qualquer desenvolvedor ou instituição utilize, modifique e adapte a tecnologia livremente. O anúncio colocou uma estatal municipal em um campo até então dominado por gigantes como OpenAI, Google, Alibaba e DeepSeek, levantando uma pergunta que interessa diretamente ao cidadão carioca: o que essa tecnologia muda na prática para os serviços públicos da cidade?
Segundo a Exame, o projeto não começou do zero. O Rio 3.5 foi pós-treinado a partir do Qwen 3.5 397B, modelo aberto desenvolvido pela Alibaba, em um processo de adaptação e refinamento conduzido pela equipe técnica da IplanRio. À frente da iniciativa estão João Cabaretta, diretor-presidente da empresa, e Rafael Coelho, cientista-chefe do projeto. A abertura dos pesos por uma empresa de tecnologia municipal é um movimento raro no cenário global e cria um precedente para outras administrações que avaliam desenvolver soluções próprias de inteligência artificial em vez de depender exclusivamente de fornecedores privados internacionais.
Entender os detalhes técnicos do projeto, os números de custo divulgados e os limites dessa comparação com outros modelos ajuda a separar o que já é fato confirmado do que ainda precisa de validação independente.
Como funciona o modelo Rio 3.5 e por que ele chama atenção
O repositório do Rio 3.5 reúne cerca de 807 gigabytes distribuídos em 97 arquivos de pesos, com arquitetura conhecida como Mixture-of-Experts, totalizando 397 bilhões de parâmetros, dos quais cerca de 17 bilhões são ativados a cada token processado. Essa arquitetura é relevante porque permite reduzir significativamente o custo operacional do modelo, já que nem todos os parâmetros são acionados simultaneamente durante o processamento de cada solicitação, tornando a inferência mais eficiente em termos de capacidade computacional exigida.
De acordo com a Exame, a equipe da IplanRio gastou R$ 500 mil no desenvolvimento da primeira geração da plataforma, valor descrito como cerca de 30 vezes menor do que custaria adquirir um sistema de inteligência artificial “de prateleira” equivalente no mercado. Um valor específico para o desenvolvimento da versão 3.5, lançada em junho, ainda não foi divulgado pela empresa. A linhagem do projeto começou em abril de 2026, quando a prefeitura apresentou a plataforma Rio 3 Open, uma família de seis modelos de linguagem construída a partir do Qwen, durante o III Ciclo do Sandbox.Rio, programa municipal voltado a testar tecnologias emergentes antes de sua adoção em larga escala.
A melhora de desempenho divulgada pela equipe técnica aparece em benchmarks, testes padronizados usados para comparar diferentes modelos de inteligência artificial em tarefas específicas. Esses testes ajudam a medir desempenho relativo, mas não funcionam como prova definitiva de superioridade absoluta, já que o resultado depende do tipo de tarefa avaliada, da configuração utilizada no momento do teste e da possibilidade de outros pesquisadores reproduzirem o experimento de forma independente.
Os limites técnicos da comparação com outros modelos de IA
O avanço de desempenho reivindicado pela equipe da IplanRio vem de duas etapas distintas. A primeira é o próprio pós-treino sobre a base do Qwen, processo que ajusta um modelo já existente para melhorar suas respostas em tipos específicos de tarefa. A segunda etapa envolve uma técnica chamada SwiReasoning, que altera a forma como o modelo organiza seu processo de raciocínio antes de gerar uma resposta final. Em uma discussão registrada na plataforma Hugging Face, repositório onde modelos de inteligência artificial aberta são compartilhados, um integrante do projeto detalhou que, no teste IMOAnswerBench, o Qwen original pontuava 80,9. Com o treino adicional aplicado pela equipe carioca, essa pontuação subiu para 84,5, e com a camada de raciocínio latente ativada, chegou a 89,5.
Esse detalhe é importante porque parte significativa do ganho de desempenho atribuído ao Rio 3.5 depende justamente dessa camada extra de raciocínio, recurso que não está disponível em todas as ferramentas usadas para executar modelos de inteligência artificial no dia a dia. Programas amplamente utilizados para esse fim, como o llama.cpp, não implementam esse tipo de funcionalidade, o que significa que o ganho de desempenho divulgado pode não se repetir da mesma forma em todos os ambientes de uso.
Outro ponto técnico que ainda gera dúvida é a janela de contexto do modelo, ou seja, a quantidade de informação que ele consegue processar de uma só vez. A configuração efetiva aparece registrada como 262 mil tokens, enquanto o anúncio oficial menciona a possibilidade de alcançar 1 milhão de tokens com técnicas adicionais de escalonamento, uma diferença que ainda carece de esclarecimento por parte da equipe responsável. Diante desses fatores, a leitura mais cautelosa sobre o lançamento não é a de que o modelo municipal tenha superado de forma definitiva os grandes laboratórios globais de inteligência artificial, mas sim a de que a prefeitura colocou no ar uma solução de grande escala, com licença aberta, cujos resultados ainda precisam ser testados de forma independente pela comunidade técnica internacional.
O que essa iniciativa representa para a soberania tecnológica do Rio
Independente da validação externa dos benchmarks divulgados, o lançamento do Rio 3.5 tem peso institucional relevante para o debate sobre soberania tecnológica no Brasil. A iniciativa recoloca em discussão temas como controle de dados públicos, custo de infraestrutura computacional e o nível de dependência de plataformas privadas estrangeiras na construção de políticas públicas baseadas em inteligência artificial, um debate que já vinha ganhando força em outras frentes da administração municipal.
O Rio de Janeiro tem investido em outras iniciativas paralelas voltadas à área de inteligência artificial, incluindo parcerias com empresas privadas para uso de agentes digitais na organização de dados da saúde pública municipal e a articulação do projeto Rio AI City, que prevê a instalação de um complexo de data centers na região do Parque Olímpico, na Barra da Tijuca, com investimentos previstos ao longo da próxima década. Esse conjunto de ações posiciona a cidade entre as administrações brasileiras que mais avançaram, ao menos no campo dos anúncios públicos, em direção a uma estratégia própria de inteligência artificial.
Para o cidadão comum, o impacto direto dessas iniciativas ainda está em fase inicial, já que a aplicação prática do Rio 3.5 em serviços públicos específicos não foi detalhada no anúncio. O fato concreto, até o momento, é a existência de um modelo aberto, de grande escala, desenvolvido com recursos relativamente modestos em comparação ao mercado, e disponível para uso por universidades, pesquisadores e desenvolvedores interessados em testar suas capacidades de forma independente.
Fonte consultada: Exame (https://exame.com/inteligencia-artificial/prefeitura-do-rio-lanca-ia-propria-e-supera-outros-modelos-em-analises-de-desempenho/).
Autor: Diego Rodríguez Velázquez
