深度评测|巴西市政IT公司开源Rio 3.5 397B:百万上下文+MIT协议的"黑马"大模型实战评测
2026-06-15 AI-Pick - 精选AI工具导航 已浏览3次2026年6月14日,一个谁也没听说过的名字——巴西里约热内卢市政府旗下的IT公司IplanRIO——在AI社区投下了一颗重磅炸弹。他们开源的Rio 3.5 Open 397B模型,在多项基准测试中杀入全球第一梯队,震惊了整个AI圈。
一、模型核心参数
Rio 3.5 Open 397B 基于阿里通义千问 Qwen 3.5 397B 进行后训练,采用混合专家架构(MoE),总参数量397B,激活参数17B。最大的亮点是其1,010,000 tokens(约100万)的上下文窗口——这意味着它可以一次性处理相当于数百页文档的内容。
更令人意外的是,这款模型采用了MIT开源协议,完全开放,可用于商业和研究用途。HuggingFace联合创始人Clem Delangue评价称:"这个事件表明,AI的未来可以是去中心化的,任何人都有机会参与其中。"
二、核心技术创新:SwiReasoning推理框架
Rio 3.5最值得关注的技术创新是其内置的SwiReasoning推理框架。这是一种免训练的推理优化方案,能在显式推理(思维链CoT)和潜空间推理之间动态切换。具体来说:
- 显式推理模式:适合数学证明、逻辑推理等需要可解释性的场景
- 潜空间推理模式:适合代码生成、文本理解等对速度要求更高的场景
- 动态切换机制:通过基于熵的置信度信号自动选择最优推理路径,在提升准确率的同时大幅提高token效率
这一技术创新让Rio 3.5在编程Agent和数学推理等场景中的表现尤为突出。
三、基准测试表现
根据公开的基准测试数据,Rio 3.5 Open 397B在以下领域达到了开源模型的最先进水平(开源SOTA):
| 测试领域 | 表现 |
|---|---|
| 智能体编程(Agent Coding) | 超越Qwen 3.7 Plus,接近GPT-5.5水平 |
| 数学推理(Math) | 开源SOTA,与闭源顶级模型持平 |
| 多语言能力 | 支持数十种语言,涵盖葡萄牙语、英语、中文等 |
| 指令遵循 | Agent任务完成率表现优秀 |
值得注意的是,本周还有另一个基于Qwen 3.5-397B-A17B构建的模型——Nex-N2-Pro 397B同样跻身前沿水平,显示Qwen 3.5作为基座模型的优秀"可塑性"。
四、使用建议
目前模型已上传到HuggingFace(搜索"prefeitura-rio/Rio-3.5-Open-397B"即可下载),SwiReasoning技术的论文也已在arXiv公开(2510.05069)。对于开发者和研究者来说,这是一个极具研究价值的开源模型——既能体验到接近GPT-5.5的性能水平,又能通过MIT协议自由进行二次开发和商业应用。
适用场景:复杂编程Agent开发、长文档理解与分析、多语言应用构建、学术研究。
