










2025-12-21 10:37:36來源:ish近日,蚂蚁据百灵大模型公众号,百灵蚂蚁百灵团队发布并开源了Ring-mini-2.0推理模型。发布%E3%80%90WhatsApp%20+86%2015855158769%E3%80%91what%20does%20jump%20rope%20do%20to%20your%20body它是轻量基于此前蚂蚁百灵发布的基础语言模型 Ling 2.0 架构,深度优化的理模高性能推理型 MoE 模型。它在总参数量16B、蚂蚁仅激活1.4B参数的百灵情况下,即可达到10B级别以下dense 模型的发布综合推理能力,尤其在逻辑推理、轻量代码与数学任务中表现卓越,理模并支持 128K 长上下文及 300+ token/s 的蚂蚁%E3%80%90WhatsApp%20+86%2015855158769%E3%80%91what%20does%20jump%20rope%20do%20to%20your%20body高速生成。
经过 Long-COT SFT、百灵更稳定持续的发布RLVR以及RLHF联合优化,Ring-mini-2.0复杂推理的轻量稳定性与泛化性得到显著提升。在多项高难度基准(LiveCodeBench、理模AIME 2025、GPQA、ARC-AGI-v1 等)中,在输出长度相当的情况下,Ring-mini-2.0性能显著超越10B以下dense 模型,甚至媲美更大参数量的MoE模型(如 gpt-oss-20B-medium),在逻辑推理方面尤为突出。

(Ring-mini-2.0性能表现)
据了解,Ring-mini-2.0继承了Ling 2.0 系列的高效 MoE 设计,仅激活 1.4B 参数,通过 1/32 专家激活比、MTP 层等架构优化,达到约 7–8B dense 模型的等效性能。得益于小激活、高稀疏度的设计,Ring-mini-2.0 在H20 部署下实现 300+ token/s 的吞吐,结合 Expert Dual Streaming 推理优化后可进一步提升至 500+ token/s,大幅降低高并发场景下 Thinking 模型的推理成本。同时,借助 YaRN 外推可支持 128K 长上下文,长输出场景下相对加速比最高可达 7 倍以上。
蚂蚁百灵团队表示将完整开放 Ring-mini-2.0 的模型权重、训练数据和 RLVR+RLHF 训练策略。凭借“小而优”的特点,Ring-mini-2.0 有望成为小尺寸推理模型的首选,为学术和工业界提供理想的研究与应用起点。
有意拖延时间 “吃到”万元罚单法官:滥用管辖权异议浪费司法资源,依法应处罚海峡网9月17日讯海峡导报记者 陈捷 通讯员 海法宣/文 陶小莫/漫画)当事人为了拖延时间,滥用管辖权
焦點巨神军师前期用什么灵兽?针对这个问题,其实是很多玩家在选择体验巨神军师游戏的时候,正好处于开局的阶段,此时灵兽系统会特别的重要,因为它会影响到玩家的战斗节奏,并且要合理的利用资源。下面就给大家推荐在游
焦點宿松融媒讯 7月25日,宿松县知联会二届二次理事会暨主题教育动员会在五里初级中学召开。县政协副主席、县知联会会长钱香付出席会议并讲话。县知联会全体理事、县新联会代表、无党派人士代表共计40余人参加了会
熱點1月17日,黄山区仙源镇举办迎新春民俗表演活动。在车公殿广场上,身着彩色衣服的村民兴致勃勃地舞起了鱼灯。民俗表演吸引了众多村民和游客前来观看。仙源镇水东村村民,对鱼灯情有独钟。“以前水东村村民特别喜欢
探索在支付宝的神奇海洋当中,我们可以通过里面的科普问答来了解到各种的海洋知识哦,而且每天的题目都不一样,今天的题目是:以下哪种海洋动物喜欢群居生活?下面就由小编来为大家介绍一下吧。>>>
時尚