本文来源:时代财经 10月14日,蚂蚁集团正式上线Ring-1T万亿参数思维模型,并彻底开放了模型的权重和训练配方。据报道,Ring-1T 在 Arena-Hard V2“人类偏好对齐”测试中以 81.59 的成功率排名开源模型第一,接近 GPT-5-Thinking (High) 的 82.91 分数。在Ring-1T 9月30日开源预览的基础上,Ring-1T继续扩展其大规模可验证奖励强化学习(RLVR)训练,以进一步激发万亿级自然语言推理能力,通过RLHF训练提升整体模型能力,并在各种任务列表上实现更均衡的表现。 (时代财经 陈 摄)
特别提示:以上内容(包括图片和视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供形成存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。
每日更新