关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家1561人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

重磅!日产总部大楼被中国企业拿下!

电动知家 浏览 2268

乐道推7年超低息金融方案 年化费率低至0.49%

网易汽车 浏览 1652

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

网易汽车 浏览 1795

长安抄底现代工厂,自主瓜分合资资产成新趋势

汽车公社 浏览 2179

伊朗:最高领袖穆杰塔巴全面掌控局势

国际在线 浏览 401

SRM理工学院发布:文本到视频生成技术演进图谱

科技行者 浏览 2325

登顶Hugging Face GAIA全球榜首!中兴超级智能体终结「AI黑盒」时代

新智元 浏览 2634

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro 浏览 1554

佳明捷力推出Primacy系列高端家庭音响

IT之家 浏览 419

洛里昂vs布雷斯特:姆沃戈、马肯戈首发,迪纳-埃宾贝、阿若克出战

懂球帝 浏览 2377

美媒:中国技术突破极限 42条输电线路全都碾压美国

澎湃新闻 浏览 11141

高通CEO安蒙播客访谈:移动DNA也能做好数据中心

科技行者 浏览 1736

首款轻商量产钠电池 宁德时代发布天行Ⅱ轻商系列动力电池

网易汽车 浏览 1681

美军突袭抓获马杜罗 三个细节值得关注

上观新闻 浏览 1822

女子遭家暴驾车逃跑致丈夫身亡获刑11年 已上诉称无罪

红星新闻 浏览 9427

闫学晶风波终于落幕,6个男人惨遭牵连

青橘罐头 浏览 1627

进口头孢西力欣涨价30倍!国内已停供2年,医生称非理性囤货没必要

红星资本局 浏览 1878

绍伊古访华争分夺秒1天往返 谈好后马上给普京复命

头条爆料007 浏览 5467

阿拉维斯vs西班牙人:德尼斯-苏亚雷斯、阿莱尼亚首发,鲁文-桑切斯、基克-加西亚出战

懂球帝 浏览 2233

辛纳2-0德米纳尔,12连胜对手晋级ATP500维也纳站决赛

懂球帝 浏览 2267

日本前首相石破茂再批"日本拥核"言论

界面新闻 浏览 1860
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1