关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家1560人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

韩国首部限制级被禁,前后修改3次

陈意小可爱 浏览 2664

燕翔:A股上市公司增减持特征与近况

首席经济学家论坛 浏览 2567

国内油价今年第七涨重返9元时代 国际油价居高不下

上观新闻 浏览 1029

美国团队研发新型机器人:可变换数百种形状,还能征服复杂地形

IT之家 浏览 2454

活塞108-105险胜太阳,阿伦空砍33分,活塞关键时刻连丢罚球

懂球帝 浏览 1795

4月五菱汽车全球销量11.67万辆 海外出口首破3万

网易汽车 浏览 387

北京自闭症男童苍山走失身亡 父亲1周7天扎在单位加班

红星新闻 浏览 7194

以数字化锻造发展引擎!财信证券书写“五篇大文章”

券商中国 浏览 2692

卖零食的,上市首日暴涨88%!股价400港元,合理吗

财通社 浏览 1678

北京大学联合多所知名高校突破机器人视角转换技术

科技行者 浏览 2285

希瑞发布智能戒指 “全天候”健康生态野心初显

环球网资讯 浏览 2475

端网深度协同,中国移动5G-A超级上行刷新移动直播体验

环球网资讯 浏览 5

演员黄璐将惊喜现身明日艺术影院映后❤️

幕味儿 浏览 1967

重磅!日产总部大楼被中国企业拿下!

电动知家 浏览 2265

网友600多买天津飞北京机票 中转成都30多个小时游玩

极目新闻 浏览 7059

AI眼镜厂商,正在集体拒交“智商税”

钛媒体APP 浏览 2086

马杜罗不认罪称"被绑架""仍是总统" 外交部回应

环球网资讯 浏览 6495

或为增程形式 上汽大众ID.ERA轿车谍照曝光

车质网 浏览 595

U20世界杯4强出炉

体坛周报 浏览 2587

郑智化发声道歉!坦言自己情绪上头用词不当

萌神木木 浏览 2451

车企增收不增利,钱到哪儿去了

帮宁工作室 浏览 1731
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1