关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家1562人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

还有反转?上周五“精准做空”引发全市场关注,神秘交易员再度开出1.6亿美元空单

华尔街见闻官方 浏览 2650

真爱大牌 || 用了5年才敢说,多亏它帮我守住了发际线

黎贝卡的异想世界 浏览 2082

赛力斯今日成功在香港主板上市 张兴海:开拓中国高端车全球新赛道

证券市场周刊 浏览 2324

媒体:日本挖到"稀土"想刺探中方反应 中方回一句单句

新民周刊 浏览 5372

新年强势开局!AI需求叠加供给趋紧,存储芯片迎来集体反弹

华尔街见闻官方 浏览 1756

华为鸿蒙 HarmonyOS 6.0.0.107 SP7 / SP5 Developer 版本发布

IT之家 浏览 2563

一天4瓜!个个离谱

阿纂看事 浏览 2622

惨!拍完被雪藏8年,李幼斌耗资1亿拍战争大片,没上映就被判死刑

靠谱电影君 浏览 2290

布兰特多特队友最佳阵:罗伊斯、哈兰德在列,贝林厄姆入选

懂球帝 浏览 10

零跑造豪车,“优衣库”依然是朱江明最坚硬的铠甲

雪豹财经社 浏览 2559

新年第一周,省委书记密集提出新要求!

国是直通车 浏览 1906

长安汽车辟谣“取消年终奖”,或发4.3月薪+3000

盖世汽车 浏览 1788

人均预期寿命提高至80岁,失能老人如何有尊严地活着?两会代表委员建言:服务不能“一刀切”

时代周报 浏览 1142

真爱大牌返场|| 一上线就被抢空的牌子,这次居然100+就能拥有

黎贝卡的异想世界 浏览 2348

机械师Mini GTR迷你主机上新:锐龙AI 9 HX 370配置,性能释放70W

IT之家 浏览 2282

卡塔尔首相与法国总统举行会谈 重点讨论加沙局势

上观新闻 浏览 2509

小S曝具俊晔现状:因太思念大S,没法正常生活

比利 浏览 2542

卫星图像首次发现:伊朗两处受损核设施有"重大活动"

澎湃新闻 浏览 5606

“过年红”就这么穿,真不俗!

Yuki女人故事 浏览 1559

嫁给汪涵17年,细扒杨乐乐心酸现状,她的选择真的对吗?

不八卦会死星人 浏览 2717

美媒:泽连斯基未拒绝领土问题 要求提供更多细节

环球时报国际 浏览 7167
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1