上海临港：对标GPT-4 商汤科技发布“日日新5.0”大模型_ 5G新基建_ 商业品牌网_ 中国商业品牌资讯门户

关闭

首页 > 品牌资讯 > 5G新基建 >

上海临港：对标GPT-4 商汤科技发布“日日新5.0”大模型

来源：商业品牌网 · 作者：上海临港 · 2024-04-25

昨天（4月23日）下午，“2024年商汤技术交流日”活动在临港新片区商汤人工智能计算中心举办，商汤科技发布行业首个“云、端、边”全栈大模型产品矩阵，以满足不同规模场景的应用需求，并且全新升级“日日新SenseNova 5.0”大模型体系，其综合能力全面对标GPT-4 Turbo，技术领跑加速生成式AI向产业落地的全面跃迁，实现大模型按需所取。

上海临港：对标GPT-4 商汤科技发布“日日新5.0”大模型

自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据，全新的“日日新SenseNova 5.0”（以下简称：日日新5.0）采用混合专家架构，推理时上下文窗口可以有效到 200K 左右。

本次更新主要聚集增强了知识、数学、推理及代码能力，全面对标 GPT-4 Turbo，主流客观评测上达到或超越 GPT-4 Turbo。

本次“日日新5.0”另一大核心指标就是多模态能力，商汤多模态大模型的图文感知能力达到全球领先水平，在多模态大模型权威综合基准测试MMBench中综合得分排名首位，在多个知名多模态榜单MathVista，AI2D，ChartQA，TextVQA，DocVQA，MMMU 取得领先成绩。

“日日新SenseNova5.0”在应用产品层面也实现了更卓越的多模态能力，支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展示，还具备丰富的多模态交互能力。

商汤还推出端云协同解决方案，可以通过智能化判断协同发挥端云各自优势，需要联网搜索或处理复杂场景时分流至云端处理，部分场景端侧处理占比超过80%，从而显著降低推理成本。

在本次技术交流日最后环节，商汤科技董事长兼CEO徐立还带来了三段完全由大模型生成的视频，并强调文生视频平台对于人物、动作和场景的可控性。

商汤科技在文生视频平台方面也取得了技术突破，未来，通过输入一段文字或一个完整的描述，就可以生成一段视频，而且人物的服饰、发型、场景都可以根据预先设定，保持视频内容的连贯性和一致性。

通过商汤打造的智能算力中心，可以不断赋能于大模型的训练，目前，日日新大模型体系在自然语言处理、视频生成和深度学习优化等多个方面取得创新。

【商业品牌网版权与免责声明】 本文资讯为广告信息，不代表本网立场！本网所刊登文章，若无特别版权声明，均来自网络转载；文章观点不代表本网立场，旨在为读者提供更多资讯，所涉内容不构成投资、消费建议，仅供读者参考，其真实性由作者或原供稿单位负责；如果您对稿件和图片等有版权及其它争议，请及时与我们联系，我们将核实情况后进行删除处理。联系邮箱：550706011@qq.com

品牌专栏合作

发现品牌故事

品牌推广

品牌百科

品牌推广

品牌会议

品牌推广

品牌标签

quot 中国贵州茅台品牌 2023 集团贵阳发布企业 2022 全球 2026 2024 创新国际活动上海亮相 2021 京东举办发展科技举行 AI 产业酒店智能贵州省

品牌展播查询

微信小商店

微信小商店

微信视频号

>