金融界4月24日消息,商汤集团今日在香港港交所暂停交易,暂停交易前上涨31.15%。对于暂停交易一事,商汤集团回应表示,“昨日日日新大模型5.0 发布会受到市场极大关注;依照上市规则及港交所建议,公司将进一步刊发相关公告,敬请关注。”
商汤科技昨日发布日日新5.0大模型,采用MOE混合专家架构,基于超过10TB tokens训练,大量合成数据,推理上下文窗口200K,强调知识、推理、数学、代码能力可达到或超越GPT-4。
商汤科技表示,这是行业内首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求。公司技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。商汤科技董事长兼CEO徐立表示,在尺度定律(Scaling Law)的准则下,商汤持续推动自身大模型研发,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。
昨日在技术交流日活动现场,商汤原创打造的文生视频生成平台首次亮相,聚焦为用户提供可控的文生视频创作体验。徐立展示了三段完全由大模型生成的视频片段,充分展现了商汤文生视频技术对人物、动作和场景的高度可控性。
去年4月10日,商汤首次公布“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”,参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。
2023年7月、8月以及今年1月,日日新大模型升级到2.0、3.0版本以及日日新V4.0,“商量”2.0和小模型商量S版(SenseChat S)等不同参数量级模型版本页同时发布,可适配移动端等不同终端及场景的应用需求。新的日日新V4.0通过提高训练数据的质量以及实现基础语言能力的显著提升,在代码编写、数据分析、医疗问答等多个场景中达到与GPT-4相匹配的能力,同时还开源对应7B和20B的两种参数基模型。
最新2023年报显示,去年基于商汤生成式AI收入达到12亿元人民币,实现200%的飞速增长;同时,商汤大模型基础设施大装置SenseCore总算力规模突破性增长至12000 petaFLOPS,运营GPU数量达4.5万卡,其中国产算力2000P,已完成58款国产芯片适配和应用;另外,生成式 AI 业务中超过70%的客户在过去12个月内是商汤的新客户,剩下30%的存量客户的客单价也录得约50%的增速,截至3月,订单金额超过千万人民币的客户数已达到数十家,日日新赋能C端的调用量实现近120倍的增长。