商汤2024年报技术透视：训推效能显著提升，“大装置-大模型-应用”实现商业价值闭环

2025-04-07 12:07:00

3月26日，商汤发布2024年全年业绩财报。2024年，商汤集团的总体收入同比增长10.8%，达到37.7亿元人民币；其中，生成式AI收入突破24.0亿元人民币，同比增长103.1%，这是生成式AI连续两年保持三位数增速，已成为集团最大业务。

大模型面世两年多时间以来，从前期的一味追求大模型Scaling Law，到如今算力效率、训练转推理，应用落地等被接连质疑，大模型已经全面来到新的发展阶段。

这是产业逐步成熟的标志，但同样也在堆叠算力之外，对工程技术以及场景协同能力提出了更高的要求。

在众多传统大模型厂商之外，作为第一代“AI原生”企业，商汤在AI基础设施上的投入早于几年前便开始布局，此后战略升级为“大装置-大模型-应用”的三位一体核心战略，而这一战略正显现出其在AI产业的前瞻性。

“大装置”是指商汤的AI基础设施，为大模型提供强大的算力支撑，大模型驱动技术创新，应用端推动AI商业化落地——过去三年，商汤已经形成了“大装置-大模型-应用”三者协同的良性生态闭环，赋能千行百业。

我们看到的是，历经过多次技术周期起伏，商汤的技术积淀正迎来爆发。

01 有算力、懂算力

2024年5月，国内权威大模型测评机构SuperCLUE榜单出炉。商汤“日日新5.0”(SenseChat V5)的中文基准测评结果排名第一，以总分80.03分的成绩刷新国内最好成绩，并且在中文综合成绩上超越GPT-4 Turbo，这是国内大模型首次在SuperCLUE中文基准测试中超越GPT-4 Turbo实现登顶。

之所以能够斩获如此成绩，与商汤在AI基础设施上的提早布局至关重要。

众所周知，2024年以来，全国智算中心的建设高速推进。从训练到推理，算力的资源属性愈发显现，而且市场仍面临算力资源分散且标准不统一、使用起来效率不高的问题。

商汤正是针对这一痛点，布局算力运营，将不同标准的卡连接起来，适配不同需求，满足不同类型的客户。

商汤科技董事长兼CEO徐立认为，一些科技巨头的重心在于自己的生态，包括自研芯片和云平台等，但当下AI领域要抢占先机，什么资源更快更好用就先用起来，不局限于一家的产品和平台，“商汤提供的基础服务更贴近AI发展现状。”

过去三年，商汤持续投入建设AIDC基础设施。据悉，商汤自持的全国首个5A级智算中心——上海临港AIDC，通过运营模式将算力规模提升至了23,000PetaFlops。

通过与大模型迭代的联合调优，商汤大装置的目标是成为“最懂大模型的AI基础设施”，不仅服务于日日新大模型的训练与推理，还服务于包括互联网、金融、能源等成熟行业，还拓展性服务了具身智能、AIGC、AI4S（AI For Science）等高潜行业的客户。

徐立曾表示，商汤是最懂模型的算力服务商，最懂算力的模型服务商。

02 三位一体

算力只是生态其中一环。大模型产业能够高效运转，还需要靠上下游协同发力。

“今天人工智能的商业模式不管是训练模型，还是用模型对外服务，本质意义上都是在消耗资源，付的是资源的费用。所有的商业模式最后都和计算资源消耗划了一个等号，就是通过‘三位一体’，把资源以最有效的方式整合使用起来。”徐立表示。

“三位一体”是2024年10月商汤确立的战略方向，是商汤以大装置作为AI基础设施为底座，实现“大装置-大模型-应用”三位一体、联合优化的战略。

算力与模型的双向优化，进一步提升了大模型的训练和推理效率。在提升训练效率方面，商汤通过采用自动化多维并行策略显著提升了训练效率，并且实现了FP8混合精度训练，特别是对类似于DeepSeek的优秀第三方开源模型，大装置做到高于官方报告的训练效率，形成行业标杆。

在提升推理效率方面，商汤的推理系统进行低比特量化推理，支持开源vLLM及自研lightLLM双推理引擎，以DeepSeek R1为例，商汤的推理吞吐性能比业界头部厂商高15%以上。通过模型蒸馏技术、键值缓存、PD（Prefill-decode）分离、多模态信息压缩等技术，商汤在基本保持模型性能的前提下将推理成本压低了一个数量级。

因此，即使是同样一个模型，在不同的算力底座上，会有完全不同的训练及推理效率。

随着向生成式AI演进的稳步推进，“三位一体”进一步整合了商汤的资源优势，使其在大模型时代的内卷竞争中打出差异化。

商汤科技日日新大模型重点打磨生产力工具与交互工具两个方向的应用与产品。生产力工具直接为企业办公、金融、政务等场景提高生产效率，以订单金额为代表的客户付费意愿较2023年增长6倍；交互工具通过2B2C的方式赋能业务伙伴，提升用户体验，满足智能陪伴、智能硬件交互、智能营销等多场景需求，月均用户使用量较2023年增长8倍。

日日新大模型在保持领先的市场应用占有率和客户服务粘性的基础上，在模型技术上始终保持领先的位置。2023年4月商汤首次推出商汤日日新SenseNova大模型体系，至2024年7月完成5大版本迭代。其中，2024年7月发布的日日新5.5版本在多模态能力上显著提升，为国内首个对标GPT-4o的多模态实时交互大模型，实现语音、视频和语言模型的原生融合。值得期待的是，商汤日日新6.0将于2025年4月10日发布，性能预期对标Gemini 2.0 Pro。

此外，基础设施搭建好后，商汤同样及早布局应用。