TradingKey - 从卷资本支出、卷晶片数量到卷成本,AI大模型竞赛现在正在接受货币化能力的考验。在美国科技巨头仍在烧钱搞AI之际,DeepSeek模型公布了日赚三百多万人民币、利润率超500%的惊人成本利润细节。
3月1日周六,DeepSeek团队在知乎平台上发布了《DeepSeek-V3/ R1推理系统概览》,透露了该公司大模型的成本和收益情况。这是首家披露成本结构的大模型开发公司。
据介绍,在DeepSeek统计的最近24小时内(北京时间2月27日12:00至2月28日12:00),该公司运营V3和R1的GPU租赁成本为87072美元(约350万人民币),若所有tokens按照R1模型的定价计算,理论上一天的总收入为562027美元,成本利润率高达545%。
按年算,DeepSeek公司的年收入预计为2亿美元以上。
不过,DeepSeek也补充道,实际上并没有这么高的收入,因为V3定价更低,且收费服务只占一部分,夜间也会有折扣。
DeepSeek V3和R1所有服务均使用H800 GPU,使用和训练一致的精度。这种晶片的性能远不及OpenAI和其他美国科技巨头训练AI所使用的晶片,而DeepSeek却以更低的价格开发了性能相当的AI模型。
公司称,DeepSeek V3/ R1推理系统的优化目标是更大的吞吐量、更低的延迟。为此,DeepSeek的方案时使用大规模跨节点专家并行(专家并行/EP):
按照DeepSeek公布的成本利润情况,有投资专家表示,在美国的话,DeepSeek应该是一家估值100亿美元的公司。