贝壳包 英文 DeepSeek开源周揭秘:API服务成本与收入公开,MaaS供应商互怼成焦点
2025-03-13 10:09:18发布 浏览24次 信息编号:108762
友情提醒:凡是以各种理由向你收取费用,均有骗子嫌疑,请提高警惕,不要轻易支付。
贝壳包 英文 DeepSeek开源周揭秘:API服务成本与收入公开,MaaS供应商互怼成焦点
图片/IC
在3月1日中午,北京时间,在“开源周”结束时在Zhihu上发布了一份文件,该文件不仅解释了首次披露API服务的成本,收入和理论利润率的关键成本和效率增强技术。但是,这也出乎意料地引发了两个为用户提供服务的MAA供应商之间的“匹配”,使国内AI Infra(人工智能基础设施)公司很少成为“瓜戏剧”的主角。
MAAS实际上是被翻译为模型的服务,是指将模型部署到企业方面,以向用户提供服务。在春季音乐节期间,当服务器忙碌时,许多大型基础设施公司从事MAAS服务,例如 和位于硅的移动设备,为用户提供了使用“完整版本”的机会。
关于这项服务, 的创始人Yang曾发表了一篇公开文章,称“用户在MAAS模型中越多,损失的损失就越多。”面对网民的疑问,您的公共成本和利润率,Yang发表了一篇文章来驳斥,曾经对公司的基于硅的流动性进行“辛辣评论”,并最终开始与基于硅的流动性Yuan 的创始人“争议”。从那以后,它扩展到了涉及卢钦技术的先前窃暴风雨,该风暴吸引了更多的圈子中的人来“结束”。
作为回应,中东会计董事长Chen Wei评论说:“企业家精神并不容易,创新并不容易,并且需要更具容忍度。偶尔判断技术偏差是正常的。” the final issue of " you lose money" in MaaS , Chen Wei told the News Beike , "This issue has the scope of pure , and the of AI Infra . It is that both the and seize the time to Infra, and seize the for daily users to rise."
展示盈利能力:一天$ 562,000,理论成本利润率为545%。
该事件发生在“开源周”结束时 - 以前曾表示,它将在2月24日开始发布“开源周”中的五个开源结果,但是在发布五个结果后的第六天,发布了“ -v3/r1推理系统概述”的第六天,宣布了“ -v3/r1推理系统的概述”,该概述宣布了模型选项系统降低成本的第一个优化细节。
本文重点介绍推理系统的优化目标:更大的吞吐量和较低的延迟,并详细介绍其解决方案:使用大规模跨节点专家并行性(/EP)。以一种共同的方式理解它类似于将AI模型分为多个“小专家”,并将其散布在不同的图形卡(GPU)上。就像多个厨师同时在餐厅准备菜肴一样,每位厨师只对他擅长的部分负责,而且整体用餐速度也更快。在V3系统中,每层有256个专家,但一次只使用8个专家,并且通过动态分配实现了有效的计算。
此外,当需要在不同的图形卡之间传输数据时,系统将允许像工厂管道一样同时进行计算和传输。例如,在生成文本时,第一部分仍在计算,并且后一部分已经开始传输,以避免通过“干燥和等待”浪费时间。
在这方面,元金岛评论说:“大规模部署的成本和收益的正式披露再次颠覆了许多人的感知。许多供应商现在无法实现此水平。主要原因是V3/R1体系结构与其他主流模型相差太多。遵循报告中描述的方法,以达到最佳效率。
一个可以使人们感觉到效率直觉的数据是,在本文结尾处,它显示了2月27日2月27日至12:00的一天,V3和R1推理服务在2月28日的12:00中占据了节点,并计算了包括网页,应用程序和APIS在内的所有负载。该计算表明,GPU租金成本为每小时2美元,总成本为87,000美元。如果根据R1的API定价计算消耗的(计算机电源评估单元),则每天的理论总收入为562,000美元,成本利润率为545%。
Zhihu的文章中披露了估计的成本,理论收入和利润率。图像来源:Zhihu屏幕截图
“这种成本和利润披露似乎似乎是坦率的,但实际上它隐藏了谋杀的意图。它告诉所有人:大型模型游戏的规则长期改变了。算法或仅仅ho积计算能力无法赢得大型模型。在算法 +数据 +数据 +计算能力的三个要素之间大型模型行业实际上是对三个头部和六个武器的技术解释,在东中国大惊小怪,踢了一个非常白色的宫殿,这也是对“计算能力 +智能”的真实描绘。陈·韦说。
值得注意的是,以前的重要信息是在X和等平台上发布的,并且该版本也登录到Zhihu,这立即引起了国内AI圈的热情。截至3月3日初,已发表的文章收到了7,735个赞和866条评论。
你杨被网民“命名”。 API服务是“损失”吗?
《北京新闻》的一名记者在本文的评论部分中注意到,许多网民“称您为Yang”,“观看乐趣并不重要”。关于 @Yang Yang Zhihu帐户的评论之一收到了475个赞,喜欢的数量是评论部分的第二高。
这是因为您杨之前曾发表过直言不讳的说:“ MAAS可能是短时间内中国最糟糕的商业模式。” “ R1的全血版本每天产量1000亿,然后每月的损失为4亿”,这引发了行业对MAAS商业模式的辩论。
您的屏幕截图Yang, ,Weibo的创始人
AI和云基础架构专家Zuo 说,您和YANG之间观点冲突的主要原因是对每台H800机器可以运行多少吞吐量的不同理解。
根据您Yang老师的访谈视频,四台机器的吞吐量为1k/s,而官方数据为每台机器14.8k/s,性能差距为14.8*4≈59次。不同的MAAS服务提供商可能会在同一机器上使用同一机器上的同一机器上的同一机器上的同一机器,一些MAAS服务提供者可以赚钱,这些货物的货币既可以造成了一些重要的货物,又有一些货物,而这些货物均可赚钱。 AI Infra的能力是。” Zuo 说。
关于网民的“名称”,Yang本人也发布了一条消息来响应。他认为,本文中的数据对MAAS成本没有太大的参考值,因为该文章将网页,应用程序和MAAS API的令牌数量添加在一起来计算,并且当大量用户将大量用户完全超载应用程序和网页时构建数据,而不是常规的MAA。
Beike 的记者发现,提到的545%的利润率更多地是指“理想情况”。它在官方文章中还指出:“当然,我们实际上没有太多收入,因为V3的价格较低,而付费服务仅占部分收入,并且晚上将有折扣。”
您杨强调,他没有贬值自己的模型功能,但他的经历很差。 “我在春节期间几次使用过它。我问了一个问题,说它很忙。我要求我稍后再试。我等了15分钟或一个小时。这不是合格的Maas产品。”
似乎为了证明他的观点,在发表响应文章后,Yang宣布 将在一周内停止提供API服务。
官方帐户的屏幕截图
在这方面,Zuo 告诉《北京新闻》贝克财务记者,您的观点是有道理的,但是“即使您考虑了资源保留,也就是说,545%的利润率除以2或3,它仍然是有利可图的,并且没有影响我提到的核心逻辑。”
两个MAAS供应商开始争论并引起窃“旧帐户”
此事的发展开始逐渐“漂移”。在回复网民之后,Yang在Zhihu上发布了另一篇文章,指出他在春季音乐节期间首次开始接管交通,并为用户提供了“全血服务”的基于硅的流程。他认为,该公司“牺牲了其员工在春节假期期间将华为的宣传绑定,吸引了的人们,并缓慢的API速度。”
作为回应,Yuan 在他的朋友圈子上进行了反击,并说:“我们的团队愿意努力抓住机会有什么问题?邀请用户邀请用户给您一些免费的优惠券有什么问题?在春季音乐节期间,当整个人都想参观但无法做到这一点时,我们提供了唯一的稳定服务。”同时,他还提到 以前窃了基于硅的流动。
这导致更多的人AI圈子参与其中。例如,Yang提到,窃事件中负责该守则的人是前 的前首席技术官Fang ,但后者发表了很长的文章来回应他的“责备”经历,称该法规在加入公司之前已经存在。
此外,You Team在2024年11月发布给 的公开信也被挖了。公开信提到:“ Cloud Power Cloud平台公开窃我们的业务模式和所有者的协议,侵犯了知识产权。” Yuan 转发了公开信,并写道:“这不是窃,它发生了很多次。”
Beike 记者注意到,尽管技术和基于硅的流动互相指控,但他们俩都与华为云合作,根据用户的国内计算能力来启动服务。宣布开源解决方案后,这些AI Infra公司是否可以从中繁殖和稀释成本的技术细节已成为测试公司技术实力的时候。
值得注意的是,尽管在过去一周中已经开了多个代码库,但其中大多数都针对芯片架构。在这方面,开发人员告诉Beike ,这些开源成就不能直接用于华为Cloud的推理服务中,但是可以从他们那里学到他们的想法。
目前,成本的透明度就像一面镜子,反映了AI Infra公司的理想和现实。如何更好地从解决方案中学习和控制公司成本可能是“打破僵局”的关键。毕竟,“指出”的理想利润率为545%。
随着技术股息逐渐消失,AI Infra公司需要回答更多的基本问题:他们是否应该继续倾向于计算电源租赁的价格战,还是应该通过模型优化,场景培养和生态整合来建立真正的障碍?这一争议可能只是一个前奏,并且正在重新编写该行业生存法。
记者的电子邮件地址:
Luo Yidan,北京新闻壳融资的记者
编辑Wang Jinyu
校对Liu
提醒:请联系我时一定说明是从奢侈品修复培训上看到的!