DeepSeek初度表现：表面本钱利润率545%！

　　DeepSeek开源周收官，DeepSeek以终末一弹，再次在AI江湖激起了层层荡漾。

　　3月1日，DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的著述，全面揭晓V3/R1 推理系统背后的要道秘籍。

　　最为引东谈主翔实的是，著述初度表现了DeepSeek的表面本钱和利润率等要道信息。据先容，假设GPU租出本钱为2好意思元/小时，总本钱为87072好意思元/天；要是总共tokens一齐按照DeepSeek R1的订价规划，表面上一天的总收入为562027好意思元/天，本钱利润率为545%。

　　最猛进度优化推理系统，表面本钱利润率高达545%

　　据著述先容，DeepSeek-V3/R1推理系统的优化主张是更大的蒙眬、更低的蔓延。为了结束这两个主张，DeepSeek使用了大范围跨节点众人并行（Expert Parallelism / EP）的秩序，并通过一系列时代战略，最猛进度地优化了大模子推理系统，罢明显惊东谈主的性能和后果。

　　具体而言，在更大的蒙眬的方面，大范围跨节点众人并行能够使得batch size（批尺寸）大大增多，从而提高GPU矩阵乘法的后果，提高蒙眬。

　　batch size在深度学习中是一个出奇遑急的超参数，指模子在本质经过中每次使用的数据量大小。它决定了每次模子更新时使用的本质样本数目，休养batch size不错影响模子的本质速率、内存破钞以及模子权重的更新情势。

　　在更低的蔓延方面，大范围跨节点众人并期骗得众人散布在不同的GPU上，每个GPU只需要规划很少的众人（因此更少的访存需求），从而裁减蔓延。

　　然而，由于大范围跨节点众人并行会大幅增多系统的复杂性，带来了跨节点通讯、多节点数据并行、负载平衡等挑战，因此DeepSeek在著述中也重心评释了使用大范围跨节点众人并行增大batch size的同期，若何瞒盛传输的耗时，若何进行负载平衡。

　　具体来看，DeepSeek团队主要通过范围化跨节点众人并行、双批次重复战略、最优负载平衡等情势，最大化资源利用率，保证高性能和踏实性。

　　值得督察的是，著述还表现了DeepSeek的表面本钱和利润率等要道信息。据先容，DeepSeek V3 和R1的总共工作均使用英伟达的H800 GPU，由于日间的工作负荷高，晚上的工作负荷低，DeepSeek罢明显一套机制，在日间负荷高的时候，用总共节点部署推理工作。晚上负荷低的时候，减少推理节点，以用来作念究诘和本质。

　　通逾期刻上的本钱欺压，DeepSeek示意DeepSeek V3和R1推理工作占用节点总数，峰值占用为278个节点，平均占用226.75个节点（每个节点为8个H800 GPU）。假设GPU租出本钱为2好意思元/小时，总本钱为87072好意思元/天；要是总共tokens一齐按照DeepSeek R1的订价规划，表面上一天的总收入为562027好意思元/天，本钱利润率为545%。

　　不外，DeepSeek也强调，内容上的收入好像并莫得那么多，因为V3的订价相较于R1要更低，另外夜间还会有扣头。记者督察到，2月26日，DeepSeek在其API绽放平台发布错峰优惠行径奉告。字据奉告，北京时刻逐日00:30-08:30为错峰时段，API调用价钱大幅下调，其中DeepSeek-V3降至原价的50%，DeepSeek-R1降至25%。DeepSeek饱读舞用户在该时段调用，辉煌策略享受更经济更流通的工作体验。

　　字据模子价钱细节，在圭臬时段（北京时刻08:30-00:30），V3和R1的百万tokens输入（缓存射中）价钱分辩为0.5元和1元，百万tokens输出分辩为8元和16元，R1均为V3的两倍。而在优惠时段（北京时刻00:30-08:30），V3和R1的百万tokens输入（缓存射中）则均降为0.25元，百万tokens输出均降为4元。

　　开源周告一段落，更多惊喜好像还在路上

　　跟着终末一枚“重磅炸弹”的发布，DeepSeek的开源周行径崇拜告一段落。

　　在往时的一周里，DeepSeek每天开源一个代码库，堪称公开了一个“时代全家桶”。业内东谈主士分析，这一系列的时代组件看似寥寂，实则共同构建成了一套精密协同的系统，让DeepSeek在有限算力之下最猛进度地“榨干”了GPU，罢明显本质推理后果的大幅普及。

　　记者督察到，在DeepSeek今天发布“终末一弹”的帖子下，不少海外网友抒发了赞美。举例，又名网友示意，到第七天，DeepSeek好像还会发布AGI（通用东谈主工智能，东谈主工智能的最高主张）；另外又名网友示意，“这即是为了正确的情理作念正确的事情，你们十足是听说，鞠躬请安”；还有网友计算，DeepSeek自在公布这些信息，证据他们内容上依然达到了杰出的水平，内容的时代智力可能更高。

　　不仅如斯，还有网友将DeepSeek与OpenAI进行对比，示意：“‘本钱利润率545%’，等一下，是以你是说我被OpenAI劫夺了？”

　　与DeepSeek的开源、免费比较，OpenAI的模子收费一直十分不菲。就在2月28日，OpenAI崇拜发布最新模子GPT-4.5究诘预览版，这是一款堪称“情商最高”的通用大谈话模子。关联词，其高达每100万tokens输入75好意思元的API调用价钱，比较GPT-4o的2.5好意思元暴涨了30倍，比较DeepSeek的泛泛价钱，GPT-4.5输入价钱更是达到了惊东谈主的280倍。

　　事实上，GPT-4.5发布后，很多网友已在评述区吐槽订价太贵。而OpenAI的CEO山姆·奥特曼也承认，GPT-4.5是一个“高大且不菲的模子”。“咱们原来出奇但愿同期向Plus和Pro用户推出它，但跟着咱们的范围发展壮大，咱们依然耗尽了GPU资源。咱们将不才周增多数万块GPU，然后将其推出给Plus层级的用户。”奥特曼在其个东谈主酬酢平台上示意。

　　看成大模子畛域的“鲶鱼”，DeepSeek如合并名初出茅屋、聪惠而锐气的年青东谈主，捏续地给行业的老玩家及巨头们带来压力。最近，据外媒骄横，DeepSeek正在加快研发DeepSeek-R2推理模子，这一模子原缱绻本年5月发布，但好像会提前，新模子有望不错生成更好的代码，而况使用英语以外的谈话进行推理。

　　从V3到R1配资股票，再到行将面世的R2，外界对DeepSeek充满了期待，DeepSeek也以捏续的时代冲破惊艳天下。开源周天然暂时罢明显，但更多的惊喜，好像还在路上。

让建站和SEO变得简单

网上配资