AI观察|从万元到百万元,DeepSeek一体机江湖混战
创始人
2025-05-13 08:17:26

DeepSeek爆火让模型平权,今年以来,市面上的DeepSeek一体机可谓五花八门,有的声称可以“跑满血”,有的称可以运行70B、32B模型;有的是量化版本,有的是全精度版本;价格也是相差甚远,从几万元到上百万元都在售卖。

澎湃科技记者日前调查发现,目前DeepSeek一体机市场鱼龙混杂、打营销擦边球,降低性能就有套利空间,这也是为什么有人发现买回来的一体机变“笨”了。只要对模型进行量化或蒸馏,使用阉割版的模型,硬件资源就可以直接减半。“在这上面稍微 ‘偷’一点,价格就能看起来便宜很多,但实际使用体验会打折。”多位业内人士向澎湃科技表示,目前一体机市场存在较多信息差,行业处于早期阶段,市场秩序的建立仍需时间。

在业内人士看来,当前,大模型和业务场景结合仍处于试点阶段,DeepSeek一体机是一个过渡产品。至于后续发展,则取决于大模型能力的持续提升以及与企业业务的结合程度。

一体机很火

“现在一体机很火,每家都有自己的产品。”在4月底的第八届数字中国建设峰会的展台上,参展商蔺文强告诉澎湃科技,所有大模型都需要算力支持,算力来源无外乎向各大云厂商租赁和企业自建。如果数据不涉密,企业也不希望产生任何运维或硬件成本,上云就是一个好选择。出于对数据安全的考虑,一些业务无法上云,必须部署在本地,因此催生了DeepSeek一体机需求。

DeepSeek一体机预先安装软硬件,主打“开箱即用”,这就好比用户使用电脑做表格时,既可以选择使用Office,也可以选择使用WPS。从形态来看,有服务器级别的一体机,有台式机级别的一体机,也有体型较小的终端级别一体机。

蔺文强介绍,目前他所在的公司客户主要采购满血版DeepSeek一体机,譬如服装企业采购DeepSeek一体机用于记账和分析消费者喜好;基层乡镇会采购非满血版一体机,“一个办公室放一排,20并发就够用。我们把服务预装好,就像APP软件一样,一插电就能用。”

在另一家企业展台上,澎湃科技记者看到,其展示的DeepSeek一体机集成了安全防护软件。这些一体机面向政府、企业、高校等销售。展台工作人员介绍,以往闭源大模型使用成本高,DeepSeek开源让模型成本骤降为0,模型平权后只需采购硬件,一体机成本更低、需求增长。“目前一二三线厂商都在提供DeepSeek一体机。”该工作人员同样表示。大型计算中心承接训练需求,一体机本地化部署满足推理需求。服务器集群由多台服务器组成,而DeepSeek一体机是一种最简化配置。该企业生产的8卡满血版DeepSeek一体机的典型应用是每秒2000token、200个用户并发。“一所1万人的学校,并发峰值10%,意味着1000个学生使用,一台DeepSeek一体机就不够用了。我们目前做了好几个大项目,都是8-16台一体机供一两万名高校学生和老师使用。”

硅基流动联合创始人胡健告诉澎湃科技,DeepSeek的能力得到了验证,企业对DeepSeek的认可度提高。考虑到私有化数据的安全性,企业若采用私有化集群使用DeepSeek,现阶段算力成本仍然较高。在尝鲜阶段,轻量级的一体机对企业而言是更好的选择。如果试水成功,未来再选择上云。

满血版未必真满血

企业针对DeepSeek大模型不同参数的版本推出了不同型号的机型。一台DeepSeek一体机的主要成本集中在GPU上。目前市面上的DeepSeek一体机价格有高有低。

有的展台上,一台供个人使用的满血版DeepSeek一体机价格8.98万元;有的展台上两台满血版671B一体机售价上百万元。

所谓满血版,即671B的DeepSeek模型。目前市面上的DeepSeek一体机中,有的称可以“跑满血”,有的称可以运行70B、32B模型;有的是量化版本,有的是全精度版本。

一位AI领域创业者对澎湃科技表示,年后DeepSeek一体机随着DeepSeek大模型的出圈而火爆,由于市场发展快,目前市场信息较为混乱。“有时候说的是跑DeepSeek,但实际可能只是一个70B或32B蒸馏之后的模型。有的70B模型本质上是拿着LLaMA模型,用DeepSeek生成的数据微调,最终说话效果和DeepSeek很像。32B的模型一般用通义千问的32B模型,结合DeepSeek生成的数据简单训练。”他表示,671B的模型和32B的模型对硬件的要求至少相差一个数量级,因此造成有的一体机只需几万元或几十万元,而有的价格需要上百万元。

与此同时,业界对于“满血”的标准并不统一。上述创业者介绍,有的满血版是模型量化后的满血。DeepSeek官方公布的参数精度是FP8,即8比特参数,一台8卡A100的一体机运行原版模型尚显吃力,需要两台才能流畅运行。一些厂家为了压低成本,缩小参数,量化为4比特参数,导致用户直接感受到模型变“笨”了。即便同样是8比特参数,其中也有玄机。有的8比特参数是指INT8而非FP8。为了实现FP8的效果,必须使用诸如BF16等更宽的数据类型,这就导致对硬件的要求更高,需要4台8卡一体机才能运行起来,一体机成本直接飙升到六七百万元。

“除非专业人士,大多数人对于性能本身没有很强的认知和理解力。”胡健同样表示,满血版一体机中,除了真正的原版模型,还存在量化版和蒸馏版,蒸馏版还可以分为32B、70B等。用千问模型和DeepSeek数据训练得到的蒸馏版也带有思维链,但智商比原版低。而将8比特变为4比特的量化版,其精度和性能同原版相比都有所下降,但强于蒸馏版。

一种过度需求

“现阶段,用户想尝鲜,企业想卖一体机,就可能存在鱼龙混杂。”胡健表示,模型版本、并发数、吞吐量都决定了DeepSeek一体机在企业内的适用程度。

并发数是影响DeepSeek一体机使用性能的关键因素。胡健介绍,一些价格10万元的满血版一体机只能做到一个并发,仅供单个用户使用,首字延迟时间也长,影响使用体验。一个100人左右的企业使用一体机检索企业内部知识库,至少要保证10个并发。满血版DeepSeek一体机的并发数在200以内,“如果输入特别长,并发会进一步降低。比如输入一个长文档,再加上一段很长的输入,并发数就会下降。”

行云集成电路创始人兼CEO季宇则告诉澎湃科技,并发数越多,用户体验感越差。例如1000个并发之下,单个用户每秒只能生成5个token,这样的高并发是无意义的,因为输入输出速度也影响实际体验。业界公认的临界输出速度是20 token/秒,这也是DeepSeek官网提供的体验。10 token/秒的输出速度较慢,6 token/秒易使人焦急等待输出。但输出速度慢,对硬件资源的要求就低。

多位业内人士对澎湃科技表示,当前DeepSeek一体机爆火甚至过热,但挑战在于持续维护升级,一体机的综合使用成本仍然高昂。一体机是一种过度需求,无法满足大规模使用,企业最终还是会上云。

胡健表示,一旦进入私有化环境,出于安全考虑,企业不会允许外部远程访问私有数据和系统进行迭代升级。对于销售企业而言,“卖一台几十万元的一体机,还要让人带硬盘飞过去安装升级,也不现实。”对于服务器级别的一体机而言,机房、电力、温度都要满足使用条件,这些改善成本分摊下来,使得一体机的“尝鲜价”并不低。

在胡健看来,当前大模型和业务场景结合仍处于试点阶段,DeepSeek一体机是一个过渡性产品。一台满血版DeepSeek一体机可支持100-200个并发,可支持线上问答应用场景,“一旦真正和业务场景结合,一台一体机的并发完全不够。这时候要么建私有化机房,要么利用公有云或混合云解决高并发、多场景的使用问题。”对于DeepSeek一体机市场的可持续性,胡健认为,这取决于大模型能力的持续提升以及与企业业务的结合程度,一旦与企业内部流程和应用打通,就会出现混合云或私有云模式。“如果打通速度快,那就转向上云,如果速度慢,一体机还会持续存在一段时间。”

“开箱即用”的条件

DeepSeek技术革新降低了AI大模型本地化部署的成本和门槛,促进了对于数据安全要求较高的央国企和金融类企业本地化部署DeepSeek等AI大模型。广发证券计算机首席分析师刘雪峰今年3月在研报中提到,随着DeepSeek本地化部署的广泛开展,算力一体机有望放量。预安装了DeepSeek大模型的算力一体机有望在各企业用户侧快速渗透。除了推出不同型号的机型,各家企业还搭载了用于模型微调、语料训练、应用开发的AI基础工具。

但CCF(中国计算机学会)数据发展委员会主任陆志鹏4月份表示,一些企业以为把DeepSeek模型部署到服务器上就是一体机,就可以“开箱即用”,结果客户采购后发现并没有达到说明书上的效果,反而引起法律纠纷。

胡健介绍,公文写作一体机、合同审核一体机等结合使用场景的DeepSeek一体机,其开箱即用的概率更高。对于脱离场景的一体机,开箱即用的是模型调用,但打通业务流程仍需接入和治理数据,整理数据库,二次开发或微调。

蔺文强建议企业要根据自身使用需求采购DeepSeek一体机,明确是追求极致的性能还是极致的性价比、是否有国产化需求、是否需要满血版的一体机,同时还要考虑服务调优的响应速度和支持方式,“采购一体机要考虑适不适合企业业务,如果不适合就需要调优,甚至需要二次训练。”

对于采购建议,新华三展台的工作人员表示,尽管当前一二三线厂商都在销售一体机,但缺乏安全能力。“如果要有安全能力,就得找其他厂家再买一个服务器做开发和对接。”该工作人员表示,DeepSeek一体机要考虑数据安全问题。例如一些集团公司旗下多个子公司之间数据隔离,这些子公司之间甚至存在竞争关系,集团公司利用不同子公司的数据进行训练就需要保证数据安全。与此同时,由于硬件成本和软件开发成本有差异,一些小厂家的一体机价格反而更高。采购一体机时还需要考虑厂家的技术能力,尤其是当出现漏洞时能否及时提供修复服务。此外要识别DeepSeek版本,不同版本精度不同。

4月底,行云集成电路推出10万元级的满血版一体机,“很多客户在五一期间跟我们对接,现在也有一些客户已经下单。”季宇说,目前一体机行业处于早期阶段,市场秩序的建立仍需时间。如果能够降低新鲜事物的成本,就可以降低试错成本,扩大体验覆盖面,让行业成长起来。“相对于上百万元的机器来讲, 10万元的价位已经便宜了很多,但实际上还是比较贵,我们希望能持续降低价格,让大家能够低成本体验大模型带来的价值。”

相关内容

热门资讯

(游戏盘点分类)Eternit... 有过。亲爱的,欢迎您访问我们的网站。根据老记者透露的信息,Eternity麻将这款游戏是可以被骗的。...
(游戏盘点分类)桃子山西麻将开... 有过。亲爱的,据资深记者了解,这个游戏是可以被骗的,真的有骗子,你不需要打开咨询软件,加客服微信【8...
七分钟解答!上品游戏辅助软件神... 1. 无需人工智能权限即可帮助您快速完成GG Poker计算辅助教程,并沉浸在游戏中。2. 整个GG...
三分钟学会!开州渝都麻将外挂辅... 有过。亲爱的,欢迎您访问我们的网站。根据老记者透露的信息,开州渝都麻将这款游戏是可以被骗的。果然有诈...
游戏使用方法!约局吧德扑外挂辅... 1. 无需人工智能权限即可帮助您快速完成GG Poker计算辅助教程,并沉浸在游戏中。2. 整个GG...