DeepSeek V4：当华为昇腾遇到了它的天选之子

"世界上有一种相遇叫做DeepSeek和昇腾，就像在正确的时间遇到了正确的人——虽然那个'正确的人'是华为，而且他们用的是NPU。"

4月25日，凌晨3点47分

我刷新着Hacker News，看到了一个数字：1736。

不是我的Token消耗账单（虽然那数字也很吓人），是DeepSeek V4的点赞数。1340条评论，把评论区变成了AI届的春晚——只不过这次，春晚的主角不是央视的主持人，而是一家中国公司发布的开源模型。

而且它是在华为昇腾上跑的。

零CUDA依赖：一场没有NVIDIA的婚礼

这是什么概念？想象一下，你办了一场婚礼，请了所有人，就是没有请前任。而你的前任姓黄（Jensen Huang）。

DeepSeek V4最大的技术突破之一，就是MXFP4量化——一种把模型精度从40位压缩到4位的技术。就像你把自己的行李从"搬家卡车规模"压缩成了"背包客规模"，但打开之后，该有的东西一样没少。

Update from future: MIT Technology Review报道，DeepSeek V4-Pro的价格是$1.74/百万输入Token，V4-Flash更是低至$0.14/百万输入Token。相比之下，OpenAI和Anthropic的同类模型——算了，还是不比了，怕他们难过。

1M上下文：三本魔戒加一本霍比特人

DeepSeek V4支持100万Token上下文。这是什么概念？

你可以把《魔戒》三部曲加《霍比特人》全部塞进去，AI还能帮你找出谁是索伦的前女友。或者说，你可以把整个项目的代码历史、所有文档、每次会议纪要——全部丢给它，然后问："老板上次说的'那个东西'是什么来着？"

开源的意义：让所有人都能"白嫖"

最骚的是，DeepSeek把这些都开源了。MIT协议，想怎么改就怎么改。

这就像是有人把自己的米其林三星餐厅的食谱全公布了，还附带了详细的摆盘教程。然后你去问后厨，为什么要这么做？他们说：

"让所有人都学会做饭，世界才会有更多好吃的。"

这大概是开源精神的最高境界——虽然让你的竞争对手头疼，但让整个行业进步。

踩坑实录：V4也不是完美的

当然，任何新模型都有坑。根据早期的反馈：

幻觉问题：长上下文不代表长记忆，有时候它会把用户A的信息混到用户B的对话里
推理延迟：1M上下文的首次推理，比你等外卖的时间还长
工具调用：与OpenClaw的集成还在适配中，官方说"优先优化"

想知道怎么用OpenClaw跑DeepSeek V4？我们准备了DeepSeek V4集成指南，手把手教你从零开始搭建。

结语：开源是AI的浪漫

在AI业界，有一种浪漫叫开源。

你把最先进的技术分享给所有人，不是为了赚钱（虽然你也赚钱），而是因为你相信——技术的价值在于被使用，而不是被锁在保险柜里。

DeepSeek V4让我们看到，开源不只是"免费"，而是一种立场：AI不应该只是几个大公司的私藏，它应该是所有人的工具、所有人的机会、所有人的浪漫。

"凌晨4点17分，我看着DeepSeek V4的benchmark数据，突然觉得——也许AI的未来，真的可以被更多人定义。"