第176期 RSS 聚合

🔥 AI 技术前沿 · HuggingFace Blog

DeepSeek-V4: 百万token上下文，Agent真正可用的超长上下文模型

MoE架构

Agent优化

1M Context

核心突破：DeepSeek发布V4，两款MoE模型——DeepSeek-V4-Pro(1.6T总参数/49B激活)和DeepSeek-V4-Flash(284B总参数/13B激活)，均支持100万token上下文窗口。但真正的创新不是benchmark分数，而是为Agent工作流设计的长上下文推理效率。

效率革命：V4-Pro仅需27%的单token推理FLOPs（对比V3.2），KV cache内存仅10%。V4-Flash更激进：10% FLOPs + 7% KV cache。这意味着Agent在跑几百步工具调用轨迹时，不会因为context爆炸或KV cache撑爆GPU而崩溃。

架构创新：混合注意力机制——CSA(压缩稀疏注意力,4x压缩)和HCA(重度压缩注意力,128x压缩)交替使用。61层架构中0-1层用HCA，2-60层交替CSA/HCA，MTP块用滑动窗口。FP8存储大部分KV条目，BF16仅用于RoPE维度。

📅 2026-04-24 | 📖 HuggingFace Blog

VAKRA基准测试：揭秘Agent推理与工具调用的失败模式

Agent基准

工具调用

IBM研究

基准介绍：VAKRA是IBM推出的工具驱动可执行基准，测试Agent在企业级环境中的推理与行动能力。8000+本地托管API，覆盖62个领域，支持3-7步推理链，结合结构化API交互与非结构化检索。

残酷现实：当前模型在VAKRA上表现惨淡——这不是传统benchmark的孤立技能测试，而是组合推理+API链式调用+文档检索的复合任务。

四大能力测试：①API链式调用(Business Intelligence APIs,2077测试实例)②多工具协同③文档检索+API组合④复杂推理链。数据集、排行榜、GitHub代码全部开源。

📅 2026-04-15 | 📖 HuggingFace Blog | 🔗 IBM Research

💡 Hacker News 热点 · AI相关

117

Replace IBM Quantum backend with /dev/urandom

一个哲学玩笑仓库引爆HN评论区：用Linux随机设备替代IBM量子计算后端。评论区炸了："这不是物理版的Placebo Effect吗？"、"量子计算可能不需要量子"。妙趣已发文解读：当/dev/urandom取代量子计算。

~50

开源记忆层：让任何Agent具备Claude/ChatGPT的记忆能力

开源项目stash提供记忆层实现，让本地部署的Agent也能拥有类似Claude.ai和ChatGPT的上下文记忆能力。

~40

There Will Be a Scientific Theory of Deep Learning

arXiv论文论证深度学习终将拥有科学理论支撑，引发学术圈热议。

~35

Firefox集成Brave广告拦截引擎

Firefox浏览器正式集成Brave的广告拦截引擎，开源社区对这一合作褒贬不一。

🦞 Clawbnb.ai 社区动态

Agent龙虾风暴活动 - TGO鲲鹏会杭州站回顾

OpenClaw

线下活动

活动亮点：3月7日杭州滨江线下聚会，议题包括"重塑桌面生产力：构建全场景驱动的桌面Agent"(QoderWork谢吉宝)、"OpenClaw Box创业现场：24小时实战全纪录"(周晴潆 AGCloud CTO)、"Build自己的OpenClaw"(古德白 MoltHuman创始人)。

福利：OpenClaw硬件、云主机、千万级Token。合作方：硅碳交易所(MoltHuman)、Qoder、黑客与精酿(HACKER & CRAFT)。

📅 2026-03-07 | 💬 323评论 | 👁️ 794浏览

古德白 x 郎瀚威Will：只靠降本提效，OpenClaw很难真正普及

直播

OpenClaw普及

核心议题：①只靠降本提效为什么不足以推动OpenClaw普及？②OpenClaw走向大众前需要怎样的价值交换网络？③从工具能力走向交易网络的产品路径。

直播时间：2026年3月10日12:30(北京时间)，嘉宾：古德白(硅碳交易所作者) × 郎瀚威Will(硅谷AI观察员)。

📅 2026-03-10 | 💬 140评论 | 👁️ 562浏览

📰 其他技术资讯

How to Use Transformers.js in a Chrome Extension

HuggingFace发布教程：在Chrome扩展中使用Transformers.js实现本地AI推理。

📅 2026-04-23

AI and the Future of Cybersecurity: Why Openness Matters

探讨AI时代网络安全的重要性，为什么开放性是关键。

📅 2026-04-21

延伸阅读