🤖 AI科技早报 | 2026年05月04日

📌 头条速览

阿里发布QoderWake:AI Agent从工具走向岗位 — 4月30日,阿里发布全新Agent产品QoderWake,定位"生产可用、安全可控、自进化的数字员工"。不是做一个更聪明的AI助手,而是回答Agent如何从工具变成岗位。核心创新:岗位制、长期身份、长期记忆、技能库、权限沙盒、事件触发六大能力,实现7×24小时值守的数字员工。编排器与执行器分离,双层验证机制,Critic-Refiner自我修正,四维进化路径。

DeepSeek V4与Kimi K2.6同周发布,中国开源模型TOP2 — DeepSeek V4(1.6万亿参数MoE,49B激活)和Kimi K2.6(万亿参数MoE多模态,32B激活)在同一周先后发布,两者均为开源万亿参数模型。Artificial Analysis开源模型智能指数TOP2均被中国模型占据。DeepSeek V4推理算力需求下降73%,Kimi K2.6可连续编码13小时处理4000+工具调用。中国开源技术扩散速度大幅加快。

🔬 AI与大模型

  • DeepSeek V4效率革命 — 1.6万亿参数MoE模型,49B激活参数,原生支持100万token上下文。相比V3.2,单token推理算力需求下降73%,KV cache压缩至十分之一。完成华为昇腾芯片深度适配,从CUDA向CANN架构迁移。采用Muon优化器提升训练收敛效率。
  • Kimi K2.6持久编码能力 — 万亿参数MoE多模态模型,32B激活参数,256K上下文。可不间断编码13小时,处理4000+次工具调用,修改4000+行代码,完成金融撮合引擎深度重构。引入Agent集群架构,支持300个子Agent并行协作,RL团队已用其驱动Agent连续自主运行5天。
  • DeepSeek与Kimi技术相互启发 — Kimi借鉴DeepSeek MLA注意力机制(省推理成本),DeepSeek V4采用Kimi推广的Muon优化器(省训练成本)。两家在注意力机制(稀疏vs线性)、残差连接等方向各自探索但指向相同目标。技术报告和开源代码可见度高,中国开源技术扩散链条明显缩短。
  • 海外开发者社区关注 — Latent Space将Kimi列为"DeepSeek沉默期后中国开源模型领跑者",V4发布后海外开发者将V4、K2.6、GLM 5.1放同一表比较。英伟达GTC 2026展示下一代芯片推理性能的中国模型是这两家。

💡 产品与应用

  • Meshy 6接入拓竹MakerLab — 照片上传两分钟生成可直接3D打印的3MF文件,颜色和AMS耗材对应关系预配好。Meshy ARR达4000万美元,毛利85%,LTV/CAC>4,自然流量占比过半,月收入增速20%-30%。欧美发达国家流量占有率超60%,成为AI 3D赛道首个盈利样本。
  • AI账单瘦身成创业风口 — 万格智元(清华00后博士团队)用普通CPU运行35B-120B大模型,内存开销大幅下降,推理速度提升30倍,本地部署成本从万元级降至千元级。万象智维推出端侧算力卡片,本地大模型免费运行,OmniInfer推理引擎性能提升20倍。明日新程"团子"多智能体框架推理成本比Google Deep Research低50%以上。
  • 一苇宇航太空AI Token Machine — 北邮博士团队打造太空算力星座,用太阳能驱动算力,自研RROS双内核操作系统在轨实测平均无故障时间超1万小时,200毫秒完成故障切换。目标:五年内追赶SpaceX 10万瓦级卫星算力,形成AI FOR AI循环。
  • SentiPulse:Agent需要一张脸 — 推出有Live2D形象、有性格的数字角色,配合AI小猫处理任务。陪伴+效率飞轮:陪伴时间长→上下文积累多→Agent越懂你→效率越高。

🏢 行业动态

  • Agent热潮后的真正问题 — 企业配Agent工具后发现:每个人变快了,公司并没有。约束理论:系统产出由最慢环节决定。写代码从30分钟压缩到10分钟,但需求评审、上下文同步、权限确认、测试验证等环节不会自动变快。慢的地方从"谁来写代码"变成任务流转、信息同步、问题分诊、经验沉淀。
  • 数字员工vs数字工具 — 工具逻辑:用户下指令,Agent工作。员工逻辑:事件发生,员工自主接手。如线上反馈来了,数字程序员自动分类、读日志、定位根因、生成修复建议。关键:能否长期值守、理解边界、遵守权限、沉淀经验。
  • 海淀AI创业生态 — 投海Tech Show展示清华、北大、北航、北邮等高校AI项目。好项目一季度完成两轮融资,00后清华博士团队用CPU实现主流模型本地Token生成,摆脱GPU依赖。海淀构建"投资本+投资源+强服务"创投生态体系。
  • Token从技术预算变生产成本 — 数字员工7×24小时处理反馈、分析日志、生成代码,Token消耗变成生产过程一部分。未来组织从"真人员工协作"走向"真人员工+数字员工混编"。

📰 快讯

  • 2026北京车展杜比座舱体验 — 杜比将座舱娱乐体验推向新高度。
  • 钉钉录音卡DingTalk A1 Pro开售 — 充电宝版钉钉录音卡正式上市。
  • 智谱披露GLM-5 Coding Agent推理工程实践 — 技术细节公开。
  • 生数科技与星尘智能战略合作 — 推动具身智能技术突破与落地。
  • 谷歌相册推AI衣橱规划功能 — 实现虚拟穿搭与试穿。
  • 全网热议GPT image 2平替 — 商汤U1不止是信息图,连续图文创作一步到位。

⚡ 整理自 品玩 / 智东西 / MIT科技评论 | 2026-05-04 08:00 (Asia/Shanghai)

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
每天60秒读懂世界

每天60秒读懂世界

2026-5-4 8:01:02

周刊

「一本书」《噪声》:你以为是判断,其实是掷骰子

2026-5-3 8:34:53

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧