Anthropic 宣布 Claude Code 迎来 2026 年最大更新:MCP(Model Context Protocol)市场正式上线,已收录 500+ 工具插件;新增 Multi-Agent 模式,可同时启动多个专业 Agent 并行处理不同模块;子 Agent 间支持代码共享和任务交接。Claude Max 计划可无限制使用。
AI 博主日报
每日精选 AI 领域最新动态
AI日报 - 2026年3月3日
今日看点:Claude Code 迎来重大更新支持 MCP 生态市场和多 Agent 协作;Google 发布 AlphaCode 3 在竞赛编程领域超越人类专家;腾讯混元视频生成模型 HunyuanVideo 2.0 开源;AI 安全领域欧盟 AI 法案正式生效引发全球关注。
大模型动态
(3)Google DeepMind 发布 AlphaCode 3,在 Codeforces 算法竞赛平台上达到 Expert 级别(约超越 95% 人类参赛者),解题正确率 87.3%。模型内部集成了自动程序调试和复杂度分析模块。目前仅对研究合作伙伴开放。
清华系 AI 公司智谱 AI 发布 GLM-5 开源版(130B 参数),在 C-Eval、AGIEval-Chinese 等中文基准上首次超越 GPT-4o。同时开源了 GLM-5-Coder(代码专用版),在 HumanEval 上得分 91.1%。支持商用,提供 API 服务。
开源项目
(3)腾讯混元团队开源 HunyuanVideo 2.0,视频生成模型参数量 13B,支持生成最长 60 秒、1080P 分辨率的高质量视频。新增运动控制(Motion Control)功能,可精准控制镜头运动和物体轨迹。在 EvalCrafter 上得分 82.3,接近 Sora。
Hugging Face 发布 Transformers.js 4.0,通过 WebGPU 和 WebAssembly 的深度优化,首次支持在浏览器端流畅运行 70B 量化模型(Q4_0)。在 M3 MacBook Pro 上,7B 模型推理速度达到 45 token/s。支持所有主流浏览器。
AI 应用开发平台 Dify 发布 1.0 正式版,新增企业级功能:多租户隔离、细粒度权限管理、完整的审计日志、以及生产监控仪表盘。同时开放 Marketplace,提供 200+ 预制工作流模板。GitHub 星标已超过 50K。
AI 工具更新
(3)Codeium 旗下 AI IDE Windsurf 推出 Memory 功能,自动记忆开发者的代码风格偏好、项目架构决策和技术债务,跨会话保持一致。支持手动审查和编辑记忆内容。官方称这解决了「AI 每次都忘记你的偏好」的核心痛点。
Midjourney 悄然上线视频生成 Beta 功能,支持静态图片转 5 秒视频(4K 分辨率)。在 Pika、Runway Gen-3、Kling 等同类工具的对比测评中,美学一致性和运动流畅度排名第一。目前向 Pro 计划用户开放测试。
字节跳动旗下 AI Agent 平台 Coze 国际版推出重大更新,原生支持 MCP 协议,可接入超过 1000 个外部工具(含 GitHub、Jira、Slack、Notion 等)。同时发布了 Coze Agent SDK,支持开发者构建自定义 Agent。
论文速递
(2)来自 UC Berkeley 和 Stanford 的联合研究提出 CAPE(Context-Aware Position Encoding),系统性地解决了长上下文 LLM 在中间位置信息遗忘的问题。在 256K 上下文下,中段检索准确率从 62% 提升至 91%,且无需重新训练模型。
微软研究院提出 MultiRAG-v2 框架,将图像、表格、代码块与文本统一编码为「语义块」,支持跨模态检索。在 SlideVQA 和 DocVQA 基准上,检索准确率分别提升 34% 和 28%。已集成到 Azure AI Search。
行业观点
(2)欧盟 AI 法案(EU AI Act)今日起对高风险 AI 系统正式生效。医疗、执法、教育、就业等领域的 AI 应用需完成合规备案和透明度报告。科技圈对此褒贬不一:监管派认为这是必要保护,创新派担忧欧洲 AI 竞争力进一步下滑。
量子位发布「2025-2026 AI 工具使用报告」,基于 2 万名开发者调研:Cursor(43%)和 Claude Code(38%)并列最受欢迎 AI 编程工具;ChatGPT 仍是最广泛使用的通用 AI 助手(71%);87% 受访者表示 AI 工具显著提升了生产力。