2026年6月 人工智能前沿详细总结(包括MiniMax M3、Qwen3.7-Plus、Claude Fable 5、GLM-5.2、Unlimited OCR、GPT-5.6 等) 文章目录6月1日【多模态大模型】MiniMax M3 正式发布【重要】【大语言/图像生成/视频生成模型】Agnes AI 无限期免费开放核心模型 API6月3日【多模态大模型】阿里发布多模态模型 Qwen3.7-Plus【重要】6月4日【多模态大模型】谷歌发布 Gemma 4 12B6月10日【多模态大模型】最强模型 Claude Fable 5 发布【重要】【AI工具】美团发布 AI 浏览器 Tabbit6月15日【编程大模型】月之暗面发布 Kimi K2.7 Code【重要】6月17日【医疗大模型】星火医疗大模型V3.5发布6月18日【编程大模型】智谱发布最强开源编程模型 GLM-5.2【重要】【医疗大模型】百川智能发布医疗大模型 Baichuan-M46月19日【AI工具】Claude Code 推出 Artifacts 功能6月22日【OCR大模型】百度发布超强 OCR 模型 Unlimited OCR【重要】6月23日【多模态大模型】字节跳动发布 Doubao-Seed-2.1 系列模型6月27日【多模态大模型】最强大模型 GPT-5.6 发布【重要】6月1日【多模态大模型】MiniMax M3 正式发布【重要】今天MiniMax M3正式发布同时一起开源了前沿的编程/智能体能力、1M 级上下文窗口和原生多模态是首个能够做到这一点的开源模型。MiniMax M3在编程上的能力已经达到了国际第一梯队在衡量真实软件工程任务解决能力的基准 SWE-Bench Pro 上超越了GPT-5.5和Gemini 3.1 Pro接近Claude Opus 4.7在 Terminal Bench 2.1 上的得分为 66.0%面向自主智能体端到端评测的 Claw-Eval 上MiniMax M3排名第一。而且对于长线程任务MiniMax M3也会持续迭代、自我验证并拒绝放弃。在发布MiniMax M3的同时MiniMax 还发布了MimiMax Code。MiniMax M3的模型权重和技术报告将在几天后发布。截止7月2日智能体对国产模型的调用量MiniMax M3 不及 GLM-5.2 和 Kimi K2.7 Code模型综合性能不及 Qwen3.7-Max虽然后者不是多模态模型。从视觉能力来看MiniMax M3 的表现更差一些远低于 Qwen3.7-Plus、Kimi K2.6 和 Dola-Seed-2.0-pro。【大语言/图像生成/视频生成模型】Agnes AI 无限期免费开放核心模型 API今天全球排名前十的人工智能实验室 Agnes AI 宣布正式面向全球企业和创作者无限期免费开放旗下核心模型的 API分别是文本模型Agnes-2.0-Flash、Agnes-Image-2.0-Flash和Agnes-Video-2.0。6月3日【多模态大模型】阿里发布多模态模型 Qwen3.7-Plus【重要】今天阿里发布了新的多模态模型Qwen3.7-Plus。该模型把视觉和语言能力同时装入了一个底座模型中同时保留了代码和工具使用这些智能体能力。它可以感知现实场景阅读屏幕并操作 GUI 界面从视觉参考里写代码还可以结合网页内容回答视觉问题。Qwen3.7-Plus在代码任务和通用智能体任务中的性能测试达到了第一梯队但是在多模态任务上表现更为优异。目前Qwen3.7-Plus提供了 API 调用支持文本和图像/视频混合输入。根据 LMArena7月2日Qwen3.7-Plus 是当前国内最强的多模态大模型之一视觉能力超过 Kimi K2.6、Dola-Seed-2.0-pro 和 MiniMax M3。6月4日【多模态大模型】谷歌发布 Gemma 4 12B今天谷歌正式推出了Gemma 4 12B目标是把具备智能体能力的多模态智能带到笔记本电脑上。Gemma 4 12B的大小介于面向边缘设备的Gemma 4 E4B和更强的混合专家模型Gemma 4 26B之间在更小的内存占用下提供了强大的能力。同时它也是谷歌首个支持原生音频输入的中等规模模型。6月10日【多模态大模型】最强模型 Claude Fable 5 发布【重要】今天Anthropic 发布了全球最强的模型Claude Fable 5。该模型在几乎所有的 AI 性能基准测试中都处于领先水平在软件工程、知识工作、视觉、科学研究等其他领域都展现出了卓越性能。在 LMArena 上它也同时获得了 Agent Arena、文本、网页开发上获得了第一名在 Artificial Intelligence 上它也碾压式获得第一。此外Claude Fable 5比以往的其他 Claude 模型都更节约 Token在处理长时运行任务时可以同时处理数百万 Token 而不失去焦点并通过自身的笔记改进输出结果。任务越长越复杂Claude Fable 5相较于其他模型的优势就越明显。另外Anthropic 也向一小部分网络安全防御者和基础设施提供商发布了最前前沿模型Claude Mythos 5。两款模型的定价均为 10 美元 / 1M 输入 token50 美元 / 1M 输出 token不到Claude Mythos Preview价格的一半但是比Claude Opus 4.8贵了一倍比GPT-5.5也贵了将近一倍。目前Claude Fable 5已在所有渠道开放给用户使用且从今天起到6月22日所有订阅用户都可以免费试用Claude Fable 5。【AI工具】美团发布 AI 浏览器 Tabbit今天美观发布了 AI 浏览器Tabbit1.0 正式版。相较于传统浏览器用户点开什么就展示什么Tabbit利用内置的 AI 大模型以及对话、妙招、智能代理、脚本等功能主动帮助用户理解网页内容、整理信息并完成操作。另外美团宣布Tabbit1.0 标准版将永久免费包括调用国内头部的 AI 大模型包括MiniMax-M3、DeepSeek-V4-Pro、Kimi-K2.6等。每周的免费额度可以处理约 1000 次对话、50 张图片生成和 10 个智能体任务。并且macOS 和 Windows 系统均可下载。之后将推出收费为 9.9 元/周的Tabbit1.0 专业版。6月15日【编程大模型】月之暗面发布 Kimi K2.7 Code【重要】今天月之暗面发布并开源了首款专攻代码领域的专项模型Kimi K2.7 Code。该模型在编程能力、智能体能力上都全面进阶同时改善了长程任务中过度思考问题使得平均的 Token 消耗直接减少了 30%。6月17日【医疗大模型】星火医疗大模型V3.5发布今天讯飞医疗发布了星火大模型V3.5。该模型在多项关键医疗测评上打败了 GPT-5.5并且真正实现了模型落地应用。星火大模型V3.5在中国医疗大模型技术评估中综合实力排名行业第一十五项指标中十二项获得SOTA在 MedBench 智能体评测上更是获得了 98.9 分在医疗知识问答、医疗语言理解、诊断治疗推荐、医疗文书生成、医疗多模态交互、医疗多轮交互等多项任务中的综合能力超过 GPT-5.5-xhigh。与此同时在多家头部三甲医院的真实应用中星火医疗大模型V3.5生成的病例被医生采纳的概率达到 91%病例书写缩短时间 52%。6月18日【编程大模型】智谱发布最强开源编程模型 GLM-5.2【重要】今天智谱正式发布了最强的开源编程大模型GLM-5.2该模型在编程能力上超越了Claude Opus 4.8 Thinking等众多模型仅次于Claude Fable 5。在设计榜单 Design Arena 上更是超越了Claude Fable 5获得了全球第一。GLM-5.2在八项权威基准测试中超越了上一代的GLM-5.1。另外它支持 1M 的上下文长度并且在长程任务中保持领先超越了GPT-5.5和Gemini 3.1 Pro等模型。【医疗大模型】百川智能发布医疗大模型 Baichuan-M4今天百川智能发布了医疗大模型Baichuan-M4。该模型在多个医疗评测数据集上的效果超越了GPT-5.5、Claude Opus 4.7和DeepSeek-V4-Pro。目前该模型已经可以通过手机 APP 百小医进行体验。6月19日【AI工具】Claude Code 推出 Artifacts 功能Claude Code迎来了一次大更新推出了 Artifacts 功能可以把会话中的工作成果转化为实时、可交互、可分享的自定义 HTML 网页。用户可以接入代码和多个数据源并将结果以可交互 URL 的形式发给团队成员。使用该功能生成的网页不调用外部 API不加载外部脚本不连接后端。所有的 CSS 和 JavaScript 都内联锁死所有外部请求可以零成本部署。6月22日【OCR大模型】百度发布超强 OCR 模型 Unlimited OCR【重要】今天百度发布并开源了最新的Unlimited OCR。该模型的总参数仅为 3B实际激活参数为 500M但是却在 OmniDocBench v1.5 上取得了 93.23% 的高分在 v1.6 更是取得了 93.92% 的高分刷新了端到端的 SOTA。除了评测数据集上的高分表现该模型还能够实现其他 OCR 模型无法做到在不失忆、不降速的情况下一口气解析 40 多页文档。目前该模型和代码都已经上线了 Github 和 HuggingFace。6月23日【多模态大模型】字节跳动发布 Doubao-Seed-2.1 系列模型今天豆包大模型 2.1 正式发布。该模型在代码生成、智能体和视觉语言模型三大能力上取得重要突破多项评测任务甚至超过了Claude Opus 4.7。其中Doubao-Seed-2.1在 Terminal Bench 2.1、SWE-Pro、SciCode 等代码评测中进入第一梯队。在编程方面Doubao-Seed-2.1不再局限于片段补全或单文件生成而是具备了仓库级理解、端到端项目交付和自测闭环的能力能够独立完成完整的工程任务智能体方面Doubao-Seed-2.1驱动的智能体从只能执行简单任务升级为了能够在接口报错、数据缺失等复杂异常环境下依然进行动态路径规划、异常自纠和产物交付的能力。多模态能力始终是豆包的强项。Doubao-Seed-2.1的多模态能力也大幅强化在大部分的多模态基准上成绩超越Claude-Opus 4.7可以接收视频、图像输入。Doubao-Seed-2.1共有适配高性能场景的Doubao-Seed-2.1-pro和主打性价比的Doubao-Seed-2.1-Turbo两种型号。用户可以在火山引擎接入 API或者豆包、TRAE、扣子等应用中体验最新的豆包模型。API 调用价格为6元 / 1M 输入 token缓存命中情况下 1.2元 / 1M 输入 token30元 / 1M 输出 token。该价格只有Claude Opus 4.6的大约 20%并且Doubao-Seed-2.1-turbo的价格更是只有一半。6月27日【多模态大模型】最强大模型 GPT-5.6 发布【重要】今天OpenAI 发布了史上最强模型GPT-5.6系列包括旗舰模型 Sol、平衡模型 Terra 和低成本高速模型 Luna。GPT-5.6 Sol是最强的模型面向高难度推理、复杂编程、生物和网络安全等长链路任务尤其是需要规划、迭代、调用工具和协调步骤的复杂工作流场景还有让模型获得更长深度推理时间的 max 和调用多个子智能体协同处理复杂任务的 ultra 两个模式在编程测试中不仅击败了自家的GPT-5.5还击败了Claude Fable 5GPT-5.6 Terra则面向日常工作性能对标GPT-5.5同时价格便宜约两倍GPT-5.6 Luna则是该系列中最快最便宜的模型同时也有着较强的能力编程超过 Claude Opus 4.8。目前GPT-5.6系列模型仅提供给了少数“受信任的合作伙伴”。