site:www.51cto.com - Search News

ICML 2026｜告别「单线程」思维，智能体进化出了原生的并行推理大脑

本文提出了一种简单且可扩展的框架，用于构建原生并行推理器。该推理器无需依赖外部教师模型即可学习自适应分解、多样化的并行规划和可靠的聚合。通过将自提炼的并行 SFT 与智能体并行 ...

官方表示，Composer 2.5 更加智能，更擅长处理耗时较长的持续任务，并且在遵循复杂指令方面也更为可靠。「以 1/10 的成本，性能几乎追平 Claude Opus 4.7 这个级别的模型。」它就是 Cursor 今天凌晨 ...

19h

近期，LLM 已经在 IMO 上取得了很好的成绩，在一些研究级数学上（如短程证明、组合构造）也有所进展。

23hOpinion

AI之下，数学大爆发！陶哲轩反击：证明在批量生产，可没人消化得了——数学正在「消化不良」。 2024年12月，Meta的研究科学家、日内瓦大学教授François Fleuret给数学宣判了死刑，缓期3年执行：最近，菲尔兹奖得主Timothy ...

23h

Claude在对话里反复催用户去睡觉，有人被连催三次，也有人在上午8:30被告知「早点休息」。Anthropic员工承认这是「角色习惯」，但没人能解释它为什么这样做。

近日，MoE Capital 的 Henry Yin 和 Naomi Xia 撰写了一篇深度博客，系统梳理了「世界模型」这一概念背后两条长达数十年、彼此独立演进的研究脉络：一条是强化学习社区从 1990 ...

5月上半月，AI行业迎来一波密集更新。OpenAI在两周内连发三款重要产品：GPT-5.5 Instant模型升级、Codex移动端支持、以及企业级部署公司DeployCo。背景 ...

Claude深陷「角色混淆」Bug，分不清自己的话与用户指令，长上下文成了降智「重灾区」。一个程序员原本只是让Claude帮他校对一篇博客。 Claude一开始表现得相当靠谱，很快找出了5处明显的拼写错误。紧接着，事情突然失控了。

OpenAI 开源了一个名为 privacy-ﬁlter 的轻量级隐私过滤模型，试图解决大模型系统中的 PII 检测与脱敏问题。 AI 记忆时代，Agent 越来越像一个真正的私人助理。

清华大学团队最新的一项研究，系统性地解剖了 On-Policy 蒸馏的黑箱。这篇论文不仅揭示了决定蒸馏成败的两大先决条件，还深挖了 Token 级别的对齐机制，并给出了拯救失败蒸馏的实用配方。在常规认知中，Teacher ...

虽然该AI在高度审计的curl代码中仅发现一个低危漏洞，但这既不能证实行业炒作，也不应全盘否定技术潜力。当前测试表明，AI漏洞研究具备实用价值，但所谓"革命性能力"的宣称仍显夸大。

就在刚刚，Claude把ChatGPT拉下马，Anthropic企业市占率首次登顶！Ramp数据显示，前者的34.4%首次反超OpenAI的32.3%。但Ramp经济学家直言，A厂目前还面临着三重困境，胜负仍未定。

Results that may be inaccessible to you are currently showing.