近期,LLM 已经在 IMO 上取得了很好的成绩,在一些研究级数学上(如短程证明、组合构造)也有所进展。
AI之下,数学大爆发!陶哲轩反击:证明在批量生产,可没人消化得了——数学正在「消化不良」。 2024年12月,Meta的研究科学家、日内瓦大学教授François Fleuret给数学宣判了死刑,缓期3年执行: 最近,菲尔兹奖得主Timothy ...
Claude在对话里反复催用户去睡觉,有人被连催三次,也有人在上午8:30被告知「早点休息」。Anthropic员工承认这是「角色习惯」,但没人能解释它为什么这样做。
Claude深陷「角色混淆」Bug,分不清自己的话与用户指令,长上下文成了降智「重灾区」。 一个程序员原本只是让Claude帮他校对一篇博客。 Claude一开始表现得相当靠谱,很快找出了5处明显的拼写错误。 紧接着,事情突然失控了。
Richard ...
打开ChatGPT或者Gemini等AI工具的对话窗口;切回你正在看的网页或文档,选中那段你想分析的内容,复制;切回AI窗口,粘贴。再用一两句话解释你要什么。等待。拿到结果;再切回去执行…… ...
OpenAI 开源了一个名为 privacy-filter 的轻量级隐私过滤模型,试图解决大模型系统中的 PII 检测与脱敏问题。 AI 记忆时代 ,Agent 越来越像一个真正的私人助理。
5月上半月,AI行业迎来一波密集更新。OpenAI在两周内连发三款重要产品:GPT-5.5 Instant模型升级、Codex移动端支持、以及企业级部署公司DeployCo。 背景 ...
清华大学团队最新的一项研究,系统性地解剖了 On-Policy 蒸馏的黑箱。这篇论文不仅揭示了决定蒸馏成败的两大先决条件,还深挖了 Token 级别的对齐机制,并给出了拯救失败蒸馏的实用配方。 在常规认知中,Teacher ...
Fiona 在演讲结尾给了一个作业,找一个你自己最不想开的会,或者最不想写的报告,问自己两件事,它还在完成它原本的目的吗?如果没有,能 Claudify,还是直接砍掉? 上周,Anthropic 在旧金山开了一场开发者大会,叫 Code with ...
据 Windows Latest 报道,微软已悄然证实,Windows 更新会自动降级用户手动安装的显卡驱动。这意味着,如果你从设备原厂官网手动下载并安装显卡驱动、覆盖电脑原有驱动后,后续某次 Windows 更新仍有可能将系统驱动还原为旧版本。 5 月 13 日消息,据 Windows Latest 报道,微软已悄然证实,Windows 更新会自动降级用户手动安装的显卡驱动。这意味着,如果你从设 ...
虽然该AI在高度审计的curl代码中仅发现一个低危漏洞,但这既不能证实行业炒作,也不应全盘否定技术潜力。当前测试表明,AI漏洞研究具备实用价值,但所谓"革命性能力"的宣称仍显夸大。
Some results have been hidden because they may be inaccessible to you
Show inaccessible results