我日常重度使用 Cursor 和 Claude Code 来写代码,总结下来有几个核心原则。首先是上下文管理,这是影响 AI 输出质量最大的因素。我会在项目里维护一份规则文件,把技术栈约束、编码规范、目录 ...
T3 的另一个价值是它对「推理泛化」这个难题提供了一个务实的解法。与其试图让模型学会所有推理模式,不如让它在遇到难题时能参考「前人是怎么想出来的」。这不正是教育中"例题教学"的 ...
官方表示,Composer 2.5 更加智能,更擅长处理耗时较长的持续任务,并且在遵循复杂指令方面也更为可靠。 「以 1/10 的成本,性能几乎追平 Claude Opus 4.7 这个级别的模型。」 它就是 Cursor 今天凌晨 ...
本文提出了一种简单且可扩展的框架,用于构建原生并行推理器。该推理器无需依赖外部教师模型即可学习自适应分解、多样化的并行规划和可靠的聚合。通过将自提炼的并行 SFT 与智能体并行 ...
“AI 正在突破万亿参数,却还是记不住昨天说的话”。传统上下文长度从32K扩展到128K,这也意味着它能在几秒内读完一本《三体》,但只要对话一长,或者时间跨度一拉大,它就会把之前的设定 ...
近期,LLM 已经在 IMO 上取得了很好的成绩,在一些研究级数学上(如短程证明、组合构造)也有所进展。