<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>MLSys on John Chen's blog</title><link>https://andy1314chen.github.io/tags/mlsys/</link><description>Recent content in MLSys on John Chen's blog</description><generator>Hugo</generator><language>zh-cn</language><copyright>转载请注明出处</copyright><lastBuildDate>Mon, 01 Jun 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://andy1314chen.github.io/tags/mlsys/index.xml" rel="self" type="application/rss+xml"/><item><title>250 行配置赢得 MLSys 竞赛：Harness 工程实践</title><link>https://andy1314chen.github.io/posts/2026/06/250-%E8%A1%8C%E9%85%8D%E7%BD%AE%E8%B5%A2%E5%BE%97-mlsys-%E7%AB%9E%E8%B5%9Bharness-%E5%B7%A5%E7%A8%8B%E5%AE%9E%E8%B7%B5/</link><pubDate>Mon, 01 Jun 2026 00:00:00 +0000</pubDate><guid>https://andy1314chen.github.io/posts/2026/06/250-%E8%A1%8C%E9%85%8D%E7%BD%AE%E8%B5%A2%E5%BE%97-mlsys-%E7%AB%9E%E8%B5%9Bharness-%E5%B7%A5%E7%A8%8B%E5%AE%9E%E8%B7%B5/</guid><description>&lt;h1 id="250-行配置赢得-mlsys-竞赛harness-工程实践"&gt;250 行配置赢得 MLSys 竞赛：Harness 工程实践&lt;/h1&gt;
&lt;p&gt;MLSys 2026 FlashInfer AI Kernel Generation Contest，DSA 赛道。&lt;/p&gt;
&lt;p&gt;Dogacel（Doğaç Eldenk）拿到双料第一：Full-Agent 模式 34.93x over baseline，Agent-Assisted 同样第一。34.93x 是所有参赛方案中单 kernel 最高加速比，最终延迟 0.010ms，跑在 NVIDIA Blackwell B200 上。&lt;/p&gt;
&lt;p&gt;单人团队。一个人、一个 Claude Code、一个 Modal 账号、不到 250 行配置文件。&lt;/p&gt;
&lt;p&gt;这篇文章不讲 kernel 怎么写。要拆的是 harness——不是让 Agent 变聪明，而是设计一套机制管住它。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="一问题agent-会反复踩同一个坑"&gt;一、问题：Agent 会反复踩同一个坑&lt;/h2&gt;
&lt;p&gt;让 Agent 自主优化 kernel，流程很自然：给 baseline、给 benchmark、让它自己迭代。实际跑起来会卡在一个地方——它在同一个方向上反复尝试。&lt;code&gt;NUM_WARPS=8&lt;/code&gt; 不行试 &lt;code&gt;4&lt;/code&gt;，不行试 &lt;code&gt;16&lt;/code&gt;；&lt;code&gt;.cg&lt;/code&gt; on K loads 不行试 on Q loads，不行试 on partial stores。每一步改动单独看都合理，但整个方向已经到头了。&lt;/p&gt;
&lt;p&gt;原因不少。对话上下文积累了错误的推理路径和过时的直觉；它不会主动从历史记录里系统性提取教训；它倾向于提前宣布&amp;quot;这个方向已经到头了&amp;quot;——然后又换一个方向重复同样的模式。更根本的是，缺一个机制让它在瓶颈时停下来换视角。&lt;/p&gt;
&lt;p&gt;Dogacel 的 harness 对这些问题逐个设计了约束。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="二约束层claudemd"&gt;二、约束层：CLAUDE.md&lt;/h2&gt;
&lt;p&gt;CLAUDE.md 放在工作目录下，Claude Code 启动时自动加载。不是使用指南，是宪法——只划边界。&lt;/p&gt;</description></item></channel></rss>