[Bugfix] Remove triton do_bench fast_flush arg (#16256)

kebe7jun · web-flow · commit e11880deea8a · 2025-04-08T13:51:06.000Z
Signed-off-by: Kebe &lt;mail@kebe7jun.com&gt;
diff --git a/tests/kernels/test_flashmla.py b/tests/kernels/test_flashmla.py
@@ -124,7 +124,7 @@ def ref_mla():
     cal_diff(out_flash, out_torch, "out")
     cal_diff(lse_flash, lse_torch, "lse")
 
-    t = triton.testing.do_bench(flash_mla, fast_flush=False)
+    t = triton.testing.do_bench(flash_mla)
     FLOPS = s_q * total_seqlens * h_q * (d + dv) * 2
     bytes = (total_seqlens * h_kv * d + b * s_q * h_q * d +
              b * s_q * h_q * dv) * (torch.finfo(dtype).bits // 8)