flashinfer-ai
diff --git a/‎benchmarks/bench_deepseek_mla.py
+3-2 b/‎benchmarks/bench_deepseek_mla.py
+3-2
@@ -76,6 +76,7 @@ def bench_deepseek_mla_decode(batch_size, seq_len, num_heads, backend):
 
 
 if __name__ == "__main__":
-    for seq_len in [1024, 2048]:
+    for seq_len in [1024, 2048, 8192]:
         for batch_size in [64, 128, 768]:
-            bench_deepseek_mla_decode(batch_size, seq_len, 64, "auto")
+            for num_heads in [64, 128]:
+                bench_deepseek_mla_decode(batch_size, seq_len, num_heads, "auto")