microsoft
diff --git a/‎onnxruntime/core/optimizer/graph_transformer_utils.cc
+2-2 b/‎onnxruntime/core/optimizer/graph_transformer_utils.cc
+2-2
diff --git a/‎onnxruntime/core/optimizer/qdq_transformer/bias_quantization.cc
-149 b/‎onnxruntime/core/optimizer/qdq_transformer/bias_quantization.cc
-149
diff --git a/‎onnxruntime/core/optimizer/qdq_transformer/bias_quantization.h
-27 b/‎onnxruntime/core/optimizer/qdq_transformer/bias_quantization.h
-27
@@ -63,7 +63,7 @@
 #ifdef MLAS_TARGET_AMD64_IX86
 #include "core/optimizer/qdq_transformer/avx2_weight_s8_to_u8.h"
 #endif
-#include "core/optimizer/qdq_transformer/bias_quantization.h"
+#include "core/optimizer/qdq_transformer/weight_bias_quantization.h"
 #include "core/optimizer/qdq_transformer/clip_quantizelinear.h"
 #include "core/optimizer/qdq_transformer/ensure_unique_dq_for_node_unit.h"
 #include "core/optimizer/qdq_transformer/qdq_propagation.h"
@@ -245,7 +245,7 @@ InlinedVector<std::unique_ptr<GraphTransformer>> GenerateTransformers(
 
       if (!disable_quant_qdq) {
         transformers.emplace_back(std::make_unique<QDQPropagationTransformer>());
-        transformers.emplace_back(std::make_unique<BiasQuantization>());
+        transformers.emplace_back(std::make_unique<WeightBiasQuantization>());
 
         // EnsureUniqueDQForNodeUnit is actually a required graph transformation. The unique DQ per QDQ node unit input
         // condition that it ensures is important for the partitioning that happens after Level1 optimizers are run.