LiteRt Qualcomm wrappers

weilhuan-quic · weilhuan-quic · commit 4833a205be9c · 2025-02-04T17:09:54.000+08:00
diff --git a/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/BUILD b/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/BUILD
@@ -0,0 +1,66 @@
+# TODO: license
+
+package(
+    # copybara:uncomment default_applicable_licenses = ["//tensorflow:license"],
+    default_visibility = ["//tensorflow/lite/experimental/litert/vendors/qualcomm:__subpackages__"],
+)
+
+cc_library(
+    name = "quantize_params_wrapper",
+    srcs = ["quantize_params_wrapper.cc"],
+    hdrs = ["quantize_params_wrapper.h"],
+    tags = [
+        # Don't build/test in OS until qnn is available.
+        "nobuilder",
+    ],
+    deps = [
+        # copybara:uncomment "//third_party/qairt/latest:qnn_lib_headers",
+        "//third_party/qairt/latest:qnn_lib_headers",
+    ],
+)
+
+cc_library(
+    name = "tensor_wrapper",
+    srcs = ["tensor_wrapper.cc"],
+    hdrs = ["tensor_wrapper.h"],
+    tags = [
+        # Don't build/test in OS until qnn is available.
+        "nobuilder",
+    ],
+    deps = [
+        # copybara:uncomment "//third_party/qairt/latest:qnn_lib_headers",
+        "//third_party/qairt/latest:qnn_lib_headers",
+        "//tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers:quantize_params_wrapper",
+    ],
+)
+
+cc_library(
+    name = "param_wrapper",
+    srcs = ["param_wrapper.cc"],
+    hdrs = ["param_wrapper.h"],
+    tags = [
+        # Don't build/test in OS until qnn is available.
+        "nobuilder",
+    ],
+    deps = [
+        # copybara:uncomment "//third_party/qairt/latest:qnn_lib_headers",
+        "//third_party/qairt/latest:qnn_lib_headers",
+        "//tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers:tensor_wrapper",
+    ],
+)
+
+cc_library(
+    name = "op_wrapper",
+    srcs = ["op_wrapper.cc"],
+    hdrs = ["op_wrapper.h"],
+    tags = [
+        # Don't build/test in OS until qnn is available.
+        "nobuilder",
+    ],
+    deps = [
+        # copybara:uncomment "//third_party/qairt/latest:qnn_lib_headers",
+        "//third_party/qairt/latest:qnn_lib_headers",
+        "//tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers:tensor_wrapper",
+        "//tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers:param_wrapper",
+    ],
+)
diff --git a/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/op_wrapper.cc b/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/op_wrapper.cc
@@ -0,0 +1,73 @@
+//==============================================================================
+//
+//  Copyright (c) Qualcomm Technologies, Inc.
+//  All Rights Reserved.
+//  Confidential and Proprietary - Qualcomm Technologies, Inc.
+//
+//==============================================================================
+#include "tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/op_wrapper.h"
+
+namespace qnn {
+
+OpWrapper::OpWrapper(std::string name, const char* op_type)
+    : name_{std::move(name)} {
+  qnn_op_.v1.packageName = QNN_OP_PACKAGE_NAME_QTI_AISW;
+  qnn_op_.v1.typeName = op_type;
+  qnn_op_.v1.name = name_.c_str();
+}
+
+OpWrapper::OpWrapper(const OpWrapper& other)
+    : qnn_op_{other.qnn_op_},
+      name_{other.name_},
+      params_{other.params_},
+      input_tensors_{other.input_tensors_},
+      output_tensors_{other.output_tensors_} {
+  qnn_op_.v1.name = name_.c_str();
+  qnn_op_.v1.params = params_.data();
+  qnn_op_.v1.inputTensors = input_tensors_.data();
+  qnn_op_.v1.outputTensors = output_tensors_.data();
+}
+
+OpWrapper::OpWrapper(OpWrapper&& other)
+    : qnn_op_{other.qnn_op_},
+      name_{std::move(other.name_)},
+      params_{std::move(other.params_)},
+      input_tensors_{std::move(other.input_tensors_)},
+      output_tensors_{std::move(other.output_tensors_)} {
+  qnn_op_.v1.name = name_.c_str();
+  qnn_op_.v1.params = params_.data();
+  qnn_op_.v1.inputTensors = input_tensors_.data();
+  qnn_op_.v1.outputTensors = output_tensors_.data();
+}
+
+OpWrapper::~OpWrapper() = default;
+
+void OpWrapper::AddInputTensor(const TensorWrapper& tensor) {
+  auto& back = input_tensors_.emplace_back();
+  tensor.CloneTo(back);
+
+  qnn_op_.v1.numOfInputs = input_tensors_.size();
+  qnn_op_.v1.inputTensors = input_tensors_.data();
+}
+
+void OpWrapper::AddOutputTensor(const TensorWrapper& tensor) {
+  auto& back = output_tensors_.emplace_back();
+  tensor.CloneTo(back);
+
+  qnn_op_.v1.numOfOutputs = output_tensors_.size();
+  qnn_op_.v1.outputTensors = output_tensors_.data();
+}
+
+void OpWrapper::AddTensorParam(const char* name, const TensorWrapper& tensor) {
+  TensorParamWrapper param_wrapper(name, tensor);
+
+  auto& back = params_.emplace_back();
+  param_wrapper.CloneTo(back);
+
+  qnn_op_.v1.numOfParams = params_.size();
+  qnn_op_.v1.params = params_.data();
+}
+
+const Qnn_OpConfig_t& OpWrapper::GetOpConfig() const { return qnn_op_; }
+
+}  // namespace qnn
diff --git a/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/op_wrapper.h b/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/op_wrapper.h
@@ -0,0 +1,57 @@
+//==============================================================================
+//
+//  Copyright (c) Qualcomm Technologies, Inc.
+//  All Rights Reserved.
+//  Confidential and Proprietary - Qualcomm Technologies, Inc.
+//
+//==============================================================================
+#ifndef TENSORFLOW_LITE_EXPERIMENTAL_LITERT_VENDORS_QUALCOMM_CORE_WRAPPERS_OP_WRAPPER_H_
+#define TENSORFLOW_LITE_EXPERIMENTAL_LITERT_VENDORS_QUALCOMM_CORE_WRAPPERS_OP_WRAPPER_H_
+
+#include "tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/param_wrapper.h"
+#include "tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/tensor_wrapper.h"
+#include "third_party/qairt/latest/include/QNN/QnnOpDef.h"
+
+namespace qnn {
+
+class OpWrapper final {
+ public:
+  explicit OpWrapper(std::string name, const char* op_type);
+
+  OpWrapper(const OpWrapper& other);
+
+  OpWrapper(OpWrapper&& other);
+
+  ~OpWrapper();
+
+  void AddInputTensor(const TensorWrapper& tensor);
+
+  void AddOutputTensor(const TensorWrapper& tensor);
+
+  template <typename T>
+  void AddScalarParam(const char* name, const T data,
+                      const bool is_quant = false) {
+    ScalarParamWrapper param_wrapper(name, data, is_quant);
+
+    auto& back = params_.emplace_back();
+    param_wrapper.CloneTo(back);
+
+    qnn_op_.v1.numOfParams = params_.size();
+    qnn_op_.v1.params = params_.data();
+  }
+
+  void AddTensorParam(const char* name, const TensorWrapper& tensor);
+
+  const Qnn_OpConfig_t& GetOpConfig() const;
+
+ private:
+  Qnn_OpConfig_t qnn_op_ = QNN_OPCONFIG_INIT;
+  std::string name_{};  // human readable name
+  std::vector<Qnn_Param_t> params_{};
+  std::vector<Qnn_Tensor_t> input_tensors_{};
+  std::vector<Qnn_Tensor_t> output_tensors_{};
+};
+
+}  // namespace qnn
+
+#endif  // TENSORFLOW_LITE_EXPERIMENTAL_LITERT_VENDORS_QUALCOMM_CORE_WRAPPERS_OP_WRAPPER_H_
diff --git a/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/param_wrapper.cc b/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/param_wrapper.cc
@@ -0,0 +1,23 @@
+//==============================================================================
+//
+//  Copyright (c) Qualcomm Technologies, Inc.
+//  All Rights Reserved.
+//  Confidential and Proprietary - Qualcomm Technologies, Inc.
+//
+//==============================================================================
+#include "tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/param_wrapper.h"
+
+namespace qnn {
+
+void ScalarParamWrapper::CloneTo(Qnn_Param_t& dst) const { dst = qnn_param_; }
+
+TensorParamWrapper::TensorParamWrapper(const char* name,
+                                       const TensorWrapper& tensor) {
+  qnn_param_.name = name;
+  qnn_param_.paramType = QNN_PARAMTYPE_TENSOR;
+  tensor.CloneTo(qnn_param_.tensorParam);
+}
+
+void TensorParamWrapper::CloneTo(Qnn_Param_t& dst) const { dst = qnn_param_; }
+
+}  // namespace qnn
diff --git a/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/param_wrapper.h b/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/param_wrapper.h
@@ -0,0 +1,78 @@
+//==============================================================================
+//
+//  Copyright (c) Qualcomm Technologies, Inc.
+//  All Rights Reserved.
+//  Confidential and Proprietary - Qualcomm Technologies, Inc.
+//
+//==============================================================================
+#ifndef TENSORFLOW_LITE_EXPERIMENTAL_LITERT_VENDORS_QUALCOMM_CORE_WRAPPERS_PARAM_WRAPPER_H_
+#define TENSORFLOW_LITE_EXPERIMENTAL_LITERT_VENDORS_QUALCOMM_CORE_WRAPPERS_PARAM_WRAPPER_H_
+
+#include <type_traits>
+
+#include "tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/tensor_wrapper.h"
+#include "third_party/qairt/latest/include/QNN/QnnTypes.h"
+
+namespace qnn {
+
+class ScalarParamWrapper {
+ public:
+  template <typename T>
+  explicit ScalarParamWrapper(const char* name, const T data,
+                              const bool is_quant) {
+    qnn_param_.name = name;
+    qnn_param_.paramType = QNN_PARAMTYPE_SCALAR;
+    if constexpr (std::is_same_v<T, bool>) {
+      qnn_param_.scalarParam.dataType = QNN_DATATYPE_BOOL_8;
+      qnn_param_.scalarParam.bool8Value = data;
+    } else if constexpr (std::is_same_v<T, std::uint8_t>) {
+      qnn_param_.scalarParam.dataType =
+          is_quant ? QNN_DATATYPE_UFIXED_POINT_8 : QNN_DATATYPE_UINT_8;
+      qnn_param_.scalarParam.uint8Value = data;
+    } else if constexpr (std::is_same_v<T, std::int8_t>) {
+      qnn_param_.scalarParam.dataType =
+          is_quant ? QNN_DATATYPE_SFIXED_POINT_8 : QNN_DATATYPE_INT_8;
+      qnn_param_.scalarParam.int8Value = data;
+    } else if constexpr (std::is_same_v<T, std::uint16_t>) {
+      qnn_param_.scalarParam.dataType =
+          is_quant ? QNN_DATATYPE_UFIXED_POINT_16 : QNN_DATATYPE_UINT_16;
+      qnn_param_.scalarParam.uint16Value = data;
+    } else if constexpr (std::is_same_v<T, std::int16_t>) {
+      qnn_param_.scalarParam.dataType =
+          is_quant ? QNN_DATATYPE_SFIXED_POINT_16 : QNN_DATATYPE_INT_16;
+      qnn_param_.scalarParam.int16Value = data;
+    } else if constexpr (std::is_same_v<T, std::uint32_t>) {
+      qnn_param_.scalarParam.dataType =
+          is_quant ? QNN_DATATYPE_UFIXED_POINT_32 : QNN_DATATYPE_UINT_32;
+      qnn_param_.scalarParam.uint32Value = data;
+    } else if constexpr (std::is_same_v<T, std::int32_t>) {
+      qnn_param_.scalarParam.dataType =
+          is_quant ? QNN_DATATYPE_SFIXED_POINT_32 : QNN_DATATYPE_INT_32;
+      qnn_param_.scalarParam.int32Value = data;
+    } else if constexpr (std::is_same_v<T, float>) {
+      qnn_param_.scalarParam.dataType = QNN_DATATYPE_FLOAT_32;
+      qnn_param_.scalarParam.floatValue = data;
+    } else {
+      // TODO: error log
+    }
+  }
+
+  void CloneTo(Qnn_Param_t& dst) const;
+
+ private:
+  Qnn_Param_t qnn_param_ = QNN_PARAM_INIT;
+};
+
+class TensorParamWrapper {
+ public:
+  explicit TensorParamWrapper(const char* name, const TensorWrapper& tensor);
+
+  void CloneTo(Qnn_Param_t& dst) const;
+
+ private:
+  Qnn_Param_t qnn_param_ = QNN_PARAM_INIT;
+};
+
+}  // namespace qnn
+
+#endif  // TENSORFLOW_LITE_EXPERIMENTAL_LITERT_VENDORS_QUALCOMM_CORE_WRAPPERS_PARAM_WRAPPER_H_
diff --git a/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/quantize_params_wrapper.cc b/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/quantize_params_wrapper.cc
@@ -0,0 +1,85 @@
+//==============================================================================
+//
+//  Copyright (c) Qualcomm Technologies, Inc.
+//  All Rights Reserved.
+//  Confidential and Proprietary - Qualcomm Technologies, Inc.
+//
+//==============================================================================
+#include "tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/quantize_params_wrapper.h"
+
+#include <cassert>
+
+namespace qnn {
+
+UndefinedQuantizeParamsWrapper::UndefinedQuantizeParamsWrapper() = default;
+
+UndefinedQuantizeParamsWrapper::UndefinedQuantizeParamsWrapper(
+    const UndefinedQuantizeParamsWrapper&) = default;
+
+UndefinedQuantizeParamsWrapper::UndefinedQuantizeParamsWrapper(
+    UndefinedQuantizeParamsWrapper&&) = default;
+
+void UndefinedQuantizeParamsWrapper::CloneTo(Qnn_QuantizeParams_t& dst) {
+  dst = qnn_quantize_param_;
+}
+
+ScaleOffsetQuantizeParamsWrapper::ScaleOffsetQuantizeParamsWrapper(
+    const float scale, const std::int32_t zero_point) {
+  qnn_quantize_param_.encodingDefinition = QNN_DEFINITION_DEFINED;
+  qnn_quantize_param_.quantizationEncoding =
+      QNN_QUANTIZATION_ENCODING_SCALE_OFFSET;
+  qnn_quantize_param_.scaleOffsetEncoding.scale = scale;
+  qnn_quantize_param_.scaleOffsetEncoding.offset = -1 * zero_point;
+}
+
+ScaleOffsetQuantizeParamsWrapper::ScaleOffsetQuantizeParamsWrapper(
+    const ScaleOffsetQuantizeParamsWrapper&) = default;
+
+ScaleOffsetQuantizeParamsWrapper::ScaleOffsetQuantizeParamsWrapper(
+    ScaleOffsetQuantizeParamsWrapper&&) = default;
+
+void ScaleOffsetQuantizeParamsWrapper::CloneTo(Qnn_QuantizeParams_t& dst) {
+  dst = qnn_quantize_param_;
+}
+
+AxisScaleOffsetQuantizeParamsWrapper::AxisScaleOffsetQuantizeParamsWrapper(
+    const std::int32_t axis, const std::span<const float> scales,
+    const std::span<const std::int32_t> zero_points)
+    : scale_offsets_(scales.size()) {
+  assert(scales.size() == zero_points.size());
+  for (size_t i = 0; i < scale_offsets_.size(); ++i) {
+    scale_offsets_[i].scale = scales[i];
+    scale_offsets_[i].offset = -1 * zero_points[i];
+  }
+
+  qnn_quantize_param_.encodingDefinition = QNN_DEFINITION_DEFINED;
+  qnn_quantize_param_.quantizationEncoding =
+      QNN_QUANTIZATION_ENCODING_AXIS_SCALE_OFFSET;
+  qnn_quantize_param_.axisScaleOffsetEncoding.axis = axis;
+  qnn_quantize_param_.axisScaleOffsetEncoding.numScaleOffsets =
+      scale_offsets_.size();
+  qnn_quantize_param_.axisScaleOffsetEncoding.scaleOffset =
+      scale_offsets_.data();
+}
+
+AxisScaleOffsetQuantizeParamsWrapper::AxisScaleOffsetQuantizeParamsWrapper(
+    const AxisScaleOffsetQuantizeParamsWrapper& rhs)
+    : qnn_quantize_param_{rhs.qnn_quantize_param_},
+      scale_offsets_{rhs.scale_offsets_} {
+  qnn_quantize_param_.axisScaleOffsetEncoding.scaleOffset =
+      scale_offsets_.data();
+}
+
+AxisScaleOffsetQuantizeParamsWrapper::AxisScaleOffsetQuantizeParamsWrapper(
+    AxisScaleOffsetQuantizeParamsWrapper&& rhs)
+    : qnn_quantize_param_{rhs.qnn_quantize_param_},
+      scale_offsets_{std::move(rhs.scale_offsets_)} {
+  qnn_quantize_param_.axisScaleOffsetEncoding.scaleOffset =
+      scale_offsets_.data();
+}
+
+void AxisScaleOffsetQuantizeParamsWrapper::CloneTo(Qnn_QuantizeParams_t& dst) {
+  dst = qnn_quantize_param_;
+}
+
+}  // namespace qnn
diff --git a/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/quantize_params_wrapper.h b/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/quantize_params_wrapper.h
diff --git a/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/tensor_wrapper.cc b/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/tensor_wrapper.cc
diff --git a/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/tensor_wrapper.h b/tensorflow/lite/experimental/litert/vendors/qualcomm/core/wrappers/tensor_wrapper.h