Merge pull request #372 from guoruoqian/cumsum

narendasan · web-flow · commit 7be368fcff36 · 2021-04-30T15:52:47.000-06:00
support cumsum converter
diff --git a/core/conversion/converters/BUILD b/core/conversion/converters/BUILD
@@ -36,6 +36,7 @@ cc_library(
         "impl/concat.cpp",
         "impl/constant.cpp",
         "impl/conv_deconv.cpp",
+        "impl/cumsum.cpp",
         "impl/element_wise.cpp",
         "impl/expand.cpp",
         "impl/interpolate.cpp",
diff --git a/core/conversion/converters/impl/cumsum.cpp b/core/conversion/converters/impl/cumsum.cpp
@@ -0,0 +1,74 @@
+#include "NvInfer.h"
+#include "core/conversion/converters/converters.h"
+#include "core/conversion/tensorcontainer/TensorContainer.h"
+#include "core/util/prelude.h"
+#include "core/util/trt_util.h"
+#include "torch/torch.h"
+
+#include <ATen/ATen.h>
+#include <vector>
+
+namespace trtorch {
+namespace core {
+namespace conversion {
+namespace converters {
+namespace impl {
+namespace {
+
+auto cumsum_registrations TRTORCH_UNUSED = RegisterNodeConversionPatterns().pattern(
+    {"aten::cumsum(Tensor self, int dim, *, int? dtype=None) -> (Tensor)",
+     [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
+       auto in = args[0].ITensorOrFreeze(ctx);
+       auto input_dims = in->getDimensions();
+       int dim = args[1].unwrapToInt();
+       TRTORCH_CHECK(
+           (dim >= 0 && dim < input_dims.nbDims) || (dim < 0 && (input_dims.nbDims + dim >= 0)),
+           "Dimension out of range (expected to be in range of [" << -input_dims.nbDims << ", " << input_dims.nbDims - 1
+                                                                  << "], but got " << dim << ")");
+       if (dim < 0) {
+         dim += input_dims.nbDims;
+       }
+
+       // Scan through each slice across summation axis and add it to the running sum
+       auto loop = ctx->net->addLoop();
+       nvinfer1::ITensor* tripLimit = NULL;
+       if (input_dims.d[dim] > 0) {
+         torch::Tensor axis = torch::tensor(input_dims.d[dim], torch::kInt32);
+         tripLimit = tensor_to_const(ctx, axis);
+       } else {
+         nvinfer1::ITensor* inpShape = ctx->net->addShape(*in)->getOutput(0);
+         torch::Tensor dimValue = torch::tensor(dim, torch::kInt32);
+         nvinfer1::ITensor* axis = tensor_to_const(ctx, dimValue);
+         tripLimit = ctx->net->addGather(*inpShape, *axis, 0)->getOutput(0);
+       }
+
+       loop->addTripLimit(*tripLimit, nvinfer1::TripLimit::kCOUNT);
+
+       auto iterator = loop->addIterator(*in, dim, false);
+       auto data = iterator->getOutput(0);
+       auto newDims = data->getDimensions();
+
+       torch::Tensor zeroValue = at::full(util::toVec(newDims), 0, torch::kFloat32);
+       auto zeroTensor = tensor_to_const(ctx, zeroValue);
+       auto runningSum = loop->addRecurrence(*zeroTensor);
+       auto runningSumTensor = runningSum->getOutput(0);
+
+       auto curSum = ctx->net->addElementWise(*data, *runningSumTensor, nvinfer1::ElementWiseOperation::kSUM);
+       runningSum->setInput(1, *curSum->getOutput(0));
+
+       nvinfer1::ILoopOutputLayer* loopOut =
+           loop->addLoopOutput(*curSum->getOutput(0), nvinfer1::LoopOutput::kCONCATENATE, dim);
+       loopOut->setInput(1, *tripLimit);
+
+       auto layer_output = ctx->AssociateValueAndTensor(n->outputs()[0], loopOut->getOutput(0));
+
+       LOG_DEBUG("Output tensor shape: " << layer_output->getDimensions());
+       return true;
+     }});
+
+} // namespace
+} // namespace impl
+} // namespace converters
+} // namespace conversion
+} // namespace core
+} // namespace trtorch
diff --git a/tests/core/conversion/converters/BUILD b/tests/core/conversion/converters/BUILD
@@ -23,6 +23,10 @@ converter_test(
     name = "test_conv_deconv",
 )
 
+converter_test(
+    name = "test_cumsum"
+)
+
 converter_test(
     name = "test_element_wise",
 )
@@ -96,7 +100,9 @@ test_suite(
     tests = [
         ":test_activation",
         ":test_batch_norm",
+        ":test_concat",
         ":test_conv_deconv",
+        ":test_cumsum",
         ":test_element_wise",
         ":test_expand",
         ":test_interpolate",
diff --git a/tests/core/conversion/converters/test_concat.cpp b/tests/core/conversion/converters/test_concat.cpp
@@ -31,7 +31,7 @@ TEST(Converters, ATenCatPureTensorConvertsCorrectly) {
 TEST(Converters, ATenCatDiffTensorConvertsCorrectly) {
   const auto graph = R"IR(
       graph(%0 : Tensor,
-            %1 : Float(5:1)):
+            %1 : Float(5)):
         %2 : Tensor[] = prim::ListConstruct(%0, %1)
         %3 : int = prim::Constant[value=0]()
         %4 : Tensor = aten::cat(%2, %3)
diff --git a/tests/core/conversion/converters/test_cumsum.cpp b/tests/core/conversion/converters/test_cumsum.cpp
@@ -0,0 +1,93 @@
+#include <string>
+#include "core/compiler.h"
+#include "gtest/gtest.h"
+#include "tests/util/util.h"
+#include "torch/csrc/jit/ir/irparser.h"
+
+TEST(Converters, ATenCumsumConvertsCorrectly) {
+  const auto graph = R"IR(
+      graph(%0 : Tensor):
+        %1 : int = prim::Constant[value=1]()
+        %2 : None = prim::Constant()
+        %3 : Tensor = aten::cumsum(%0, %1, %2)
+        return (%3))IR";
+
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, &*g);
+
+  auto in = at::randint(-5, 5, {2, 3, 4}, {at::kCUDA});
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  in = at::clone(in);
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0], 2e-6));
+}
+
+TEST(Converters, ATenCumsumConvertsCorrectlyWithDynamicInput) {
+  const auto graph = R"IR(
+      graph(%0 : Tensor):
+        %1 : int = prim::Constant[value=1]()
+        %2 : None = prim::Constant()
+        %3 : Tensor = aten::cumsum(%0, %1, %2)
+        return (%3))IR";
+
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, &*g);
+
+  auto in = at::randint(-5, 5, {2, 3, 4}, {at::kCUDA});
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  in = at::clone(in);
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto trt_results = trtorch::tests::util::RunGraphEngineDynamic(g, params, {in});
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0], 2e-6));
+}
+
+TEST(Converters, ATenCumsumNegativeDimConvertsCorrectly) {
+  const auto graph = R"IR(
+      graph(%0 : Tensor):
+        %1 : int = prim::Constant[value=-2]()
+        %2 : None = prim::Constant()
+        %3 : Tensor = aten::cumsum(%0, %1, %2)
+        return (%3))IR";
+
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, &*g);
+
+  auto in = at::randint(-5, 5, {2, 3, 4}, {at::kCUDA});
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  in = at::clone(in);
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0], 2e-6));
+}
+
+TEST(Converters, ATenCumsumNegativeDimConvertsCorrectlyWithDynamicInput) {
+  const auto graph = R"IR(
+      graph(%0 : Tensor):
+        %1 : int = prim::Constant[value=-2]()
+        %2 : None = prim::Constant()
+        %3 : Tensor = aten::cumsum(%0, %1, %2)
+        return (%3))IR";
+
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, &*g);
+
+  auto in = at::randint(-5, 5, {2, 3, 4}, {at::kCUDA});
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  in = at::clone(in);
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto trt_results = trtorch::tests::util::RunGraphEngineDynamic(g, params, {in});
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0], 2e-6));
+}