[MLIR] Enable ViewOp in Affine Lowerer (#3911)

* Map each ng tensor to a linear buffer and a view * fix comment * Create views only when a value is assigned a buffer id * style * Fix lit test

[MLIR] Enable ViewOp in Affine Lowerer (#3911)
* Map each ng tensor to a linear buffer and a view * fix comment * Create views only when a value is assigned a buffer id * style * Fix lit test
96062512 · Nagy Mostafa · Scott Cyphers · e5436889 · 96062512 · 96062512
Commit 96062512 authored Nov 27, 2019 by Nagy Mostafa Committed by Scott Cyphers Nov 27, 2019
Hide whitespace changes
Inline Side-by-side

Showing with 101 additions and 11 deletions

affine_lowerer.cpp src/contrib/mlir/backend/pass/affine_lowerer.cpp +82 -11

core_ops.mlir test/mlir/affine_conversion/core_ops.mlir +19 -0

No files found.
--- a/src/contrib/mlir/backend/pass/affine_lowerer.cpp
+++ b/src/contrib/mlir/backend/pass/affine_lowerer.cpp
@@ -183,7 +183,20 @@ namespace
        void runOnModule() override;

        SmallVector<Value*, 4> buildOutputDefs(Operation* op, PatternRewriter& rewriter);
-        Value* createTempTensor(Type type, PatternRewriter& rewriter);
+        /// Allocates a linear buffer for a temporary tensor
+        Value* createTempBuffer(Type type, PatternRewriter& rewriter);
+
+        /// Creates an allocation or view of a memref.
+        /// type     MemRef Type
+        /// buffer   Optional buffer value to create view over
+        /// offset   Optional offset into the buffer this view starts at
+        ///
+        /// If buffer is null, a new allocation of a memref is created.
+        /// Offset is ignored.  If buffer is non-null, then we create a temp
+        /// view over a pre-allocated buffer (see createTempBuffer)
+
+        Value*
+            createTempMemref(Type type, Value* buffer, unsigned offset, PatternRewriter& rewriter);

        /// Inserts dealloc Ops for each temporary allocated by AllocOp
        void insertDeallocs(PatternRewriter& rewriter);
@@ -313,44 +326,63 @@ namespace
            }
            else
            {
+                // For temporaries, we create two instructions:
+                // 1. Linear buffer allocation: If the ng value already has a buffer ID assigned,
+                //    we re-use that linear buffer SSA value, else generate an AllocOp.
+                // 2. View creation: Create a view with the tensor shape and an N-D to 1 map over
+                //    the linear buffer.
+                // If two memrefs are defined via 2 Views over the same buffer, then they share and
+                // will re-use the same buffer.
                auto tensorType = origResult->getType().cast<NGTensorType>();
-                Value* newResult;
+                Value* newResult = nullptr;
                Attribute bufferIdAttr = getBufferId(op);
+                Type memRefType = typeConverter.convertType(tensorType);
+
+                Value* bufferValue = nullptr;
                if (!bufferIdAttr)
                {
                    // Allocate new memref
-                    newResult = createTempTensor(typeConverter.convertType(tensorType), rewriter);
+                    newResult = createTempMemref(memRefType, nullptr, 0, rewriter);
                }
                else
                {
                    unsigned bufferId = bufferIdAttr.cast<IntegerAttr>().getInt();
-                    // Re-use a memref if it exist, else create a new one and update map
+                    // Re-use a buffer if it exist, else create a new one and update map
                    IdToMemRefMap::iterator it = m_id_to_memref.find(bufferId);
                    if (it == m_id_to_memref.end())
                    {
-                        // create a new memref
-                        newResult =
-                            createTempTensor(typeConverter.convertType(tensorType), rewriter);
-                        m_id_to_memref[bufferId] = newResult;
+                        // create a new buffer
+                        bufferValue = createTempBuffer(memRefType, rewriter);
+                        m_id_to_memref[bufferId] = bufferValue;
                    }
                    else
                    {
-                        newResult = it->second;
+                        bufferValue = it->second;
                    }
+                    // Create a temp view over the linear buffer
+                    newResult = createTempMemref(memRefType, bufferValue, 0, rewriter);
                }
+                NGRAPH_CHECK(newResult != nullptr, "Temp memref value is not set");
                newResults.push_back(newResult);
            }
        }
        return newResults;
    }

-    Value* DialectLoweringPass::createTempTensor(Type type, PatternRewriter& rewriter)
+    Value* DialectLoweringPass::createTempBuffer(Type type, PatternRewriter& rewriter)
    {
        MemRefType memRefType = type.cast<MemRefType>();

        NGRAPH_CHECK(memRefType.hasStaticShape(), "Dynamic shapes are not supported");

-        Value* alloc = rewriter.create<mlir::AllocOp>(rewriter.getUnknownLoc(), memRefType);
+        // deduce linear buffer shape
+        unsigned sizeInBytes = memRefType.getSizeInBits() / 8;
+
+        MemRefType bufferType =
+            MemRefType::get({sizeInBytes}, IntegerType::get(8, type.getContext()), {});
+
+        Value* alloc = rewriter.create<mlir::AllocOp>(rewriter.getUnknownLoc(), bufferType);
+
        memRefsToDealloc.push_back(alloc);

        // TODO:
@@ -366,6 +398,45 @@ namespace
        return alloc;
    }

+    Value* DialectLoweringPass::createTempMemref(Type type,
+                                                 Value* buffer,
+                                                 unsigned offset,
+                                                 PatternRewriter& rewriter)
+    {
+        NGRAPH_CHECK(offset == 0, "Only zero offset is supported");
+        MemRefType memRefType = type.cast<MemRefType>();
+        if (buffer)
+        {
+            // We have a buffer to map to. Create a view over it.
+
+            // Create the N-D to 1D affine expression mapping the memref shape to the underlying
+            // linear
+            // buffer
+            // This is simply (d0, d1, d2, .. dN-1) --> d0 * S0 + d1 * S1 ... + dN-1 * SN-1
+            // Where Si is the stride along the i_th dimension
+            auto shape = memRefType.getShape();
+            SmallVector<int64_t, 4> strides(shape.size(), 0);
+            strides[shape.size() - 1] = 1;
+            for (int64_t i = shape.size() - 2; i >= 0; i--)
+            {
+                strides[i] = strides[i + 1] * shape[i + 1];
+            }
+
+            auto map = makeStridedLinearLayoutMap(strides, offset, rewriter.getContext());
+            MemRefType newMemRefType = MemRefType::get(shape, memRefType.getElementType(), map);
+            auto viewOp = rewriter.create<mlir::ViewOp>(
+                buffer->getDefiningOp()->getLoc(), newMemRefType, buffer, llvm::None);
+            return viewOp.getResult();
+        }
+
+        // No buffer, create an atomic memref without underlying buffer
+        NGRAPH_CHECK(memRefType.hasStaticShape(), "Dynamic shapes are not supported");
+
+        Value* alloc = rewriter.create<mlir::AllocOp>(rewriter.getUnknownLoc(), memRefType);
+        memRefsToDealloc.push_back(alloc);
+        return alloc;
+    }
+
    /// Add llvm.noalias attribute to all the memref function arguments. We know that this is safe
    /// by nGraph op semantics.
    void DialectLoweringPass::insertNoAliasArgAttrs()

--- a/test/mlir/affine_conversion/core_ops.mlir
+++ b/test/mlir/affine_conversion/core_ops.mlir
@@ -36,3 +36,22 @@ func @simple_dot(%arg0: !ng.tensor<16x8xf32>, %arg1: !ng.tensor<8x32xf32>) -> !n
   %0 = "ng.dot"(%arg0, %arg1) : (!ng.tensor<16x8xf32>, !ng.tensor<8x32xf32>) -> !ng.tensor<16x32xf32>
  "ng.return"(%0) : (!ng.tensor<16x32xf32>) -> ()
 }
+
+// -----
+
+// std.view 
+
+// CHECK-DAG: #[[MAP0:[a-zA-Z0-9]+]] = (d0, d1) -> (d0 * 2 + d1)
+// CHECK:       %[[T1:[0-9]+]] = alloc() : memref<24xi8>
+// CHECK-NEXT:  %[[T2:[0-9]+]] = std.view %[[T1]][][] : memref<24xi8> to memref<3x2xf32, #[[MAP0]]>
+// CHECK:       affine.store %{{[0-9]+}}, %[[T2]][%{{.*}}, %{{.*}}] : memref<3x2xf32, #[[MAP0]]>
+//
+// CHECK:       %[[T4:[0-9]+]] = std.view %[[T1]][][] : memref<24xi8> to memref<3x2xf32, #[[MAP0]]>
+// CHECK:       affine.store %{{[0-9]+}}, %[[T4]][%{{.*}}, %{{.*}}] : memref<3x2xf32, #[[MAP0]]>
+
+func @add(%arg0: !ng.tensor<3x2xf32>, %arg1: !ng.tensor<3x2xf32>) -> !ng.tensor<3x2xf32> {
+  %0 = "ng.add"(%arg0, %arg1) {ng.buffer_id = 0 : i64} : (!ng.tensor<3x2xf32>, !ng.tensor<3x2xf32>) -> !ng.tensor<3x2xf32>
+  %2 = "ng.add"(%0, %0) {ng.buffer_id = 0 : i64}: (!ng.tensor<3x2xf32>, !ng.tensor<3x2xf32>) -> !ng.tensor<3x2xf32>
+  %3 = "ng.add"(%2, %2) : (!ng.tensor<3x2xf32>, !ng.tensor<3x2xf32>) -> !ng.tensor<3x2xf32>
+  "ng.return"(%3) : (!ng.tensor<3x2xf32>) -> ()
+}