llvm · nujaa · Jun 12, 2024 · May 13, 2024 · May 16, 2024 · May 31, 2024
@@ -322,14 +322,20 @@ struct TransferWriteNonPermutationLowering
 ///     %v = vector.transfer_read ...
 ///         permutation_map: (d0, d1, d2, d3) -> (d1, 0, d3)
 ///     vector.broadcast %v
-struct TransferOpReduceRank : public OpRewritePattern<vector::TransferReadOp> {
-  using OpRewritePattern::OpRewritePattern;
+struct TransferOpReduceRank
+    : public MaskableOpRewritePattern<vector::TransferReadOp> {
+  using MaskableOpRewritePattern::MaskableOpRewritePattern;
 
-  LogicalResult matchAndRewrite(vector::TransferReadOp op,
-                                PatternRewriter &rewriter) const override {
+  FailureOr<mlir::Value>
+  matchAndRewriteMaskableOp(vector::TransferReadOp op,
+                            MaskingOpInterface maskOp,
+                            PatternRewriter &rewriter) const override {
     // TODO: support 0-d corner case.
     if (op.getTransferRank() == 0)
       return rewriter.notifyMatchFailure(op, "0-d corner case not supported");
+    // TODO: support masked case.
+    if (maskOp)
+      return rewriter.notifyMatchFailure(op, "Masked case not supported");
 
     AffineMap map = op.getPermutationMap();
     unsigned numLeadingBroadcast = 0;
@@ -369,9 +375,9 @@ struct TransferOpReduceRank : public OpRewritePattern<vector::TransferReadOp> {
             op.getLoc(), originalVecType.getElementType(), op.getSource(),
             op.getIndices());
       }
-      rewriter.replaceOpWithNewOp<vector::BroadcastOp>(op, originalVecType,
-                                                       newRead);
-      return success();
+      return rewriter
+          .create<vector::BroadcastOp>(op.getLoc(), originalVecType, newRead)
+          .getVector();
     }
 
     SmallVector<int64_t> newShape(
@@ -393,9 +399,9 @@ struct TransferOpReduceRank : public OpRewritePattern<vector::TransferReadOp> {
         op.getLoc(), newReadType, op.getSource(), op.getIndices(),
         AffineMapAttr::get(newMap), op.getPadding(), op.getMask(),
         newInBoundsAttr);
-    rewriter.replaceOpWithNewOp<vector::BroadcastOp>(op, originalVecType,
-                                                     newRead);
-    return success();
+    return rewriter
+        .create<vector::BroadcastOp>(op.getLoc(), originalVecType, newRead)
+        .getVector();
   }
 };
 

diff --git a/mlir/test/Dialect/Vector/vector-transfer-permutation-lowering.mlir b/mlir/test/Dialect/Vector/vector-transfer-permutation-lowering.mlir
@@ -187,3 +187,49 @@ module attributes {transform.with_named_sequence} {
     transform.yield
   }
 }
+
+// -----
+
+
+//       CHECK:   #[[MAP:.*]] = affine_map<(d0, d1, d2, d3) -> (d1, 0, d3)>
+//       CHECK:   func.func @transfer_read_reduce_rank_scalable(
+//  CHECK-SAME:       %[[ARG_0:.*]]: memref<?x?x?x?xf32>) -> vector<8x[4]x2x3xf32> {
+//       CHECK:     %[[C0:.*]] = arith.constant 0 : index
+//       CHECK:     %[[TFR:.*]] = vector.transfer_read %arg0[%[[C0]], %[[C0]], %[[C0]], %[[C0]]]{{.*}} permutation_map = #[[MAP]]} : memref<?x?x?x?xf32>, vector<[4]x2x3xf32>
+//       CHECK:     %[[BC:.*]] = vector.broadcast %[[TFR]] : vector<[4]x2x3xf32> to vector<8x[4]x2x3xf32>
+//       CHECK:     return %[[BC]] : vector<8x[4]x2x3xf32>
+func.func @transfer_read_reduce_rank_scalable(%mem: memref<?x?x?x?xf32>) -> vector<8x[4]x2x3xf32> {
 void mlir::vector::populateVectorTransferPermutationMapLoweringPatterns( 
     RewritePatternSet &patterns, PatternBenefit benefit) { 
   patterns 
       .add<TransferReadPermutationLowering, TransferWritePermutationLowering, 
            TransferOpReduceRank, TransferWriteNonPermutationLowering>( 
           patterns.getContext(), benefit); 
 } 
 /// Collect a set of transfer read/write lowering patterns that simplify the 
 /// permutation map (e.g., converting it to a minor identity map) by inserting 
 /// broadcasts and transposes. More specifically: 
 /// 
 /// [TransferReadPermutationLowering] 
 /// Lower transfer_read op with permutation into a transfer_read with a 
 /// permutation map composed of leading zeros followed by a minor identity + 
 /// vector.transpose op. 
 /// Ex: 
 ///     vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2) -> (0, d1) 
 /// into: 
 ///     %v = vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2) -> (d1, 0) 
 ///     vector.transpose %v, [1, 0] 
 /// 
 ///     vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (0, 0, 0, d1, d3) 
 /// into: 
 ///     %v = vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (0, 0, d1, 0, d3) 
 ///     vector.transpose %v, [0, 1, 3, 2, 4] 
 /// Note that an alternative is to transform it to linalg.transpose + 
 /// vector.transfer_read to do the transpose in memory instead. 
 /// 
 /// [TransferWritePermutationLowering] 
 /// Lower transfer_write op with permutation into a transfer_write with a 
 /// minor identity permutation map. (transfer_write ops cannot have broadcasts.) 
 /// Ex: 
 ///     vector.transfer_write %v ... 
 ///         permutation_map: (d0, d1, d2) -> (d2, d0, d1) 
 /// into: 
 ///     %tmp = vector.transpose %v, [2, 0, 1] 
 ///     vector.transfer_write %tmp ... 
 ///         permutation_map: (d0, d1, d2) -> (d0, d1, d2) 
 /// 
 ///     vector.transfer_write %v ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (d3, d2) 
 /// into: 
 ///     %tmp = vector.transpose %v, [1, 0] 
 ///     %v = vector.transfer_write %tmp ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (d2, d3) 
 /// 
 /// [TransferOpReduceRank] 
 /// Lower transfer_read op with broadcast in the leading dimensions into 
 /// transfer_read of lower rank + vector.broadcast. 
 /// Ex: vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (0, d1, 0, d3) 
 /// into: 
 ///     %v = vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (d1, 0, d3) 
 ///     vector.broadcast %v 
 void populateVectorTransferPermutationMapLoweringPatterns( 
     RewritePatternSet &patterns, PatternBenefit benefit = 1); 
 void mlir::vector::populateVectorTransferPermutationMapLoweringPatterns( 
     RewritePatternSet &patterns, PatternBenefit benefit) { 
   patterns 
       .add<TransferReadPermutationLowering, TransferWritePermutationLowering, 
            TransferOpReduceRank, TransferWriteNonPermutationLowering>( 
           patterns.getContext(), benefit); 
 } 
 /// Collect a set of transfer read/write lowering patterns that simplify the 
 /// permutation map (e.g., converting it to a minor identity map) by inserting 
 /// broadcasts and transposes. More specifically: 
 /// 
 /// [TransferReadPermutationLowering] 
 /// Lower transfer_read op with permutation into a transfer_read with a 
 /// permutation map composed of leading zeros followed by a minor identity + 
 /// vector.transpose op. 
 /// Ex: 
 ///     vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2) -> (0, d1) 
 /// into: 
 ///     %v = vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2) -> (d1, 0) 
 ///     vector.transpose %v, [1, 0] 
 /// 
 ///     vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (0, 0, 0, d1, d3) 
 /// into: 
 ///     %v = vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (0, 0, d1, 0, d3) 
 ///     vector.transpose %v, [0, 1, 3, 2, 4] 
 /// Note that an alternative is to transform it to linalg.transpose + 
 /// vector.transfer_read to do the transpose in memory instead. 
 /// 
 /// [TransferWritePermutationLowering] 
 /// Lower transfer_write op with permutation into a transfer_write with a 
 /// minor identity permutation map. (transfer_write ops cannot have broadcasts.) 
 /// Ex: 
 ///     vector.transfer_write %v ... 
 ///         permutation_map: (d0, d1, d2) -> (d2, d0, d1) 
 /// into: 
 ///     %tmp = vector.transpose %v, [2, 0, 1] 
 ///     vector.transfer_write %tmp ... 
 ///         permutation_map: (d0, d1, d2) -> (d0, d1, d2) 
 /// 
 ///     vector.transfer_write %v ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (d3, d2) 
 /// into: 
 ///     %tmp = vector.transpose %v, [1, 0] 
 ///     %v = vector.transfer_write %tmp ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (d2, d3) 
 /// 
 /// [TransferOpReduceRank] 
 /// Lower transfer_read op with broadcast in the leading dimensions into 
 /// transfer_read of lower rank + vector.broadcast. 
 /// Ex: vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (0, d1, 0, d3) 
 /// into: 
 ///     %v = vector.transfer_read ... 
 ///         permutation_map: (d0, d1, d2, d3) -> (d1, 0, d3) 
 ///     vector.broadcast %v 
 void populateVectorTransferPermutationMapLoweringPatterns( 
     RewritePatternSet &patterns, PatternBenefit benefit = 1); 
+  %c0 = arith.constant 0 : index
+  %cst_0 = arith.constant 0.000000e+00 : f32
+  %1 = vector.transfer_read %mem[%c0, %c0, %c0, %c0], %cst_0
+    {in_bounds = [true, true, true, true], permutation_map = affine_map<(d0, d1, d2, d3) -> (0, d1, 0, d3)>}
+    : memref<?x?x?x?xf32>, vector<8x[4]x2x3xf32>
+  return %1 : vector<8x[4]x2x3xf32>
+}
+
+// Masked case not supported.
+// CHECK-LABEL:   func.func @masked_transfer_read_reduce_rank(
+//  CHECK-SAME:       %[[ARG_0:.*]]: memref<?x?x?x?xf32>,
+//  CHECK-SAME:       %[[DIM:.*]]: index) -> vector<8x[4]x2x3xf32> {
+//   CHECK-NOT:     vector.broadcast
+//       CHECK:     %[[MASK:.*]] = vector.mask %0 { vector.transfer_read %arg0{{.*}} : memref<?x?x?x?xf32>, vector<8x[4]x2x3xf32> } : vector<[4]x3xi1> -> vector<8x[4]x2x3xf32>
+func.func @masked_transfer_read_reduce_rank(%mem: memref<?x?x?x?xf32>, %dim: index) -> vector<8x[4]x2x3xf32> {
+  %c0 = arith.constant 0 : index
+  %cst_0 = arith.constant 0.000000e+00 : f32
+  %mask = vector.create_mask %dim, %dim: vector<[4]x3xi1>
+  %res = vector.mask %mask { vector.transfer_read %mem[%c0, %c0, %c0, %c0], %cst_0
+    {in_bounds = [true, true, true, true], permutation_map = affine_map<(d0, d1, d2, d3) -> (0, d1, 0, d3)>}
+    : memref<?x?x?x?xf32>, vector<8x[4]x2x3xf32> } : vector<[4]x3xi1> -> vector<8x[4]x2x3xf32>
+  return %res : vector<8x[4]x2x3xf32>
+}
+
+module attributes {transform.with_named_sequence} {
+  transform.named_sequence @__transform_main(%module_op: !transform.any_op {transform.readonly}) {
+    %f = transform.structured.match ops{["func.func"]} in %module_op
+      : (!transform.any_op) -> !transform.any_op
+    transform.apply_patterns to %f {
+      transform.apply_patterns.vector.transfer_permutation_patterns
+    } : !transform.any_op
+    transform.yield
+  }
+}