Xilinx
diff --git a/‎mlir/include/mlir/Conversion/Passes.td
Lines changed: 27 additions & 5 deletions b/‎mlir/include/mlir/Conversion/Passes.td
Lines changed: 27 additions & 5 deletions
diff --git a/‎mlir/include/mlir/Dialect/Vector/Transforms/LoweringPatterns.h
Lines changed: 7 additions & 4 deletions b/‎mlir/include/mlir/Dialect/Vector/Transforms/LoweringPatterns.h
Lines changed: 7 additions & 4 deletions
diff --git a/‎mlir/lib/Conversion/VectorToLLVM/ConvertVectorToLLVMPass.cpp
Lines changed: 2 additions & 2 deletions b/‎mlir/lib/Conversion/VectorToLLVM/ConvertVectorToLLVMPass.cpp
Lines changed: 2 additions & 2 deletions
diff --git a/‎mlir/lib/Dialect/PDL/IR/Builtins.cpp
Lines changed: 4 additions & 8 deletions b/‎mlir/lib/Dialect/PDL/IR/Builtins.cpp
Lines changed: 4 additions & 8 deletions
diff --git a/‎mlir/lib/Dialect/SPIRV/Transforms/SPIRVConversion.cpp
Lines changed: 2 additions & 3 deletions b/‎mlir/lib/Dialect/SPIRV/Transforms/SPIRVConversion.cpp
Lines changed: 2 additions & 3 deletions
diff --git a/‎mlir/lib/Dialect/Tosa/IR/TosaOps.cpp
Lines changed: 3 additions & 45 deletions b/‎mlir/lib/Dialect/Tosa/IR/TosaOps.cpp
Lines changed: 3 additions & 45 deletions
diff --git a/‎mlir/lib/Dialect/Tosa/Transforms/TosaFolders.cpp
Lines changed: 115 additions & 0 deletions b/‎mlir/lib/Dialect/Tosa/Transforms/TosaFolders.cpp
Lines changed: 115 additions & 0 deletions
diff --git a/‎mlir/lib/Dialect/Tosa/Utils/ConversionUtils.cpp
Lines changed: 7 additions & 7 deletions b/‎mlir/lib/Dialect/Tosa/Utils/ConversionUtils.cpp
Lines changed: 7 additions & 7 deletions
diff --git a/‎mlir/lib/Dialect/Vector/TransformOps/VectorTransformOps.cpp
Lines changed: 3 additions & 6 deletions b/‎mlir/lib/Dialect/Vector/TransformOps/VectorTransformOps.cpp
Lines changed: 3 additions & 6 deletions
@@ -10,7 +10,7 @@
 #define MLIR_CONVERSION_PASSES
 
 include "mlir/Pass/PassBase.td"
-
+include "mlir/Dialect/Vector/Transforms/VectorTransformsBase.td"
 
 //===----------------------------------------------------------------------===//
 // ToLLVM
@@ -1436,10 +1436,32 @@ def ConvertVectorToLLVMPass : Pass<"convert-vector-to-llvm"> {
            "bool", /*default=*/"false",
            "Enables the use of X86Vector dialect while lowering the vector "
 	   "dialect.">,
-    Option<"vectorTransformsOptions", "vector-transform-options",
-           "vector::VectorTransformsOptions",
-           /*default=*/"vector::VectorTransformsOptions()",
-           "Options to lower some operations like contractions and transposes.">,
+    Option<"vectorContractLowering", "vector-contract-lowering",
+           "vector::VectorContractLowering",
+           /*default=*/"vector::VectorContractLowering::Dot",
+           VectorContractLoweringAttr.summary, [{::llvm::cl::values(
+           clEnumValN(::mlir::vector::VectorContractLowering::Dot, "dot",
+            "Progressively lower to finer grained `vector.contract` and dot-products. (default)"),
+           clEnumValN(::mlir::vector::VectorContractLowering::Matmul, "matmul",
+            "Lower to `vector.matrix_multiply`, maps 1-1 to LLVM matrix intrinsics."),
+           clEnumValN(::mlir::vector::VectorContractLowering::OuterProduct, "outerproduct",
+            "Lower to `vector.outerproduct`."),
+           clEnumValN(::mlir::vector::VectorContractLowering::ParallelArith, "parallelarith",
+            "Lower contract with all reduction dimensions unrolled to 1 to a vector elementwise operations.")
+	        )}]>,
+    Option<"vectorTransposeLowering", "vector-transpose-lowering",
+           "vector::VectorTransposeLowering",
+           /*default=*/"vector::VectorTransposeLowering::EltWise",
+           VectorTransposeLoweringAttr.summary, [{::llvm::cl::values(
+           clEnumValN(::mlir::vector::VectorTransposeLowering::EltWise, "eltwise",
+            "Lower transpose into element-wise extract and inserts (default)"),
+           clEnumValN(::mlir::vector::VectorTransposeLowering::Flat, "flat",
+            "Lower 2-D transpose to `vector.flat_transpose`, maps 1-1 to LLVM matrix intrinsics"),
+           clEnumValN(::mlir::vector::VectorTransposeLowering::Shuffle1D, "shuffle1d",
+            "Lower 2-D transpose to `vector.shuffle` on 1-D vector."),
+           clEnumValN(::mlir::vector::VectorTransposeLowering::Shuffle16x16, "shuffle16x16",
+            "Lower 2-D transpose to `vector.shuffle` on 16x16 vector.")
+          )}]>,
   ];
 }
 
 
@@ -9,6 +9,7 @@
 #ifndef MLIR_DIALECT_VECTOR_TRANSFORMS_LOWERINGPATTERNS_H
 #define MLIR_DIALECT_VECTOR_TRANSFORMS_LOWERINGPATTERNS_H
 
+#include "mlir/Dialect/Vector/Transforms/VectorRewritePatterns.h"
 #include "mlir/Dialect/Vector/Transforms/VectorTransforms.h"
 
 namespace mlir {
@@ -47,7 +48,8 @@ namespace vector {
 /// Progressively lower a `vector.contract` with row-major matmul semantics to
 /// linearized `vector.extract` + `vector.outerproduct` + `vector.insert`.
 void populateVectorContractLoweringPatterns(
-    RewritePatternSet &patterns, VectorTransformsOptions options,
+    RewritePatternSet &patterns,
+    VectorContractLowering vectorContractLoweringOption,
     PatternBenefit benefit = 1, bool disableOuterProductLowering = false);
 
 /// Populate the pattern set with the following patterns:
@@ -142,9 +144,10 @@ void populateVectorShapeCastLoweringPatterns(RewritePatternSet &patterns,
 ///
 /// [TransposeOp2DToShuffleLowering]
 ///
-void populateVectorTransposeLoweringPatterns(RewritePatternSet &patterns,
-                                             VectorTransformsOptions options,
-                                             PatternBenefit benefit = 1);
+void populateVectorTransposeLoweringPatterns(
+    RewritePatternSet &patterns,
+    VectorTransposeLowering vectorTransposeLowering,
+    PatternBenefit benefit = 1);
 
 /// Populate the pattern set with the following patterns:
 ///
 
@@ -69,11 +69,11 @@ void ConvertVectorToLLVMPass::runOnOperation() {
     populateVectorToVectorCanonicalizationPatterns(patterns);
     populateVectorBitCastLoweringPatterns(patterns);
     populateVectorBroadcastLoweringPatterns(patterns);
-    populateVectorContractLoweringPatterns(patterns, vectorTransformsOptions);
+    populateVectorContractLoweringPatterns(patterns, vectorContractLowering);
     populateVectorMaskOpLoweringPatterns(patterns);
     populateVectorShapeCastLoweringPatterns(patterns);
     populateVectorInterleaveLoweringPatterns(patterns);
-    populateVectorTransposeLoweringPatterns(patterns, vectorTransformsOptions);
+    populateVectorTransposeLoweringPatterns(patterns, vectorTransposeLowering);
     // Vector transfer ops with rank > 1 should be lowered with VectorToSCF.
     populateVectorTransferLoweringPatterns(patterns, /*maxTransferRank=*/1);
     populateVectorMaskMaterializationPatterns(patterns,
 
@@ -274,15 +274,11 @@ LogicalResult static binaryOp(PatternRewriter &rewriter, PDLResultList &results,
           "encounter an unsupported binary operator.");
     }
 
-    if (operationStatus != APFloat::opOK) {
-      if (operationStatus != APFloat::opInexact)
-        return failure();
-
-      emitWarning(rewriter.getUnknownLoc())
-          << "Binary arithmetic operation between " << lhsVal.convertToFloat()
-          << " and " << rhsVal.convertToFloat()
-          << " produced an inexact result";
+    if (operationStatus != APFloat::opOK &&
+        operationStatus != APFloat::opInexact) {
+      return failure();
     }
+
     results.push_back(rewriter.getFloatAttr(floatType, resultVal));
     return success();
   }
 
@@ -1374,9 +1374,8 @@ LogicalResult mlir::spirv::unrollVectorsInFuncBodies(Operation *op) {
   // further transformations to canonicalize/cancel.
   {
     RewritePatternSet patterns(context);
-    auto options = vector::VectorTransformsOptions().setVectorTransposeLowering(
-        vector::VectorTransposeLowering::EltWise);
-    vector::populateVectorTransposeLoweringPatterns(patterns, options);
+    vector::populateVectorTransposeLoweringPatterns(
+        patterns, vector::VectorTransposeLowering::EltWise);
     vector::populateVectorShapeCastLoweringPatterns(patterns);
     if (failed(applyPatternsGreedily(op, std::move(patterns))))
       return failure();
 
@@ -1079,50 +1079,8 @@ LogicalResult tosa::SliceOp::inferReturnTypeComponents(
     MLIRContext *context, ::std::optional<Location> location,
     SliceOp::Adaptor adaptor,
     SmallVectorImpl<ShapedTypeComponents> &inferredReturnShapes) {
-
-  Type inputType = getElementTypeOrSelf(adaptor.getInput1().getType());
-  SmallVector<int64_t> start;
-  SmallVector<int64_t> size;
-
-  if (!tosa::getConstShapeValue(adaptor.getStart().getDefiningOp(), start) ||
-      !tosa::getConstShapeValue(adaptor.getSize().getDefiningOp(), size)) {
-    auto rank = cast<tosa::shapeType>(adaptor.getSize().getType()).getRank();
-    SmallVector<int64_t> fallback(rank, ShapedType::kDynamic);
-    inferredReturnShapes.push_back(ShapedTypeComponents(fallback, inputType));
-    return success();
-  }
-
-  // if size[i] is -1, all remaining elements in dimension i are included
-  // in the slice, similar to TF.
-  ShapeAdaptor inputShape(adaptor.getInput1().getType());
-  // initialize outputShape to all unknown
-  SmallVector<int64_t> outputShape(size.size(), ShapedType::kDynamic);
-  if (inputShape.hasRank()) {
-    for (size_t i = 0; i < size.size(); i++) {
-      if (size[i] != 0 && size[i] >= -1 && start[i] >= 0 &&
-          (ShapedType::isDynamic(inputShape.getDimSize(i)) ||
-           start[i] < inputShape.getDimSize(i))) {
-        // size[i] is not 0 and not < -1, and start[i] is in valid range
-        if (ShapedType::isDynamic(inputShape.getDimSize(i))) {
-          // input shape has unknown dim[i] - only valid if size[i] > 0
-          if (size[i] > 0) {
-            outputShape[i] = size[i];
-          }
-        } else {
-          // input shape has known dim[i]
-          if (size[i] == -1) {
-            outputShape[i] = inputShape.getDimSize(i) - start[i];
-          } else if (start[i] + size[i] <= inputShape.getDimSize(i)) {
-            // start[i] + size[i] is within bound of input shape's dim[i]
-            outputShape[i] = size[i];
-          }
-        }
-      }
-    }
-  } else {
-    outputShape = convertToMlirShape(size);
-  }
-  inferredReturnShapes.push_back(ShapedTypeComponents(outputShape));
+  inferredReturnShapes.push_back(
+      ShapedTypeComponents(convertToMlirShape(adaptor.getSize())));
   return success();
 }
 
@@ -1131,7 +1089,7 @@ LogicalResult tosa::SliceOp::verify() {
   if (!inputType)
     return success();
 
-  auto startShapeRank =
+      ShapedTypeComponents(convertToMlirShape(size)));
       llvm::cast<tosa::shapeType>(getStart().getType()).getRank();
   if (inputType.getRank() != startShapeRank)
     return emitOpError(
 
@@ -2120,6 +2120,120 @@ struct ReduceConstantOptimization : public OpRewritePattern<OperationType> {
   const bool aggressiveReduceConstant;
 };
 
+template <typename ElementStorageType>
+DenseElementsAttr
+concatenateAttrs(const ShapedType outputType, ArrayRef<ElementsAttr> inputAttrs,
+                 const uint32_t concatAxis, PatternRewriter &rewriter,
+                 const Type elementType) {
+
+  static_assert(std::is_same<ElementStorageType, APInt>::value ||
+                    std::is_same<ElementStorageType, APFloat>::value,
+                "ElementStorageType must be either APInt or APFloat");
+
+  SmallVector<ElementStorageType> resultValues;
+  if constexpr (std::is_same<ElementStorageType, APInt>::value) {
+    resultValues.resize_for_overwrite(outputType.getNumElements());
+  } else {
+    resultValues.resize(
+        outputType.getNumElements(),
+        APFloat::getZero(cast<FloatType>(elementType).getFloatSemantics()));
+  }
+  const auto outputShape = outputType.getShape();
+
+  int64_t concatDimOffset = 0;
+  for (const auto &inputAttr : inputAttrs) {
+    const auto inputShape = cast<ShapedType>(inputAttr.getType()).getShape();
+    const auto inputValues = inputAttr.getValues<ElementStorageType>();
+
+    for (const auto &[inputLinearIdx, val] : llvm::enumerate(inputValues)) {
+      // TODO: Could be optimized to work on slices instead of single value
+      SmallVector<int64_t> multiDimIndex =
+          offsetToIndex(inputShape, inputLinearIdx);
+      multiDimIndex[concatAxis] += concatDimOffset;
+
+      const int64_t outputLinearIndex =
+          indexToOffset(outputShape, multiDimIndex);
+      resultValues[outputLinearIndex] = val;
+    }
+    concatDimOffset += inputShape[concatAxis];
+  }
+  return DenseElementsAttr::get(outputType, resultValues);
+}
+
+struct TosaFoldConstantConcat : public TosaFoldConstantBase<tosa::ConcatOp> {
+  using TosaFoldConstantBase::TosaFoldConstantBase;
+
+  LogicalResult matchAndRewrite(tosa::ConcatOp op,
+                                PatternRewriter &rewriter) const override {
+    auto inputs = op->getOperands();
+    const uint32_t concatAxis = op.getAxis();
+    const auto outputType = cast<ShapedType>(op.getType());
+    if (!outputType.hasStaticShape()) {
+      return rewriter.notifyMatchFailure(
+          op, "Output type must have static shape for concat folding.");
+    }
+    if (llvm::any_of(inputs, [](Value v) {
+          return !cast<ShapedType>(v.getType()).hasStaticShape();
+        })) {
+      return rewriter.notifyMatchFailure(
+          op, "All inputs to ConcatOp must have static shape for folding.");
+    }
+
+    const Type elementType = outputType.getElementType();
+    if (!elementType.isIntOrIndexOrFloat()) {
+      // Sanity check, this should always be the case
+      return rewriter.notifyMatchFailure(
+          op, "Output element type must be int, index, or float for folding.");
+    }
+
+    SmallVector<ElementsAttr> inputAttrs;
+    inputAttrs.reserve(inputs.size());
+
+    for (Value inputVal : inputs) {
+      ElementsAttr inputAsAttr;
+      if (!matchPattern(inputVal, m_Constant(&inputAsAttr))) {
+        // TODO: This could be extended to handle partial non-const inputs
+        return rewriter.notifyMatchFailure(
+            op, "All inputs to ConcatOp must be constant for folding.");
+      }
+
+      if (inputAsAttr.isSplat()) {
+        const ShapedType inputType = cast<ShapedType>(inputAsAttr.getType());
+        if (isa<IntegerType>(elementType)) {
+          inputAsAttr = DenseElementsAttr::get(
+              inputType, inputAsAttr.getSplatValue<APInt>());
+        } else {
+          inputAsAttr = DenseElementsAttr::get(
+              inputType, inputAsAttr.getSplatValue<APFloat>());
+        }
+      }
+      if (foldSplatOrSingleUseOnly && !inputVal.hasOneUse() &&
+          !inputAsAttr.isSplat()) {
+        return rewriter.notifyMatchFailure(
+            op, "Concat folding heuristic: non-splat constant inputs must have "
+                "only a single use.");
+      }
+      inputAttrs.push_back(inputAsAttr);
+    }
+
+    DenseElementsAttr resultAttr;
+    if (auto intType = dyn_cast<IntegerType>(elementType)) {
+      // TODO: This could be optimized to not go to APInt if the int size
+      // matches c++ native types
+      resultAttr = concatenateAttrs<APInt>(outputType, inputAttrs, concatAxis,
+                                           rewriter, elementType);
+    } else {
+      resultAttr = concatenateAttrs<APFloat>(outputType, inputAttrs, concatAxis,
+                                             rewriter, elementType);
+    }
+
+    assert(resultAttr && "Result attribute should not be null.");
+
+    rewriter.replaceOpWithNewOp<tosa::ConstOp>(op, outputType, resultAttr);
+    return success();
+  }
+};
+
 } // namespace
 
 void mlir::tosa::populateTosaFoldConstantPatterns(
@@ -2167,6 +2281,7 @@ void mlir::tosa::populateTosaFoldConstantPatterns(
   patterns.add<TosaFoldConstantPad>(ctx, options.foldSplatOrSingleUseOnly);
   patterns.add<TosaFoldConstantSlice>(ctx, options.foldSplatOrSingleUseOnly);
   patterns.add<TosaFoldConstantMatMul>(ctx, options.foldSplatOrSingleUseOnly);
+  patterns.add<TosaFoldConstantConcat>(ctx, options.foldSplatOrSingleUseOnly);
   if (options.enableTileFolding)
     patterns.add<TosaFoldConstantTile>(ctx, options.foldSplatOrSingleUseOnly);
 }
 
@@ -197,11 +197,11 @@ SmallVector<int64_t> mlir::tosa::convertFromMlirShape(ArrayRef<int64_t> shape) {
 
 // AMD: Picked from torch-mlir 12250739bfe85b702f9503cad45c2e535ea8eb18
 // Get accumulator type for TOSA convolution ops
-LogicalResult mlir::tosa ::getConvOpsAccType(PatternRewriter &rewriter,
-                                             RankedTensorType inputTy,
-                                             RankedTensorType weightTy,
-                                             RankedTensorType outputTy,
-                                             TypeAttr &accType) {
+LogicalResult mlir::tosa::getConvOpsAccType(PatternRewriter &rewriter,
+                                            RankedTensorType inputTy,
+                                            RankedTensorType weightTy,
+                                            RankedTensorType outputTy,
+                                            TypeAttr &accType) {
   auto inputElemTy = inputTy.getElementType();
   auto weightElemTy = weightTy.getElementType();
   auto outputElemTy = outputTy.getElementType();
@@ -231,8 +231,8 @@ LogicalResult mlir::tosa ::getConvOpsAccType(PatternRewriter &rewriter,
   } else if (inputElemTy.isInteger(16) && weightElemTy.isInteger(8) &&
              outputElemTy.isInteger(48)) {
     accType = mlir::TypeAttr::get(rewriter.getIntegerType(48));
-  } else if ((isa<Float8E4M3FNType>(inputElemTy) &&
-              isa<Float8E4M3FNType>(weightElemTy) && outputElemTy.isF16()) ||
+  } else if ((isa<Float8E4M3Type>(inputElemTy) &&
+              isa<Float8E4M3Type>(weightElemTy) && outputElemTy.isF16()) ||
              (isa<Float8E5M2Type>(inputElemTy) &&
               isa<Float8E5M2Type>(weightElemTy) && outputElemTy.isF16())) {
     accType = mlir::TypeAttr::get(rewriter.getF16Type());
 
@@ -102,9 +102,7 @@ void transform::ApplyLowerBroadcastPatternsOp::populatePatterns(
 
 void transform::ApplyLowerContractionPatternsOp::populatePatterns(
     RewritePatternSet &patterns) {
-  vector::VectorTransformsOptions vectorTransformOptions;
-  vectorTransformOptions.setVectorTransformsOptions(getLoweringStrategy());
-  populateVectorContractLoweringPatterns(patterns, vectorTransformOptions,
+  populateVectorContractLoweringPatterns(patterns, getLoweringStrategy(),
                                          /*benefit=*/1,
                                          /*disableOuterProductLowering=*/true);
 }
@@ -161,9 +159,8 @@ void transform::ApplyLowerTransferPatternsOp::populatePatterns(
 
 void transform::ApplyLowerTransposePatternsOp::populatePatterns(
     RewritePatternSet &patterns) {
-  vector::populateVectorTransposeLoweringPatterns(
-      patterns, vector::VectorTransformsOptions().setVectorTransposeLowering(
-                    getLoweringStrategy()));
+  vector::populateVectorTransposeLoweringPatterns(patterns,
+                                                  getLoweringStrategy());
   if (getAvx2LoweringStrategy()) {
     auto avx2LoweringOptions =
         x86vector::avx2::LoweringOptions().setTransposeOptions(
Original file line number	Diff line number	Diff line change
`@@ -274,15 +274,11 @@ LogicalResult static binaryOp(PatternRewriter &rewriter, PDLResultList &results,`
`274`	`274`	`"encounter an unsupported binary operator.");`
`275`	`275`	`}`
`276`	`276`
`277`		`- if (operationStatus != APFloat::opOK) {`
`278`		`- if (operationStatus != APFloat::opInexact)`
`279`		`- return failure();`
`280`		`-`
`281`		`- emitWarning(rewriter.getUnknownLoc())`
`282`		`- << "Binary arithmetic operation between " << lhsVal.convertToFloat()`
`283`		`- << " and " << rhsVal.convertToFloat()`
`284`		`- << " produced an inexact result";`
	`277`	`+ if (operationStatus != APFloat::opOK &&`
	`278`	`+ operationStatus != APFloat::opInexact) {`
	`279`	`+ return failure();`
`285`	`280`	`}`
	`281`	`+`
`286`	`282`	`results.push_back(rewriter.getFloatAttr(floatType, resultVal));`
`287`	`283`	`return success();`
`288`	`284`	`}`