mlir/test/Dialect/Bufferization/canonicalize.mlir - llvm-project - Git at Google

 // RUN: mlir-opt %s -canonicalize --split-input-file \
 // RUN:   -allow-unregistered-dialect |\
 // RUN: FileCheck %s

 // Basic folding of to_tensor(to_memref(t)) -> t
 // CHECK-LABEL: func @tensor_load_of_buffer_cast(
 func @tensor_load_of_buffer_cast(%arg0: tensor<?xf32>) -> tensor<?xf32> {
   %0 = bufferization.to_memref %arg0 : memref<?xf32>
   %1 = bufferization.to_tensor %0 : memref<?xf32>
   return %1 : tensor<?xf32>
 }
 // CHECK-SAME:   %[[TENSOR:.*]]: tensor<?xf32>) -> tensor<?xf32> {
 // CHECK: return %[[TENSOR]]

 // -----

 // Basic folding of to_memref(to_tensor(m)) -> m
 // CHECK-LABEL: func @buffer_cast_of_tensor_load(
 func @buffer_cast_of_tensor_load(%arg0: memref<?xf32>) -> memref<?xf32> {
   %0 = bufferization.to_tensor %arg0 : memref<?xf32>
   %1 = bufferization.to_memref %0 : memref<?xf32>
   return %1 : memref<?xf32>
 }
 // CHECK-SAME:   %[[MEMREF:.*]]: memref<?xf32>) -> memref<?xf32> {
 // CHECK: return %[[MEMREF]]

 // -----

 // If the memrefs are not the same type, don't fold them.
 // If the memrefs are not cast-compatible (e.g. different address space), don't
 // canonicalize them either.
 // CHECK-LABEL: func @no_fold_buffer_cast_of_tensor_load(
 //  CHECK-SAME:   %[[MEMREF_ADDRSPACE2:.*]]: memref<?xf32, 2>)
 //  CHECK-SAME:     -> memref<?xf32, 7> {
 //       CHECK: %[[TENSOR:.*]] = bufferization.to_tensor
 //  CHECK-SAME:   %[[MEMREF_ADDRSPACE2]] : memref<?xf32, 2>
 //       CHECK: %[[MEMREF_ADDRSPACE7:.*]] = bufferization.to_memref
 //  CHECK-SAME:   %[[TENSOR]] : memref<?xf32, 7>
 //       CHECK: return %[[MEMREF_ADDRSPACE7]]
 func @no_fold_buffer_cast_of_tensor_load(%arg0: memref<?xf32, 2>)
     -> memref<?xf32, 7> {
   %0 = bufferization.to_tensor %arg0 : memref<?xf32, 2>
   %1 = bufferization.to_memref %0 : memref<?xf32, 7>
   return %1 : memref<?xf32, 7>
 }

 // -----

 // CHECK-DAG: #[[$OFF_3:[a-z0-9]+]] = affine_map<(d0) -> (d0 + 3)>
 // CHECK-DAG: #[[$OFF_UNK:[a-z0-9]+]] = affine_map<(d0)[s0] -> (d0 + s0)>

 // If the memrefs are definitely cast-compatible, canonicalize to
 //            cast.
 // CHECK-LABEL: func @canonicalize_buffer_cast_of_tensor_load(
 //  CHECK-SAME:   %[[M:.*]]: memref<?xf32, #[[$OFF_3]]>)
 //  CHECK-SAME:     -> memref<?xf32, #[[$OFF_UNK]]> {
 //   CHECK-NOT: bufferization.to_tensor
 //   CHECK-NOT: bufferization.to_memref
 //       CHECK: %[[R:.*]] = memref.cast %[[M]]
 //  CHECK-SAME:   memref<?xf32, #[[$OFF_3]]> to memref<?xf32, #[[$OFF_UNK]]>
 //       CHECK: return %[[R]]
 func @canonicalize_buffer_cast_of_tensor_load(
   %arg0: memref<?xf32, offset: 3, strides: [1]>)
   -> memref<?xf32, offset: ?, strides: [1]>
 {
   %0 = bufferization.to_tensor %arg0 : memref<?xf32, offset: 3, strides: [1]>
   %1 = bufferization.to_memref %0 : memref<?xf32, offset: ?, strides: [1]>
   return %1 : memref<?xf32, offset: ?, strides: [1]>
 }

 // -----

 // CHECK-DAG: #[[$OFF_UNK:[a-z0-9]+]] = affine_map<(d0)[s0] -> (d0 + s0)>
 // CHECK-DAG: #[[$OFF_3:[a-z0-9]+]] = affine_map<(d0) -> (d0 + 3)>

 // If the memrefs are potentially cast-compatible, canonicalize to
 //            copy.
 // CHECK-LABEL: func @canonicalize_buffer_cast_of_tensor_load_to_copy(
 func @canonicalize_buffer_cast_of_tensor_load_to_copy(
   %arg0: memref<?xf32, offset: ?, strides: [1]>)
   -> memref<?xf32, offset: 3, strides: [1]> {
   %0 = bufferization.to_tensor %arg0 : memref<?xf32, offset: ?, strides: [1]>
   %1 = bufferization.to_memref %0 : memref<?xf32, offset: 3, strides: [1]>
   return %1 : memref<?xf32, offset: 3, strides: [1]>
 }
 // CHECK-SAME:   %[[M:.*]]: memref<?xf32, #[[$OFF_UNK]]>)
 // CHECK-SAME:     -> memref<?xf32, #[[$OFF_3]]> {
 //  CHECK-NOT: bufferization.to_tensor
 //  CHECK-NOT: bufferization.to_memref
 //      CHECK: %[[C0:.*]] = arith.constant 0 : index
 //      CHECK: %[[DIM:.*]] = memref.dim %[[M]], %[[C0]] : memref<?xf32, #[[$OFF_UNK]]>
 //      CHECK: %[[ALLOC:.*]] = memref.alloc(%[[DIM]]) : memref<?xf32, #[[$OFF_3]]>
 //      CHECK: memref.copy %[[M]], %[[ALLOC]]
 // CHECK-SAME:   memref<?xf32, #[[$OFF_UNK]]> to memref<?xf32, #[[$OFF_3]]>
 //      CHECK: return %[[ALLOC]]

 // -----


 // Basic folding of tensor.dim(to_tensor(m)) -> memref.dim(m).
 // CHECK-LABEL: func @dim_of_tensor_load(
 //  CHECK-SAME:     %[[MEMREF:[0-9a-z]*]]: memref<?xf32>
 //       CHECK:   %[[C0:.*]] = arith.constant 0
 //       CHECK:   %[[D:.*]] = memref.dim %[[MEMREF]], %[[C0]]
 //       CHECK:   return %[[D]] : index
 func @dim_of_tensor_load(%arg0: memref<?xf32>) -> index {
   %c0 = arith.constant 0 : index
   %0 = bufferization.to_tensor %arg0 : memref<?xf32>
   %1 = tensor.dim %0, %c0 : tensor<?xf32>
   return %1 : index
 }

 // -----

 // CHECK-LABEL: @clone_before_dealloc
 func @clone_before_dealloc(%arg0: memref<?xf32>) -> memref<?xf32> {
   %0 = bufferization.clone %arg0 : memref<?xf32> to memref<?xf32>
   memref.dealloc %arg0 : memref<?xf32>
   return %0 : memref<?xf32>
 }
 // CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
 // CHECK-NEXT: return %[[ARG]]

 // -----

 // CHECK-LABEL: @clone_before_dealloc
 func @clone_before_dealloc(%arg0: memref<?xf32>) -> memref<?xf32> {
   %0 = bufferization.clone %arg0 : memref<?xf32> to memref<?xf32>
   "use"(%0) : (memref<?xf32>) -> ()
   memref.dealloc %0 : memref<?xf32>
   return %arg0 : memref<?xf32>
 }
 // CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
 // CHECK-NEXT: "use"(%arg0)
 // CHECK-NEXT: return %[[ARG]]

 // -----

 // CHECK-LABEL: @clone_after_cast
 func @clone_after_cast(%arg0: memref<?xf32>) -> memref<32xf32> {
   %0 = memref.cast %arg0 : memref<?xf32> to memref<32xf32>
   %1 = bufferization.clone %0 : memref<32xf32> to memref<32xf32>
   return %1 : memref<32xf32>
 }
 // CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
 // CHECK-NEXT: bufferization.clone %[[ARG]] : memref<?xf32> to memref<32xf32>
 // CHECK-NOT: memref.cast

 // -----

 // CHECK-LABEL: @clone_and_cast
 func @clone_and_cast(%arg0: memref<?xf32>) -> memref<32xf32> {
   %0 = bufferization.clone %arg0 : memref<?xf32> to memref<32xf32>
   memref.dealloc %arg0 : memref<?xf32>
   return %0 : memref<32xf32>
 }
 // CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
 // CHECK-NEXT: %[[RES:.*]] = memref.cast %[[ARG]]
 // CHECK-SAME:   memref<?xf32> to memref<32xf32>
 // CHECK-NEXT: return %[[RES]]

 // -----

 // CHECK-LABEL: @alias_is_freed
 func @alias_is_freed(%arg0 : memref<?xf32>) {
   %0 = memref.cast %arg0 : memref<?xf32> to memref<32xf32>
   %1 = bufferization.clone %0 : memref<32xf32> to memref<32xf32>
   memref.dealloc %arg0 : memref<?xf32>
   "use"(%1) : (memref<32xf32>) -> ()
   memref.dealloc %1 : memref<32xf32>
   return
 }
 // CHECK: bufferization.clone
 // CHECK: memref.dealloc
 // CHECK: memref.dealloc

 // -----

 // Verify SimplifyClones skips clones with multiple deallocations.
 // CHECK-LABEL: @clone_multiple_dealloc_of_source
 func @clone_multiple_dealloc_of_source(%arg0: memref<?xf32>) -> memref<?xf32> {
   %0 = bufferization.clone %arg0 : memref<?xf32> to memref<?xf32>
   "if_else"() ({
     memref.dealloc %arg0 : memref<?xf32>
     }, {
     memref.dealloc %arg0 : memref<?xf32>
     }) : () -> ()
   return %0 : memref<?xf32>
 }
 // CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
 // CHECK-NEXT: %[[RES:.*]] = bufferization.clone %[[ARG]]
 // CHECK: memref.dealloc %[[ARG]]
 // CHECK: memref.dealloc %[[ARG]]
 // CHECK: return %[[RES]]

 // -----

 // CHECK-LABEL: @clone_multiple_dealloc_of_clone
 // CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
 func @clone_multiple_dealloc_of_clone(%arg0: memref<?xf32>) -> memref<?xf32> {
   // CHECK-NEXT: %[[CLONE:.*]] = bufferization.clone %[[ARG]]
   // CHECK: memref.dealloc %[[CLONE]]
   // CHECK: memref.dealloc %[[CLONE]]
   // CHECK: return %[[ARG]]
   %0 = bufferization.clone %arg0 : memref<?xf32> to memref<?xf32>
   "use"(%0) : (memref<?xf32>) -> ()
   "if_else"() ({
     memref.dealloc %0 : memref<?xf32>
     }, {
     memref.dealloc %0 : memref<?xf32>
     }) : () -> ()
   return %arg0 : memref<?xf32>
 }

 // -----


 // CHECK-LABEL: func @tensor_cast_to_memref
 //  CHECK-SAME:   %[[ARG0:.+]]: tensor<4x6x16x32xi8>
 func @tensor_cast_to_memref(%arg0 : tensor<4x6x16x32xi8>) ->
   memref<?x?x16x32xi8> {
   %0 = tensor.cast %arg0 : tensor<4x6x16x32xi8> to tensor<?x?x16x32xi8>
   %1 = bufferization.to_memref %0 : memref<?x?x16x32xi8>
   return %1 : memref<?x?x16x32xi8>
 }
 // CHECK:   %[[M:.+]] = bufferization.to_memref %[[ARG0]] : memref<4x6x16x32xi8>
 // CHECK:   %[[M1:.+]] = memref.cast %[[M]]
 // CHECK-SAME: memref<4x6x16x32xi8> to memref<?x?x16x32xi8>
 // CHECK:   return %[[M1]] : memref<?x?x16x32xi8>

 // -----

 // Folding of memref.load(to_memref(%v, %idxs)) -> tensor.extract(%v, %idx)
 // CHECK-LABEL: func @load_from_buffer_cast(
 func @load_from_buffer_cast(%arg0: index, %arg1: index,
                             %arg2: tensor<?x?xf32>) -> f32 {
   %0 = bufferization.to_memref %arg2 : memref<?x?xf32>
   %1 = memref.load %0[%arg0, %arg1] : memref<?x?xf32>
   return %1 : f32
 }
 //  CHECK-SAME: %[[IDX0:[0-9a-z]+]]: index, %[[IDX1:[0-9a-z]+]]: index
 //  CHECK-SAME: %[[TENSOR:[0-9a-z]+]]: tensor<?x?xf32>
 //       CHECK: %[[RES:.*]] = tensor.extract %[[TENSOR]][%[[IDX0]], %[[IDX1]]]
 //   CHECK-NOT: memref.load
 //       CHECK: return %[[RES]] : f32
	// RUN: mlir-opt %s -canonicalize --split-input-file \
	// RUN: -allow-unregistered-dialect \|\
	// RUN: FileCheck %s

	// Basic folding of to_tensor(to_memref(t)) -> t
	// CHECK-LABEL: func @tensor_load_of_buffer_cast(
	func @tensor_load_of_buffer_cast(%arg0: tensor<?xf32>) -> tensor<?xf32> {
	%0 = bufferization.to_memref %arg0 : memref<?xf32>
	%1 = bufferization.to_tensor %0 : memref<?xf32>
	return %1 : tensor<?xf32>
	}
	// CHECK-SAME: %[[TENSOR:.*]]: tensor<?xf32>) -> tensor<?xf32> {
	// CHECK: return %[[TENSOR]]

	// -----

	// Basic folding of to_memref(to_tensor(m)) -> m
	// CHECK-LABEL: func @buffer_cast_of_tensor_load(
	func @buffer_cast_of_tensor_load(%arg0: memref<?xf32>) -> memref<?xf32> {
	%0 = bufferization.to_tensor %arg0 : memref<?xf32>
	%1 = bufferization.to_memref %0 : memref<?xf32>
	return %1 : memref<?xf32>
	}
	// CHECK-SAME: %[[MEMREF:.*]]: memref<?xf32>) -> memref<?xf32> {
	// CHECK: return %[[MEMREF]]

	// -----

	// If the memrefs are not the same type, don't fold them.
	// If the memrefs are not cast-compatible (e.g. different address space), don't
	// canonicalize them either.
	// CHECK-LABEL: func @no_fold_buffer_cast_of_tensor_load(
	// CHECK-SAME: %[[MEMREF_ADDRSPACE2:.*]]: memref<?xf32, 2>)
	// CHECK-SAME: -> memref<?xf32, 7> {
	// CHECK: %[[TENSOR:.*]] = bufferization.to_tensor
	// CHECK-SAME: %[[MEMREF_ADDRSPACE2]] : memref<?xf32, 2>
	// CHECK: %[[MEMREF_ADDRSPACE7:.*]] = bufferization.to_memref
	// CHECK-SAME: %[[TENSOR]] : memref<?xf32, 7>
	// CHECK: return %[[MEMREF_ADDRSPACE7]]
	func @no_fold_buffer_cast_of_tensor_load(%arg0: memref<?xf32, 2>)
	-> memref<?xf32, 7> {
	%0 = bufferization.to_tensor %arg0 : memref<?xf32, 2>
	%1 = bufferization.to_memref %0 : memref<?xf32, 7>
	return %1 : memref<?xf32, 7>
	}

	// -----

	// CHECK-DAG: #[[$OFF_3:[a-z0-9]+]] = affine_map<(d0) -> (d0 + 3)>
	// CHECK-DAG: #[[$OFF_UNK:[a-z0-9]+]] = affine_map<(d0)[s0] -> (d0 + s0)>

	// If the memrefs are definitely cast-compatible, canonicalize to
	// cast.
	// CHECK-LABEL: func @canonicalize_buffer_cast_of_tensor_load(
	// CHECK-SAME: %[[M:.*]]: memref<?xf32, #[[$OFF_3]]>)
	// CHECK-SAME: -> memref<?xf32, #[[$OFF_UNK]]> {
	// CHECK-NOT: bufferization.to_tensor
	// CHECK-NOT: bufferization.to_memref
	// CHECK: %[[R:.*]] = memref.cast %[[M]]
	// CHECK-SAME: memref<?xf32, #[[$OFF_3]]> to memref<?xf32, #[[$OFF_UNK]]>
	// CHECK: return %[[R]]
	func @canonicalize_buffer_cast_of_tensor_load(
	%arg0: memref<?xf32, offset: 3, strides: [1]>)
	-> memref<?xf32, offset: ?, strides: [1]>
	{
	%0 = bufferization.to_tensor %arg0 : memref<?xf32, offset: 3, strides: [1]>
	%1 = bufferization.to_memref %0 : memref<?xf32, offset: ?, strides: [1]>
	return %1 : memref<?xf32, offset: ?, strides: [1]>
	}

	// -----

	// CHECK-DAG: #[[$OFF_UNK:[a-z0-9]+]] = affine_map<(d0)[s0] -> (d0 + s0)>
	// CHECK-DAG: #[[$OFF_3:[a-z0-9]+]] = affine_map<(d0) -> (d0 + 3)>

	// If the memrefs are potentially cast-compatible, canonicalize to
	// copy.
	// CHECK-LABEL: func @canonicalize_buffer_cast_of_tensor_load_to_copy(
	func @canonicalize_buffer_cast_of_tensor_load_to_copy(
	%arg0: memref<?xf32, offset: ?, strides: [1]>)
	-> memref<?xf32, offset: 3, strides: [1]> {
	%0 = bufferization.to_tensor %arg0 : memref<?xf32, offset: ?, strides: [1]>
	%1 = bufferization.to_memref %0 : memref<?xf32, offset: 3, strides: [1]>
	return %1 : memref<?xf32, offset: 3, strides: [1]>
	}
	// CHECK-SAME: %[[M:.*]]: memref<?xf32, #[[$OFF_UNK]]>)
	// CHECK-SAME: -> memref<?xf32, #[[$OFF_3]]> {
	// CHECK-NOT: bufferization.to_tensor
	// CHECK-NOT: bufferization.to_memref
	// CHECK: %[[C0:.*]] = arith.constant 0 : index
	// CHECK: %[[DIM:.*]] = memref.dim %[[M]], %[[C0]] : memref<?xf32, #[[$OFF_UNK]]>
	// CHECK: %[[ALLOC:.*]] = memref.alloc(%[[DIM]]) : memref<?xf32, #[[$OFF_3]]>
	// CHECK: memref.copy %[[M]], %[[ALLOC]]
	// CHECK-SAME: memref<?xf32, #[[$OFF_UNK]]> to memref<?xf32, #[[$OFF_3]]>
	// CHECK: return %[[ALLOC]]

	// -----


	// Basic folding of tensor.dim(to_tensor(m)) -> memref.dim(m).
	// CHECK-LABEL: func @dim_of_tensor_load(
	// CHECK-SAME: %[[MEMREF:[0-9a-z]*]]: memref<?xf32>
	// CHECK: %[[C0:.*]] = arith.constant 0
	// CHECK: %[[D:.*]] = memref.dim %[[MEMREF]], %[[C0]]
	// CHECK: return %[[D]] : index
	func @dim_of_tensor_load(%arg0: memref<?xf32>) -> index {
	%c0 = arith.constant 0 : index
	%0 = bufferization.to_tensor %arg0 : memref<?xf32>
	%1 = tensor.dim %0, %c0 : tensor<?xf32>
	return %1 : index
	}

	// -----

	// CHECK-LABEL: @clone_before_dealloc
	func @clone_before_dealloc(%arg0: memref<?xf32>) -> memref<?xf32> {
	%0 = bufferization.clone %arg0 : memref<?xf32> to memref<?xf32>
	memref.dealloc %arg0 : memref<?xf32>
	return %0 : memref<?xf32>
	}
	// CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
	// CHECK-NEXT: return %[[ARG]]

	// -----

	// CHECK-LABEL: @clone_before_dealloc
	func @clone_before_dealloc(%arg0: memref<?xf32>) -> memref<?xf32> {
	%0 = bufferization.clone %arg0 : memref<?xf32> to memref<?xf32>
	"use"(%0) : (memref<?xf32>) -> ()
	memref.dealloc %0 : memref<?xf32>
	return %arg0 : memref<?xf32>
	}
	// CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
	// CHECK-NEXT: "use"(%arg0)
	// CHECK-NEXT: return %[[ARG]]

	// -----

	// CHECK-LABEL: @clone_after_cast
	func @clone_after_cast(%arg0: memref<?xf32>) -> memref<32xf32> {
	%0 = memref.cast %arg0 : memref<?xf32> to memref<32xf32>
	%1 = bufferization.clone %0 : memref<32xf32> to memref<32xf32>
	return %1 : memref<32xf32>
	}
	// CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
	// CHECK-NEXT: bufferization.clone %[[ARG]] : memref<?xf32> to memref<32xf32>
	// CHECK-NOT: memref.cast

	// -----

	// CHECK-LABEL: @clone_and_cast
	func @clone_and_cast(%arg0: memref<?xf32>) -> memref<32xf32> {
	%0 = bufferization.clone %arg0 : memref<?xf32> to memref<32xf32>
	memref.dealloc %arg0 : memref<?xf32>
	return %0 : memref<32xf32>
	}
	// CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
	// CHECK-NEXT: %[[RES:.*]] = memref.cast %[[ARG]]
	// CHECK-SAME: memref<?xf32> to memref<32xf32>
	// CHECK-NEXT: return %[[RES]]

	// -----

	// CHECK-LABEL: @alias_is_freed
	func @alias_is_freed(%arg0 : memref<?xf32>) {
	%0 = memref.cast %arg0 : memref<?xf32> to memref<32xf32>
	%1 = bufferization.clone %0 : memref<32xf32> to memref<32xf32>
	memref.dealloc %arg0 : memref<?xf32>
	"use"(%1) : (memref<32xf32>) -> ()
	memref.dealloc %1 : memref<32xf32>
	return
	}
	// CHECK: bufferization.clone
	// CHECK: memref.dealloc
	// CHECK: memref.dealloc

	// -----

	// Verify SimplifyClones skips clones with multiple deallocations.
	// CHECK-LABEL: @clone_multiple_dealloc_of_source
	func @clone_multiple_dealloc_of_source(%arg0: memref<?xf32>) -> memref<?xf32> {
	%0 = bufferization.clone %arg0 : memref<?xf32> to memref<?xf32>
	"if_else"() ({
	memref.dealloc %arg0 : memref<?xf32>
	}, {
	memref.dealloc %arg0 : memref<?xf32>
	}) : () -> ()
	return %0 : memref<?xf32>
	}
	// CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
	// CHECK-NEXT: %[[RES:.*]] = bufferization.clone %[[ARG]]
	// CHECK: memref.dealloc %[[ARG]]
	// CHECK: memref.dealloc %[[ARG]]
	// CHECK: return %[[RES]]

	// -----

	// CHECK-LABEL: @clone_multiple_dealloc_of_clone
	// CHECK-SAME: %[[ARG:.*]]: memref<?xf32>
	func @clone_multiple_dealloc_of_clone(%arg0: memref<?xf32>) -> memref<?xf32> {
	// CHECK-NEXT: %[[CLONE:.*]] = bufferization.clone %[[ARG]]
	// CHECK: memref.dealloc %[[CLONE]]
	// CHECK: memref.dealloc %[[CLONE]]
	// CHECK: return %[[ARG]]
	%0 = bufferization.clone %arg0 : memref<?xf32> to memref<?xf32>
	"use"(%0) : (memref<?xf32>) -> ()
	"if_else"() ({
	memref.dealloc %0 : memref<?xf32>
	}, {
	memref.dealloc %0 : memref<?xf32>
	}) : () -> ()
	return %arg0 : memref<?xf32>
	}

	// -----


	// CHECK-LABEL: func @tensor_cast_to_memref
	// CHECK-SAME: %[[ARG0:.+]]: tensor<4x6x16x32xi8>
	func @tensor_cast_to_memref(%arg0 : tensor<4x6x16x32xi8>) ->
	memref<?x?x16x32xi8> {
	%0 = tensor.cast %arg0 : tensor<4x6x16x32xi8> to tensor<?x?x16x32xi8>
	%1 = bufferization.to_memref %0 : memref<?x?x16x32xi8>
	return %1 : memref<?x?x16x32xi8>
	}
	// CHECK: %[[M:.+]] = bufferization.to_memref %[[ARG0]] : memref<4x6x16x32xi8>
	// CHECK: %[[M1:.+]] = memref.cast %[[M]]
	// CHECK-SAME: memref<4x6x16x32xi8> to memref<?x?x16x32xi8>
	// CHECK: return %[[M1]] : memref<?x?x16x32xi8>

	// -----

	// Folding of memref.load(to_memref(%v, %idxs)) -> tensor.extract(%v, %idx)
	// CHECK-LABEL: func @load_from_buffer_cast(
	func @load_from_buffer_cast(%arg0: index, %arg1: index,
	%arg2: tensor<?x?xf32>) -> f32 {
	%0 = bufferization.to_memref %arg2 : memref<?x?xf32>
	%1 = memref.load %0[%arg0, %arg1] : memref<?x?xf32>
	return %1 : f32
	}
	// CHECK-SAME: %[[IDX0:[0-9a-z]+]]: index, %[[IDX1:[0-9a-z]+]]: index
	// CHECK-SAME: %[[TENSOR:[0-9a-z]+]]: tensor<?x?xf32>
	// CHECK: %[[RES:.*]] = tensor.extract %[[TENSOR]][%[[IDX0]], %[[IDX1]]]
	// CHECK-NOT: memref.load
	// CHECK: return %[[RES]] : f32