mlir/test/Dialect/Affine/SuperVectorize/vectorize_transpose_2d.mlir - llvm-project - Git at Google

 // RUN: mlir-opt %s -affine-super-vectorize="virtual-vector-size=32,256 test-fastest-varying=0,1" | FileCheck %s

 // Permutation maps used in vectorization.
 // CHECK-DAG: #[[map_proj_d0d1d2_d2d1:map[0-9]*]] = affine_map<(d0, d1, d2) -> (d2, d1)>

 func @vec2d(%A : memref<?x?x?xf32>) {
   %c0 = arith.constant 0 : index
   %c1 = arith.constant 1 : index
   %c2 = arith.constant 2 : index
   %M = memref.dim %A, %c0 : memref<?x?x?xf32>
   %N = memref.dim %A, %c1 : memref<?x?x?xf32>
   %P = memref.dim %A, %c2 : memref<?x?x?xf32>
   // CHECK: for  {{.*}} = 0 to %{{.*}} {
   // CHECK:   for  {{.*}} = 0 to %{{.*}} {
   // CHECK:     for  {{.*}} = 0 to %{{.*}} {
   // For the case: --test-fastest-varying=0 --test-fastest-varying=1 no
   // vectorization happens because of loop nesting order.
   affine.for %i0 = 0 to %M {
     affine.for %i1 = 0 to %N {
       affine.for %i2 = 0 to %P {
         %a2 = affine.load %A[%i0, %i1, %i2] : memref<?x?x?xf32>
       }
     }
   }
   // CHECK: affine.for %{{.*}} = 0 to %{{.*}} step 32
   // CHECK:   affine.for %{{.*}} = 0 to %{{.*}} {
   // CHECK:     affine.for %{{.*}} = 0 to %{{.*}} step 256
   // CHECK:       {{.*}} = vector.transfer_read %{{.*}}[%{{.*}}, %{{.*}}, %{{.*}}], %{{.*}} {permutation_map = #[[map_proj_d0d1d2_d2d1]]} : memref<?x?x?xf32>, vector<32x256xf32>
   affine.for %i3 = 0 to %M {
     affine.for %i4 = 0 to %N {
       affine.for %i5 = 0 to %P {
         %a5 = affine.load %A[%i4, %i5, %i3] : memref<?x?x?xf32>
       }
     }
   }
   return
 }

 func @vec2d_imperfectly_nested(%A : memref<?x?x?xf32>) {
   %c0 = arith.constant 0 : index
   %c1 = arith.constant 1 : index
   %c2 = arith.constant 2 : index
   %0 = memref.dim %A, %c0 : memref<?x?x?xf32>
   %1 = memref.dim %A, %c1 : memref<?x?x?xf32>
   %2 = memref.dim %A, %c2 : memref<?x?x?xf32>
   // CHECK: affine.for %{{.*}} = 0 to %{{.*}} step 32 {
   // CHECK:   affine.for %{{.*}} = 0 to %{{.*}} step 256 {
   // CHECK:     affine.for %{{.*}} = 0 to %{{.*}} {
   // CHECK:       %{{.*}} = vector.transfer_read %{{.*}}[%{{.*}}, %{{.*}}, %{{.*}}], %{{.*}} {permutation_map = #[[map_proj_d0d1d2_d2d1]]} : memref<?x?x?xf32>, vector<32x256xf32>
   // CHECK:   affine.for %{{.*}} = 0 to %{{.*}} {
   // CHECK:     affine.for %{{.*}} = 0 to %{{.*}} step 256 {
   // CHECK:       %{{.*}} = vector.transfer_read %{{.*}}[%{{.*}}, %{{.*}}, %{{.*}}], %{{.*}} {permutation_map = #[[map_proj_d0d1d2_d2d1]]} : memref<?x?x?xf32>, vector<32x256xf32>
   // CHECK:     affine.for %{{.*}} = 0 to %{{.*}} step 256 {
   // CHECK:       %{{.*}} = vector.transfer_read %{{.*}}[%{{.*}}, %{{.*}}, %{{.*}}], %{{.*}} {permutation_map = #[[map_proj_d0d1d2_d2d1]]} : memref<?x?x?xf32>, vector<32x256xf32>
   affine.for %i0 = 0 to %0 {
     affine.for %i1 = 0 to %1 {
       affine.for %i2 = 0 to %2 {
         %a2 = affine.load %A[%i2, %i1, %i0] : memref<?x?x?xf32>
       }
     }
     affine.for %i3 = 0 to %1 {
       affine.for %i4 = 0 to %2 {
         %a4 = affine.load %A[%i3, %i4, %i0] : memref<?x?x?xf32>
       }
       affine.for %i5 = 0 to %2 {
         %a5 = affine.load %A[%i3, %i5, %i0] : memref<?x?x?xf32>
       }
     }
   }
   return
 }
	// RUN: mlir-opt %s -affine-super-vectorize="virtual-vector-size=32,256 test-fastest-varying=0,1" \| FileCheck %s

	// Permutation maps used in vectorization.
	// CHECK-DAG: #[[map_proj_d0d1d2_d2d1:map[0-9]*]] = affine_map<(d0, d1, d2) -> (d2, d1)>

	func @vec2d(%A : memref<?x?x?xf32>) {
	%c0 = arith.constant 0 : index
	%c1 = arith.constant 1 : index
	%c2 = arith.constant 2 : index
	%M = memref.dim %A, %c0 : memref<?x?x?xf32>
	%N = memref.dim %A, %c1 : memref<?x?x?xf32>
	%P = memref.dim %A, %c2 : memref<?x?x?xf32>
	// CHECK: for {{.}} = 0 to %{{.}} {
	// CHECK: for {{.}} = 0 to %{{.}} {
	// CHECK: for {{.}} = 0 to %{{.}} {
	// For the case: --test-fastest-varying=0 --test-fastest-varying=1 no
	// vectorization happens because of loop nesting order.
	affine.for %i0 = 0 to %M {
	affine.for %i1 = 0 to %N {
	affine.for %i2 = 0 to %P {
	%a2 = affine.load %A[%i0, %i1, %i2] : memref<?x?x?xf32>
	}
	}
	}
	// CHECK: affine.for %{{.}} = 0 to %{{.}} step 32
	// CHECK: affine.for %{{.}} = 0 to %{{.}} {
	// CHECK: affine.for %{{.}} = 0 to %{{.}} step 256
	// CHECK: {{.}} = vector.transfer_read %{{.}}[%{{.}}, %{{.}}, %{{.}}], %{{.}} {permutation_map = #[[map_proj_d0d1d2_d2d1]]} : memref<?x?x?xf32>, vector<32x256xf32>
	affine.for %i3 = 0 to %M {
	affine.for %i4 = 0 to %N {
	affine.for %i5 = 0 to %P {
	%a5 = affine.load %A[%i4, %i5, %i3] : memref<?x?x?xf32>
	}
	}
	}
	return
	}

	func @vec2d_imperfectly_nested(%A : memref<?x?x?xf32>) {
	%c0 = arith.constant 0 : index
	%c1 = arith.constant 1 : index
	%c2 = arith.constant 2 : index
	%0 = memref.dim %A, %c0 : memref<?x?x?xf32>
	%1 = memref.dim %A, %c1 : memref<?x?x?xf32>
	%2 = memref.dim %A, %c2 : memref<?x?x?xf32>
	// CHECK: affine.for %{{.}} = 0 to %{{.}} step 32 {
	// CHECK: affine.for %{{.}} = 0 to %{{.}} step 256 {
	// CHECK: affine.for %{{.}} = 0 to %{{.}} {
	// CHECK: %{{.}} = vector.transfer_read %{{.}}[%{{.}}, %{{.}}, %{{.}}], %{{.}} {permutation_map = #[[map_proj_d0d1d2_d2d1]]} : memref<?x?x?xf32>, vector<32x256xf32>
	// CHECK: affine.for %{{.}} = 0 to %{{.}} {
	// CHECK: affine.for %{{.}} = 0 to %{{.}} step 256 {
	// CHECK: %{{.}} = vector.transfer_read %{{.}}[%{{.}}, %{{.}}, %{{.}}], %{{.}} {permutation_map = #[[map_proj_d0d1d2_d2d1]]} : memref<?x?x?xf32>, vector<32x256xf32>
	// CHECK: affine.for %{{.}} = 0 to %{{.}} step 256 {
	// CHECK: %{{.}} = vector.transfer_read %{{.}}[%{{.}}, %{{.}}, %{{.}}], %{{.}} {permutation_map = #[[map_proj_d0d1d2_d2d1]]} : memref<?x?x?xf32>, vector<32x256xf32>
	affine.for %i0 = 0 to %0 {
	affine.for %i1 = 0 to %1 {
	affine.for %i2 = 0 to %2 {
	%a2 = affine.load %A[%i2, %i1, %i0] : memref<?x?x?xf32>
	}
	}
	affine.for %i3 = 0 to %1 {
	affine.for %i4 = 0 to %2 {
	%a4 = affine.load %A[%i3, %i4, %i0] : memref<?x?x?xf32>
	}
	affine.for %i5 = 0 to %2 {
	%a5 = affine.load %A[%i3, %i5, %i0] : memref<?x?x?xf32>
	}
	}
	}
	return
	}