mlir/test/Dialect/GPU/async-region.mlir - llvm-project - Git at Google

 // RUN: mlir-opt -gpu-async-region %s | FileCheck %s

 // CHECK: module attributes {gpu.container_module}
 module attributes {gpu.container_module} {

   gpu.module @kernels {
     gpu.func @kernel() kernel { gpu.return }
   }

   func private @foo() -> ()

   // CHECK-LABEL:func @async(%{{.*}}: index)
   func @async(%sz : index) {
     // CHECK: %[[t0:.*]] = gpu.wait async
     // CHECK: %[[t1:.*]] = gpu.launch_func async [%[[t0]]]
     gpu.launch_func @kernels::@kernel
         blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
     // CHECK: %[[t2:.*]] = gpu.launch_func async [%[[t1]]]
     gpu.launch_func @kernels::@kernel
         blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
     // CHECK: %[[m:.*]], %[[t3:.*]] = gpu.alloc async [%[[t2]]] ()
     %0 = gpu.alloc() : memref<7xf32>
     // CHECK: %[[t4:.*]] = gpu.dealloc async [%[[t3]]] %[[m]]
     gpu.dealloc %0 : memref<7xf32>
     // CHECK: gpu.wait [%[[t4]]]
     // CHECK: call @foo
     call @foo() : () -> ()
     return
   }

   // CHECK-LABEL:func @defer_wait(%{{.*}}: index)
   func @defer_wait(%sz : index) {
     // CHECK: %[[a0:.*]], %[[f0:.*]] = async.execute
     %a0 = async.execute {
       // CHECK: %[[t:.*]] = gpu.launch_func async
       gpu.launch_func @kernels::@kernel
           blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
       // CHECK-NOT: gpu.wait
       // CHECK: async.yield %[[t]]
       async.yield
     }

     // CHECK: %[[a1:.*]], %[[f1:.*]] = async.execute
     // CHECK-SAME: %[[f0]]
     %a1 = async.execute [%a0] {
       // CHECK: %[[t:.*]] = gpu.launch_func async
       gpu.launch_func @kernels::@kernel
           blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
       // CHECK-NOT: gpu.wait
       // CHECK: async.yield %[[t]]
       async.yield
     }

     // CHECK: async.await %[[a1]]
     // CHECK: %[[t:.*]] = async.await %[[f1]]
     // CHECK: gpu.wait [%[[t]]]
     async.await %a1 : !async.token
     return
   }

   // CHECK-LABEL:func @defer_wait_blocked_by_side_effect(%{{.*}}: index)
   func @defer_wait_blocked_by_side_effect(%sz : index) {
     // CHECK: %[[a:.*]] = async.execute
     %a = async.execute {
       // CHECK: %[[t:.*]] = gpu.launch_func async
       gpu.launch_func @kernels::@kernel
           blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
       // CHECK: gpu.wait [%[[t]]]
       call @foo() : () -> ()
       async.yield
     }

     // CHECK: async.await %[[a]]
     // CHECK-NOT: gpu.wait
     async.await %a : !async.token
     return
   }

   // CHECK-LABEL:func @defer_wait_pass_through(%{{.*}}: index)
   func @defer_wait_pass_through(%sz : index) {
     // CHECK: %[[a0:.*]], %[[f0:.*]] = async.execute
     %a0 = async.execute {
       // CHECK: %[[t:.*]] = gpu.launch_func async
       gpu.launch_func @kernels::@kernel
           blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
       // CHECK-NOT: gpu.wait
       // CHECK: async.yield %[[t]]
       async.yield
     }

     // CHECK: %[[a1:.*]], %[[f1:.*]] = async.execute
     // CHECK-SAME: %[[f0]]
     %a1 = async.execute [%a0] {
       // CHECK-NOT: gpu.wait
       // CHECK: async.yield %{{.*}}
       async.yield
     }

     // CHECK: async.await %[[a1]]
     // CHECK: %[[t:.*]] = async.await %[[f1]]
     // CHECK: gpu.wait [%[[t]]]
     async.await %a1 : !async.token
     return
   }

   // CHECK-LABEL:func @async_execute_with_result(%{{.*}}: index)
   func @async_execute_with_result(%sz : index) -> index {
     // CHECK: %[[a0:.*]], %[[f0:.*]]:2 = async.execute
     // CHECK-SAME: -> (!async.value<index>, !async.value<!gpu.async.token>)
     %a0, %f0 = async.execute -> !async.value<index> {
       // CHECK: %[[t:.*]] = gpu.launch_func async
       gpu.launch_func @kernels::@kernel
           blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
       // CHECK-NOT: gpu.wait
       // CHECK: async.yield {{.*}}, %[[t]] : index, !gpu.async.token
       async.yield %sz : index
     }

     // CHECK: async.await %[[a0]] : !async.token
     // CHECK: %[[t:.*]] = async.await %[[f0]]#1 : !async.value<!gpu.async.token>
     // CHECK: gpu.wait [%[[t]]]
     async.await %a0 : !async.token
     // CHECK: %[[x:.*]] = async.await %[[f0]]#0 : !async.value<index>
     %x = async.await %f0 : !async.value<index>
     // CHECK: return %[[x]] : index
     return %x : index
   }

   // CHECK-LABEL:func @async_execute_no_use(%{{.*}}: index)
   func @async_execute_no_use(%sz : index) {
     // CHECK: async.execute {
     %a0 = async.execute {
       // CHECK: %[[t:.*]] = gpu.launch_func async
       gpu.launch_func @kernels::@kernel
           blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
       // CHECK: gpu.wait [%[[t]]]
       async.yield
     }
     return
   }

   // CHECK-LABEL:func @async_execute_fork(%{{.*}}: index)
   func @async_execute_fork(%sz : index) {
     // CHECK: %[[a0:.*]], %[[f0:.*]]:2 = async.execute
     // CHECK-SAME: -> (!async.value<!gpu.async.token>, !async.value<!gpu.async.token>)
     %a0 = async.execute {
       // CHECK: %[[t:.*]] = gpu.launch_func async
       gpu.launch_func @kernels::@kernel
           blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
       // CHECK-NOT: gpu.wait
       // CHECK: async.yield %[[t]], %[[t]] : !gpu.async.token, !gpu.async.token
       async.yield
     }
     // CHECK: async.execute [%[[a0]]] (%[[f0]]#0 as {{.*}}: !async.value<!gpu.async.token>)
     %a1 = async.execute [%a0] {
       // CHECK: %[[t:.*]] = gpu.launch_func async
       gpu.launch_func @kernels::@kernel
           blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
       // CHECK: gpu.wait [%[[t]]]
       async.yield
     }
     // CHECK: async.execute [%[[a0]]] (%[[f0]]#1 as {{.*}}: !async.value<!gpu.async.token>)
     %a2 = async.execute [%a0] {
       // CHECK: %[[t:.*]] = gpu.launch_func async
       gpu.launch_func @kernels::@kernel
           blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
       // CHECK: gpu.wait [%[[t]]]
       async.yield
     }
     return
   }

   // CHECK-LABEL:func @existing_tokens()
   func @existing_tokens() {
     // CHECK: %[[t0:.*]] = gpu.wait async
     // CHECK-NOT: [{{.*}}]
     %t0 = gpu.wait async
     // CHECK: %[[t1:.*]] = gpu.wait async [%[[t0]], %[[t0]]]
     %t1 = gpu.wait async [%t0]
     // CHECK: %[[m:.*]], %[[t2:.*]] = gpu.alloc async [%[[t1]], %[[t0]]] ()
     %0 = gpu.alloc [%t0] () : memref<7xf32>
     // CHECK: %[[t3:.*]] = gpu.dealloc async [%[[t2]]] %[[m]]
     %t2 = gpu.dealloc async %0 : memref<7xf32>
     // CHECK: gpu.wait [%[[t3]]]
     gpu.wait
     // CHECK: gpu.wait
     // CHECK-NOT: async
     // CHECK-NOT: [{{.*}}]
     gpu.wait
     return
   }
 }
	// RUN: mlir-opt -gpu-async-region %s \| FileCheck %s

	// CHECK: module attributes {gpu.container_module}
	module attributes {gpu.container_module} {

	gpu.module @kernels {
	gpu.func @kernel() kernel { gpu.return }
	}

	func private @foo() -> ()

	// CHECK-LABEL:func @async(%{{.*}}: index)
	func @async(%sz : index) {
	// CHECK: %[[t0:.*]] = gpu.wait async
	// CHECK: %[[t1:.*]] = gpu.launch_func async [%[[t0]]]
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK: %[[t2:.*]] = gpu.launch_func async [%[[t1]]]
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK: %[[m:.]], %[[t3:.]] = gpu.alloc async [%[[t2]]] ()
	%0 = gpu.alloc() : memref<7xf32>
	// CHECK: %[[t4:.*]] = gpu.dealloc async [%[[t3]]] %[[m]]
	gpu.dealloc %0 : memref<7xf32>
	// CHECK: gpu.wait [%[[t4]]]
	// CHECK: call @foo
	call @foo() : () -> ()
	return
	}

	// CHECK-LABEL:func @defer_wait(%{{.*}}: index)
	func @defer_wait(%sz : index) {
	// CHECK: %[[a0:.]], %[[f0:.]] = async.execute
	%a0 = async.execute {
	// CHECK: %[[t:.*]] = gpu.launch_func async
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK-NOT: gpu.wait
	// CHECK: async.yield %[[t]]
	async.yield
	}

	// CHECK: %[[a1:.]], %[[f1:.]] = async.execute
	// CHECK-SAME: %[[f0]]
	%a1 = async.execute [%a0] {
	// CHECK: %[[t:.*]] = gpu.launch_func async
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK-NOT: gpu.wait
	// CHECK: async.yield %[[t]]
	async.yield
	}

	// CHECK: async.await %[[a1]]
	// CHECK: %[[t:.*]] = async.await %[[f1]]
	// CHECK: gpu.wait [%[[t]]]
	async.await %a1 : !async.token
	return
	}

	// CHECK-LABEL:func @defer_wait_blocked_by_side_effect(%{{.*}}: index)
	func @defer_wait_blocked_by_side_effect(%sz : index) {
	// CHECK: %[[a:.*]] = async.execute
	%a = async.execute {
	// CHECK: %[[t:.*]] = gpu.launch_func async
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK: gpu.wait [%[[t]]]
	call @foo() : () -> ()
	async.yield
	}

	// CHECK: async.await %[[a]]
	// CHECK-NOT: gpu.wait
	async.await %a : !async.token
	return
	}

	// CHECK-LABEL:func @defer_wait_pass_through(%{{.*}}: index)
	func @defer_wait_pass_through(%sz : index) {
	// CHECK: %[[a0:.]], %[[f0:.]] = async.execute
	%a0 = async.execute {
	// CHECK: %[[t:.*]] = gpu.launch_func async
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK-NOT: gpu.wait
	// CHECK: async.yield %[[t]]
	async.yield
	}

	// CHECK: %[[a1:.]], %[[f1:.]] = async.execute
	// CHECK-SAME: %[[f0]]
	%a1 = async.execute [%a0] {
	// CHECK-NOT: gpu.wait
	// CHECK: async.yield %{{.*}}
	async.yield
	}

	// CHECK: async.await %[[a1]]
	// CHECK: %[[t:.*]] = async.await %[[f1]]
	// CHECK: gpu.wait [%[[t]]]
	async.await %a1 : !async.token
	return
	}

	// CHECK-LABEL:func @async_execute_with_result(%{{.*}}: index)
	func @async_execute_with_result(%sz : index) -> index {
	// CHECK: %[[a0:.]], %[[f0:.]]:2 = async.execute
	// CHECK-SAME: -> (!async.value<index>, !async.value<!gpu.async.token>)
	%a0, %f0 = async.execute -> !async.value<index> {
	// CHECK: %[[t:.*]] = gpu.launch_func async
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK-NOT: gpu.wait
	// CHECK: async.yield {{.*}}, %[[t]] : index, !gpu.async.token
	async.yield %sz : index
	}

	// CHECK: async.await %[[a0]] : !async.token
	// CHECK: %[[t:.*]] = async.await %[[f0]]#1 : !async.value<!gpu.async.token>
	// CHECK: gpu.wait [%[[t]]]
	async.await %a0 : !async.token
	// CHECK: %[[x:.*]] = async.await %[[f0]]#0 : !async.value<index>
	%x = async.await %f0 : !async.value<index>
	// CHECK: return %[[x]] : index
	return %x : index
	}

	// CHECK-LABEL:func @async_execute_no_use(%{{.*}}: index)
	func @async_execute_no_use(%sz : index) {
	// CHECK: async.execute {
	%a0 = async.execute {
	// CHECK: %[[t:.*]] = gpu.launch_func async
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK: gpu.wait [%[[t]]]
	async.yield
	}
	return
	}

	// CHECK-LABEL:func @async_execute_fork(%{{.*}}: index)
	func @async_execute_fork(%sz : index) {
	// CHECK: %[[a0:.]], %[[f0:.]]:2 = async.execute
	// CHECK-SAME: -> (!async.value<!gpu.async.token>, !async.value<!gpu.async.token>)
	%a0 = async.execute {
	// CHECK: %[[t:.*]] = gpu.launch_func async
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK-NOT: gpu.wait
	// CHECK: async.yield %[[t]], %[[t]] : !gpu.async.token, !gpu.async.token
	async.yield
	}
	// CHECK: async.execute [%[[a0]]] (%[[f0]]#0 as {{.*}}: !async.value<!gpu.async.token>)
	%a1 = async.execute [%a0] {
	// CHECK: %[[t:.*]] = gpu.launch_func async
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK: gpu.wait [%[[t]]]
	async.yield
	}
	// CHECK: async.execute [%[[a0]]] (%[[f0]]#1 as {{.*}}: !async.value<!gpu.async.token>)
	%a2 = async.execute [%a0] {
	// CHECK: %[[t:.*]] = gpu.launch_func async
	gpu.launch_func @kernels::@kernel
	blocks in (%sz, %sz, %sz) threads in (%sz, %sz, %sz)
	// CHECK: gpu.wait [%[[t]]]
	async.yield
	}
	return
	}

	// CHECK-LABEL:func @existing_tokens()
	func @existing_tokens() {
	// CHECK: %[[t0:.*]] = gpu.wait async
	// CHECK-NOT: [{{.*}}]
	%t0 = gpu.wait async
	// CHECK: %[[t1:.*]] = gpu.wait async [%[[t0]], %[[t0]]]
	%t1 = gpu.wait async [%t0]
	// CHECK: %[[m:.]], %[[t2:.]] = gpu.alloc async [%[[t1]], %[[t0]]] ()
	%0 = gpu.alloc [%t0] () : memref<7xf32>
	// CHECK: %[[t3:.*]] = gpu.dealloc async [%[[t2]]] %[[m]]
	%t2 = gpu.dealloc async %0 : memref<7xf32>
	// CHECK: gpu.wait [%[[t3]]]
	gpu.wait
	// CHECK: gpu.wait
	// CHECK-NOT: async
	// CHECK-NOT: [{{.*}}]
	gpu.wait
	return
	}
	}