flang/lib/Optimizer/Transforms/CUFAddConstructor.cpp - llvm-project - Git at Google

 //===-- CUFAddConstructor.cpp ---------------------------------------------===//
 //
 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
 // See https://llvm.org/LICENSE.txt for license information.
 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
 //
 //===----------------------------------------------------------------------===//

 #include "flang/Optimizer/Builder/FIRBuilder.h"
 #include "flang/Optimizer/Dialect/CUF/CUFOps.h"
 #include "flang/Optimizer/Dialect/FIRAttr.h"
 #include "flang/Optimizer/Dialect/FIRDialect.h"
 #include "flang/Optimizer/Dialect/FIROpsSupport.h"
 #include "flang/Optimizer/Transforms/CUFCommon.h"
 #include "flang/Runtime/entry-names.h"
 #include "mlir/Dialect/GPU/IR/GPUDialect.h"
 #include "mlir/Dialect/LLVMIR/LLVMDialect.h"
 #include "mlir/Pass/Pass.h"
 #include "llvm/ADT/SmallVector.h"

 namespace fir {
 #define GEN_PASS_DEF_CUFADDCONSTRUCTOR
 #include "flang/Optimizer/Transforms/Passes.h.inc"
 } // namespace fir

 namespace {

 static constexpr llvm::StringRef cudaFortranCtorName{
     "__cudaFortranConstructor"};

 struct CUFAddConstructor
     : public fir::impl::CUFAddConstructorBase<CUFAddConstructor> {

   void runOnOperation() override {
     mlir::ModuleOp mod = getOperation();
     mlir::SymbolTable symTab(mod);
     mlir::OpBuilder builder{mod.getBodyRegion()};
     builder.setInsertionPointToEnd(mod.getBody());
     mlir::Location loc = mod.getLoc();
     auto *ctx = mod.getContext();
     auto voidTy = mlir::LLVM::LLVMVoidType::get(ctx);
     auto funcTy =
         mlir::LLVM::LLVMFunctionType::get(voidTy, {}, /*isVarArg=*/false);

     // Symbol reference to CUFRegisterAllocator.
     builder.setInsertionPointToEnd(mod.getBody());
     auto registerFuncOp = builder.create<mlir::LLVM::LLVMFuncOp>(
         loc, RTNAME_STRING(CUFRegisterAllocator), funcTy);
     registerFuncOp.setVisibility(mlir::SymbolTable::Visibility::Private);
     auto cufRegisterAllocatorRef = mlir::SymbolRefAttr::get(
         mod.getContext(), RTNAME_STRING(CUFRegisterAllocator));
     builder.setInsertionPointToEnd(mod.getBody());

     // Create the constructor function that call CUFRegisterAllocator.
     auto func = builder.create<mlir::LLVM::LLVMFuncOp>(loc, cudaFortranCtorName,
                                                        funcTy);
     func.setLinkage(mlir::LLVM::Linkage::Internal);
     builder.setInsertionPointToStart(func.addEntryBlock(builder));
     builder.create<mlir::LLVM::CallOp>(loc, funcTy, cufRegisterAllocatorRef);

     // Register kernels
     auto gpuMod = symTab.lookup<mlir::gpu::GPUModuleOp>(cudaDeviceModuleName);
     if (gpuMod) {
       auto llvmPtrTy = mlir::LLVM::LLVMPointerType::get(ctx);
       auto registeredMod = builder.create<cuf::RegisterModuleOp>(
           loc, llvmPtrTy, mlir::SymbolRefAttr::get(ctx, gpuMod.getName()));
       for (auto func : gpuMod.getOps<mlir::gpu::GPUFuncOp>()) {
         if (func.isKernel()) {
           auto kernelName = mlir::SymbolRefAttr::get(
               builder.getStringAttr(cudaDeviceModuleName),
               {mlir::SymbolRefAttr::get(builder.getContext(), func.getName())});
           builder.create<cuf::RegisterKernelOp>(loc, kernelName, registeredMod);
         }
       }
     }
     builder.create<mlir::LLVM::ReturnOp>(loc, mlir::ValueRange{});

     // Create the llvm.global_ctor with the function.
     // TODO: We might want to have a utility that retrieve it if already created
     // and adds new functions.
     builder.setInsertionPointToEnd(mod.getBody());
     llvm::SmallVector<mlir::Attribute> funcs;
     funcs.push_back(
         mlir::FlatSymbolRefAttr::get(mod.getContext(), func.getSymName()));
     llvm::SmallVector<int> priorities;
     priorities.push_back(0);
     builder.create<mlir::LLVM::GlobalCtorsOp>(
         mod.getLoc(), builder.getArrayAttr(funcs),
         builder.getI32ArrayAttr(priorities));
   }
 };

 } // end anonymous namespace
	//===-- CUFAddConstructor.cpp ---------------------------------------------===//
	//
	// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
	// See https://llvm.org/LICENSE.txt for license information.
	// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
	//
	//===----------------------------------------------------------------------===//

	#include "flang/Optimizer/Builder/FIRBuilder.h"
	#include "flang/Optimizer/Dialect/CUF/CUFOps.h"
	#include "flang/Optimizer/Dialect/FIRAttr.h"
	#include "flang/Optimizer/Dialect/FIRDialect.h"
	#include "flang/Optimizer/Dialect/FIROpsSupport.h"
	#include "flang/Optimizer/Transforms/CUFCommon.h"
	#include "flang/Runtime/entry-names.h"
	#include "mlir/Dialect/GPU/IR/GPUDialect.h"
	#include "mlir/Dialect/LLVMIR/LLVMDialect.h"
	#include "mlir/Pass/Pass.h"
	#include "llvm/ADT/SmallVector.h"

	namespace fir {
	#define GEN_PASS_DEF_CUFADDCONSTRUCTOR
	#include "flang/Optimizer/Transforms/Passes.h.inc"
	} // namespace fir

	namespace {

	static constexpr llvm::StringRef cudaFortranCtorName{
	"__cudaFortranConstructor"};

	struct CUFAddConstructor
	: public fir::impl::CUFAddConstructorBase<CUFAddConstructor> {

	void runOnOperation() override {
	mlir::ModuleOp mod = getOperation();
	mlir::SymbolTable symTab(mod);
	mlir::OpBuilder builder{mod.getBodyRegion()};
	builder.setInsertionPointToEnd(mod.getBody());
	mlir::Location loc = mod.getLoc();
	auto *ctx = mod.getContext();
	auto voidTy = mlir::LLVM::LLVMVoidType::get(ctx);
	auto funcTy =
	mlir::LLVM::LLVMFunctionType::get(voidTy, {}, /isVarArg=/false);

	// Symbol reference to CUFRegisterAllocator.
	builder.setInsertionPointToEnd(mod.getBody());
	auto registerFuncOp = builder.create<mlir::LLVM::LLVMFuncOp>(
	loc, RTNAME_STRING(CUFRegisterAllocator), funcTy);
	registerFuncOp.setVisibility(mlir::SymbolTable::Visibility::Private);
	auto cufRegisterAllocatorRef = mlir::SymbolRefAttr::get(
	mod.getContext(), RTNAME_STRING(CUFRegisterAllocator));
	builder.setInsertionPointToEnd(mod.getBody());

	// Create the constructor function that call CUFRegisterAllocator.
	auto func = builder.create<mlir::LLVM::LLVMFuncOp>(loc, cudaFortranCtorName,
	funcTy);
	func.setLinkage(mlir::LLVM::Linkage::Internal);
	builder.setInsertionPointToStart(func.addEntryBlock(builder));
	builder.create<mlir::LLVM::CallOp>(loc, funcTy, cufRegisterAllocatorRef);

	// Register kernels
	auto gpuMod = symTab.lookup<mlir::gpu::GPUModuleOp>(cudaDeviceModuleName);
	if (gpuMod) {
	auto llvmPtrTy = mlir::LLVM::LLVMPointerType::get(ctx);
	auto registeredMod = builder.create<cuf::RegisterModuleOp>(
	loc, llvmPtrTy, mlir::SymbolRefAttr::get(ctx, gpuMod.getName()));
	for (auto func : gpuMod.getOps<mlir::gpu::GPUFuncOp>()) {
	if (func.isKernel()) {
	auto kernelName = mlir::SymbolRefAttr::get(
	builder.getStringAttr(cudaDeviceModuleName),
	{mlir::SymbolRefAttr::get(builder.getContext(), func.getName())});
	builder.create<cuf::RegisterKernelOp>(loc, kernelName, registeredMod);
	}
	}
	}
	builder.create<mlir::LLVM::ReturnOp>(loc, mlir::ValueRange{});

	// Create the llvm.global_ctor with the function.
	// TODO: We might want to have a utility that retrieve it if already created
	// and adds new functions.
	builder.setInsertionPointToEnd(mod.getBody());
	llvm::SmallVector<mlir::Attribute> funcs;
	funcs.push_back(
	mlir::FlatSymbolRefAttr::get(mod.getContext(), func.getSymName()));
	llvm::SmallVector<int> priorities;
	priorities.push_back(0);
	builder.create<mlir::LLVM::GlobalCtorsOp>(
	mod.getLoc(), builder.getArrayAttr(funcs),
	builder.getI32ArrayAttr(priorities));
	}
	};

	} // end anonymous namespace