clang/lib/Driver/ToolChains/AMDGPU.cpp - llvm-project - Git at Google

 //===--- AMDGPU.cpp - AMDGPU ToolChain Implementations ----------*- C++ -*-===//
 //
 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
 // See https://llvm.org/LICENSE.txt for license information.
 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
 //
 //===----------------------------------------------------------------------===//

 #include "AMDGPU.h"
 #include "CommonArgs.h"
 #include "InputInfo.h"
 #include "clang/Driver/Compilation.h"
 #include "clang/Driver/DriverDiagnostic.h"
 #include "llvm/Option/ArgList.h"
 #include "llvm/Support/TargetParser.h"

 using namespace clang::driver;
 using namespace clang::driver::tools;
 using namespace clang::driver::toolchains;
 using namespace clang;
 using namespace llvm::opt;

 void amdgpu::Linker::ConstructJob(Compilation &C, const JobAction &JA,
                                   const InputInfo &Output,
                                   const InputInfoList &Inputs,
                                   const ArgList &Args,
                                   const char *LinkingOutput) const {

   std::string Linker = getToolChain().GetProgramPath(getShortName());
   ArgStringList CmdArgs;
   AddLinkerInputs(getToolChain(), Inputs, Args, CmdArgs, JA);
   CmdArgs.push_back("-shared");
   CmdArgs.push_back("-o");
   CmdArgs.push_back(Output.getFilename());
   C.addCommand(std::make_unique<Command>(JA, *this, Args.MakeArgString(Linker),
                                           CmdArgs, Inputs));
 }

 void amdgpu::getAMDGPUTargetFeatures(const Driver &D,
                                      const llvm::opt::ArgList &Args,
                                      std::vector<StringRef> &Features) {
   if (const Arg *dAbi = Args.getLastArg(options::OPT_mamdgpu_debugger_abi))
     D.Diag(diag::err_drv_clang_unsupported) << dAbi->getAsString(Args);

   if (Args.getLastArg(options::OPT_mwavefrontsize64)) {
     Features.push_back("-wavefrontsize16");
     Features.push_back("-wavefrontsize32");
     Features.push_back("+wavefrontsize64");
   }
   if (Args.getLastArg(options::OPT_mno_wavefrontsize64)) {
     Features.push_back("-wavefrontsize16");
     Features.push_back("+wavefrontsize32");
     Features.push_back("-wavefrontsize64");
   }

   handleTargetFeaturesGroup(
     Args, Features, options::OPT_m_amdgpu_Features_Group);
 }

 /// AMDGPU Toolchain
 AMDGPUToolChain::AMDGPUToolChain(const Driver &D, const llvm::Triple &Triple,
                                  const ArgList &Args)
     : Generic_ELF(D, Triple, Args),
       OptionsDefault({{options::OPT_O, "3"},
                       {options::OPT_cl_std_EQ, "CL1.2"}}) {}

 Tool *AMDGPUToolChain::buildLinker() const {
   return new tools::amdgpu::Linker(*this);
 }

 DerivedArgList *
 AMDGPUToolChain::TranslateArgs(const DerivedArgList &Args, StringRef BoundArch,
                                Action::OffloadKind DeviceOffloadKind) const {

   DerivedArgList *DAL =
       Generic_ELF::TranslateArgs(Args, BoundArch, DeviceOffloadKind);

   // Do nothing if not OpenCL (-x cl)
   if (!Args.getLastArgValue(options::OPT_x).equals("cl"))
     return DAL;

   if (!DAL)
     DAL = new DerivedArgList(Args.getBaseArgs());
   for (auto *A : Args)
     DAL->append(A);

   const OptTable &Opts = getDriver().getOpts();

   // Phase 1 (.cl -> .bc)
   if (Args.hasArg(options::OPT_c) && Args.hasArg(options::OPT_emit_llvm)) {
     DAL->AddFlagArg(nullptr, Opts.getOption(getTriple().isArch64Bit()
                                                 ? options::OPT_m64
                                                 : options::OPT_m32));

     // Have to check OPT_O4, OPT_O0 & OPT_Ofast separately
     // as they defined that way in Options.td
     if (!Args.hasArg(options::OPT_O, options::OPT_O0, options::OPT_O4,
                      options::OPT_Ofast))
       DAL->AddJoinedArg(nullptr, Opts.getOption(options::OPT_O),
                         getOptionDefault(options::OPT_O));
   }

   return DAL;
 }

 bool AMDGPUToolChain::getDefaultDenormsAreZeroForTarget(
     llvm::AMDGPU::GPUKind Kind) {
   const unsigned ArchAttr = llvm::AMDGPU::getArchAttrAMDGCN(Kind);

   // Default to enabling f32 denormals by default on subtargets where fma is
   // fast with denormals
   const bool BothDenormAndFMAFast =
       (ArchAttr & llvm::AMDGPU::FEATURE_FAST_FMA_F32) &&
       (ArchAttr & llvm::AMDGPU::FEATURE_FAST_DENORMAL_F32);
   return !BothDenormAndFMAFast;
 }

 llvm::DenormalMode AMDGPUToolChain::getDefaultDenormalModeForType(
     const llvm::opt::ArgList &DriverArgs, Action::OffloadKind DeviceOffloadKind,
     const llvm::fltSemantics *FPType) const {
   // Denormals should always be enabled for f16 and f64.
   if (!FPType || FPType != &llvm::APFloat::IEEEsingle())
     return llvm::DenormalMode::getIEEE();

   if (DeviceOffloadKind == Action::OFK_Cuda) {
     if (FPType && FPType == &llvm::APFloat::IEEEsingle() &&
         DriverArgs.hasFlag(options::OPT_fcuda_flush_denormals_to_zero,
                            options::OPT_fno_cuda_flush_denormals_to_zero,
                            false))
       return llvm::DenormalMode::getPreserveSign();
   }

   const StringRef GpuArch = DriverArgs.getLastArgValue(options::OPT_mcpu_EQ);
   auto Kind = llvm::AMDGPU::parseArchAMDGCN(GpuArch);

   // TODO: There are way too many flags that change this. Do we need to check
   // them all?
   bool DAZ = DriverArgs.hasArg(options::OPT_cl_denorms_are_zero) ||
              getDefaultDenormsAreZeroForTarget(Kind);
   // Outputs are flushed to zero, preserving sign
   return DAZ ? llvm::DenormalMode::getPreserveSign() :
                llvm::DenormalMode::getIEEE();
 }

 void AMDGPUToolChain::addClangTargetOptions(
     const llvm::opt::ArgList &DriverArgs,
     llvm::opt::ArgStringList &CC1Args,
     Action::OffloadKind DeviceOffloadingKind) const {
   // Default to "hidden" visibility, as object level linking will not be
   // supported for the foreseeable future.
   if (!DriverArgs.hasArg(options::OPT_fvisibility_EQ,
                          options::OPT_fvisibility_ms_compat)) {
     CC1Args.push_back("-fvisibility");
     CC1Args.push_back("hidden");
     CC1Args.push_back("-fapply-global-visibility-to-externs");
   }
 }
	//===--- AMDGPU.cpp - AMDGPU ToolChain Implementations ----------- C++ --===//
	//
	// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
	// See https://llvm.org/LICENSE.txt for license information.
	// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
	//
	//===----------------------------------------------------------------------===//

	#include "AMDGPU.h"
	#include "CommonArgs.h"
	#include "InputInfo.h"
	#include "clang/Driver/Compilation.h"
	#include "clang/Driver/DriverDiagnostic.h"
	#include "llvm/Option/ArgList.h"
	#include "llvm/Support/TargetParser.h"

	using namespace clang::driver;
	using namespace clang::driver::tools;
	using namespace clang::driver::toolchains;
	using namespace clang;
	using namespace llvm::opt;

	void amdgpu::Linker::ConstructJob(Compilation &C, const JobAction &JA,
	const InputInfo &Output,
	const InputInfoList &Inputs,
	const ArgList &Args,
	const char *LinkingOutput) const {

	std::string Linker = getToolChain().GetProgramPath(getShortName());
	ArgStringList CmdArgs;
	AddLinkerInputs(getToolChain(), Inputs, Args, CmdArgs, JA);
	CmdArgs.push_back("-shared");
	CmdArgs.push_back("-o");
	CmdArgs.push_back(Output.getFilename());
	C.addCommand(std::make_unique<Command>(JA, *this, Args.MakeArgString(Linker),
	CmdArgs, Inputs));
	}

	void amdgpu::getAMDGPUTargetFeatures(const Driver &D,
	const llvm::opt::ArgList &Args,
	std::vector<StringRef> &Features) {
	if (const Arg *dAbi = Args.getLastArg(options::OPT_mamdgpu_debugger_abi))
	D.Diag(diag::err_drv_clang_unsupported) << dAbi->getAsString(Args);

	if (Args.getLastArg(options::OPT_mwavefrontsize64)) {
	Features.push_back("-wavefrontsize16");
	Features.push_back("-wavefrontsize32");
	Features.push_back("+wavefrontsize64");
	}
	if (Args.getLastArg(options::OPT_mno_wavefrontsize64)) {
	Features.push_back("-wavefrontsize16");
	Features.push_back("+wavefrontsize32");
	Features.push_back("-wavefrontsize64");
	}

	handleTargetFeaturesGroup(
	Args, Features, options::OPT_m_amdgpu_Features_Group);
	}

	/// AMDGPU Toolchain
	AMDGPUToolChain::AMDGPUToolChain(const Driver &D, const llvm::Triple &Triple,
	const ArgList &Args)
	: Generic_ELF(D, Triple, Args),
	OptionsDefault({{options::OPT_O, "3"},
	{options::OPT_cl_std_EQ, "CL1.2"}}) {}

	Tool *AMDGPUToolChain::buildLinker() const {
	return new tools::amdgpu::Linker(*this);
	}

	DerivedArgList *
	AMDGPUToolChain::TranslateArgs(const DerivedArgList &Args, StringRef BoundArch,
	Action::OffloadKind DeviceOffloadKind) const {

	DerivedArgList *DAL =
	Generic_ELF::TranslateArgs(Args, BoundArch, DeviceOffloadKind);

	// Do nothing if not OpenCL (-x cl)
	if (!Args.getLastArgValue(options::OPT_x).equals("cl"))
	return DAL;

	if (!DAL)
	DAL = new DerivedArgList(Args.getBaseArgs());
	for (auto *A : Args)
	DAL->append(A);

	const OptTable &Opts = getDriver().getOpts();

	// Phase 1 (.cl -> .bc)
	if (Args.hasArg(options::OPT_c) && Args.hasArg(options::OPT_emit_llvm)) {
	DAL->AddFlagArg(nullptr, Opts.getOption(getTriple().isArch64Bit()
	? options::OPT_m64
	: options::OPT_m32));

	// Have to check OPT_O4, OPT_O0 & OPT_Ofast separately
	// as they defined that way in Options.td
	if (!Args.hasArg(options::OPT_O, options::OPT_O0, options::OPT_O4,
	options::OPT_Ofast))
	DAL->AddJoinedArg(nullptr, Opts.getOption(options::OPT_O),
	getOptionDefault(options::OPT_O));
	}

	return DAL;
	}

	bool AMDGPUToolChain::getDefaultDenormsAreZeroForTarget(
	llvm::AMDGPU::GPUKind Kind) {
	const unsigned ArchAttr = llvm::AMDGPU::getArchAttrAMDGCN(Kind);

	// Default to enabling f32 denormals by default on subtargets where fma is
	// fast with denormals
	const bool BothDenormAndFMAFast =
	(ArchAttr & llvm::AMDGPU::FEATURE_FAST_FMA_F32) &&
	(ArchAttr & llvm::AMDGPU::FEATURE_FAST_DENORMAL_F32);
	return !BothDenormAndFMAFast;
	}

	llvm::DenormalMode AMDGPUToolChain::getDefaultDenormalModeForType(
	const llvm::opt::ArgList &DriverArgs, Action::OffloadKind DeviceOffloadKind,
	const llvm::fltSemantics *FPType) const {
	// Denormals should always be enabled for f16 and f64.
	if (!FPType \|\| FPType != &llvm::APFloat::IEEEsingle())
	return llvm::DenormalMode::getIEEE();

	if (DeviceOffloadKind == Action::OFK_Cuda) {
	if (FPType && FPType == &llvm::APFloat::IEEEsingle() &&
	DriverArgs.hasFlag(options::OPT_fcuda_flush_denormals_to_zero,
	options::OPT_fno_cuda_flush_denormals_to_zero,
	false))
	return llvm::DenormalMode::getPreserveSign();
	}

	const StringRef GpuArch = DriverArgs.getLastArgValue(options::OPT_mcpu_EQ);
	auto Kind = llvm::AMDGPU::parseArchAMDGCN(GpuArch);

	// TODO: There are way too many flags that change this. Do we need to check
	// them all?
	bool DAZ = DriverArgs.hasArg(options::OPT_cl_denorms_are_zero) \|\|
	getDefaultDenormsAreZeroForTarget(Kind);
	// Outputs are flushed to zero, preserving sign
	return DAZ ? llvm::DenormalMode::getPreserveSign() :
	llvm::DenormalMode::getIEEE();
	}

	void AMDGPUToolChain::addClangTargetOptions(
	const llvm::opt::ArgList &DriverArgs,
	llvm::opt::ArgStringList &CC1Args,
	Action::OffloadKind DeviceOffloadingKind) const {
	// Default to "hidden" visibility, as object level linking will not be
	// supported for the foreseeable future.
	if (!DriverArgs.hasArg(options::OPT_fvisibility_EQ,
	options::OPT_fvisibility_ms_compat)) {
	CC1Args.push_back("-fvisibility");
	CC1Args.push_back("hidden");
	CC1Args.push_back("-fapply-global-visibility-to-externs");
	}
	}