[AMDGPU] Implement llvm.lround intrinsic lowering. (#98970) This patch enables the target-independent lowering of llvm.lround via GlobalISel. For SelectionDAG, the instrinsic is custom lowered for AMDGPU. In order to support vector floating point input for llvm.lround, this patch extends the target independent APIs and provide support for scalarizing. pr98950 is needed to let verifier allow vector floating point types

commit: fc832d5349e1066b2ce8cec72bcbc39b9770758b [log] [tgz]
author: Sumanth Gundapaneni <sumanth.gundapaneni@amd.com> Tue Jul 23 11:34:34 2024 -0500
committer: GitHub <noreply@github.com> Tue Jul 23 20:34:34 2024 +0400
tree: ab3deb7e7fa2e95974df8d184b85381b1123dca5
parent: f227dc9ca24296cec0878b92d5ad3f853417e264 [diff] [blame]
diff --git a/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp b/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp
index 644dbae..6c7885c 100644
--- a/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp
+++ b/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp

@@ -3881,6 +3881,17 @@
     return lowerFMad(MI);
   case TargetOpcode::G_FFLOOR:
     return lowerFFloor(MI);
+  case TargetOpcode::G_LROUND:
+  case TargetOpcode::G_LLROUND: {
+    Register DstReg = MI.getOperand(0).getReg();
+    Register SrcReg = MI.getOperand(1).getReg();
+    LLT SrcTy = MRI.getType(SrcReg);
+    auto Round = MIRBuilder.buildInstr(TargetOpcode::G_INTRINSIC_ROUND, {SrcTy},
+                                       {SrcReg});
+    MIRBuilder.buildFPTOSI(DstReg, Round);
+    MI.eraseFromParent();
+    return Legalized;
+  }
   case TargetOpcode::G_INTRINSIC_ROUND:
     return lowerIntrinsicRound(MI);
   case TargetOpcode::G_FRINT: {
commit	fc832d5349e1066b2ce8cec72bcbc39b9770758b	[log] [tgz]
author	Sumanth Gundapaneni <sumanth.gundapaneni@amd.com>	Tue Jul 23 11:34:34 2024 -0500
committer	GitHub <noreply@github.com>	Tue Jul 23 20:34:34 2024 +0400
tree	ab3deb7e7fa2e95974df8d184b85381b1123dca5
parent	f227dc9ca24296cec0878b92d5ad3f853417e264 [diff] [blame]