AMDGPU/GlobalISel: Fix lower for f64->f16 G_FPTRUNC Put AND before ADD in LegalizerHelper::lowerFPTRUNC_F64_TO_F16 in order to match algorithm from AMDGPUTargetLowering::LowerFP_TO_FP16. Differential Revision: https://reviews.llvm.org/D81666

commit: bd3d951b8bb9861c3171a322a3407151444923b0 [log] [tgz]
author: Petar Avramovic <Petar.Avramovic@amd.com> Thu Jun 11 17:55:59 2020 +0200
committer: Petar Avramovic <Petar.Avramovic@amd.com> Thu Jun 11 18:19:27 2020 +0200
tree: c7ba8e43fa0a421aa939564011e8aa0b36a5cb5e
parent: 5ee571735ddf1f81db3df5d7328c86432209e3b4 [diff] [blame]
diff --git a/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp b/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp
index 6c6ef78..20f75668 100644
--- a/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp
+++ b/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp

@@ -4604,12 +4604,12 @@
   Register UH = Unmerge.getReg(1);
 
   auto E = MIRBuilder.buildLShr(S32, UH, MIRBuilder.buildConstant(S32, 20));
+  E = MIRBuilder.buildAnd(S32, E, MIRBuilder.buildConstant(S32, ExpMask));
 
   // Subtract the fp64 exponent bias (1023) to get the real exponent and
   // add the f16 bias (15) to get the biased exponent for the f16 format.
   E = MIRBuilder.buildAdd(
     S32, E, MIRBuilder.buildConstant(S32, -ExpBiasf64 + ExpBiasf16));
-  E = MIRBuilder.buildAnd(S32, E, MIRBuilder.buildConstant(S32, ExpMask));
 
   auto M = MIRBuilder.buildLShr(S32, UH, MIRBuilder.buildConstant(S32, 8));
   M = MIRBuilder.buildAnd(S32, M, MIRBuilder.buildConstant(S32, 0xffe));
commit	bd3d951b8bb9861c3171a322a3407151444923b0	[log] [tgz]
author	Petar Avramovic <Petar.Avramovic@amd.com>	Thu Jun 11 17:55:59 2020 +0200
committer	Petar Avramovic <Petar.Avramovic@amd.com>	Thu Jun 11 18:19:27 2020 +0200
tree	c7ba8e43fa0a421aa939564011e8aa0b36a5cb5e
parent	5ee571735ddf1f81db3df5d7328c86432209e3b4 [diff] [blame]