blob: 61bb4ffc2e48c93a394c673b4021a1a0fc55924a [file] [edit]
; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: sed 's/iXLen2/i64/g' %s | sed 's/XLen/32/g' |llc -mtriple=riscv32 -mattr=+m | \
; RUN: FileCheck %s --check-prefix=RV32
; RUN: sed 's/iXLen2/i128/g' %s | sed 's/XLen/64/g'| llc -mtriple=riscv64 -mattr=+m | \
; RUN: FileCheck %s --check-prefix=RV64
define iXLen2 @test_urem_3(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_3:
; RV32: # %bb.0:
; RV32-NEXT: add a1, a0, a1
; RV32-NEXT: lui a2, 699051
; RV32-NEXT: sltu a0, a1, a0
; RV32-NEXT: addi a2, a2, -1365
; RV32-NEXT: add a0, a1, a0
; RV32-NEXT: mulhu a1, a0, a2
; RV32-NEXT: srli a2, a1, 1
; RV32-NEXT: andi a1, a1, -2
; RV32-NEXT: add a1, a1, a2
; RV32-NEXT: sub a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_3:
; RV64: # %bb.0:
; RV64-NEXT: add a1, a0, a1
; RV64-NEXT: lui a2, 699051
; RV64-NEXT: sltu a0, a1, a0
; RV64-NEXT: addi a2, a2, -1365
; RV64-NEXT: add a0, a1, a0
; RV64-NEXT: slli a1, a2, 32
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: mulhu a1, a0, a1
; RV64-NEXT: srli a2, a1, 1
; RV64-NEXT: andi a1, a1, -2
; RV64-NEXT: add a1, a1, a2
; RV64-NEXT: sub a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 3
ret iXLen2 %a
}
define iXLen2 @test_urem_5(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_5:
; RV32: # %bb.0:
; RV32-NEXT: add a1, a0, a1
; RV32-NEXT: lui a2, 838861
; RV32-NEXT: sltu a0, a1, a0
; RV32-NEXT: addi a2, a2, -819
; RV32-NEXT: add a0, a1, a0
; RV32-NEXT: mulhu a1, a0, a2
; RV32-NEXT: srli a2, a1, 2
; RV32-NEXT: andi a1, a1, -4
; RV32-NEXT: add a1, a1, a2
; RV32-NEXT: sub a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_5:
; RV64: # %bb.0:
; RV64-NEXT: add a1, a0, a1
; RV64-NEXT: lui a2, 838861
; RV64-NEXT: sltu a0, a1, a0
; RV64-NEXT: addi a2, a2, -819
; RV64-NEXT: add a0, a1, a0
; RV64-NEXT: slli a1, a2, 32
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: mulhu a1, a0, a1
; RV64-NEXT: srli a2, a1, 2
; RV64-NEXT: andi a1, a1, -4
; RV64-NEXT: add a1, a1, a2
; RV64-NEXT: sub a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 5
ret iXLen2 %a
}
define iXLen2 @test_urem_7(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_7:
; RV32: # %bb.0:
; RV32-NEXT: lui a2, 262144
; RV32-NEXT: slli a3, a1, 2
; RV32-NEXT: srli a4, a0, 30
; RV32-NEXT: srli a1, a1, 28
; RV32-NEXT: or a3, a4, a3
; RV32-NEXT: lui a4, 149797
; RV32-NEXT: addi a2, a2, -1
; RV32-NEXT: and a0, a0, a2
; RV32-NEXT: and a2, a3, a2
; RV32-NEXT: add a0, a0, a2
; RV32-NEXT: add a0, a0, a1
; RV32-NEXT: addi a1, a4, -1755
; RV32-NEXT: mulhu a1, a0, a1
; RV32-NEXT: sub a2, a0, a1
; RV32-NEXT: srli a2, a2, 1
; RV32-NEXT: add a1, a2, a1
; RV32-NEXT: srli a1, a1, 2
; RV32-NEXT: slli a2, a1, 3
; RV32-NEXT: sub a1, a1, a2
; RV32-NEXT: add a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_7:
; RV64: # %bb.0:
; RV64-NEXT: li a2, -1
; RV64-NEXT: slli a3, a1, 4
; RV64-NEXT: srli a4, a0, 60
; RV64-NEXT: or a3, a4, a3
; RV64-NEXT: lui a4, %hi(.LCPI2_0)
; RV64-NEXT: srli a2, a2, 4
; RV64-NEXT: ld a4, %lo(.LCPI2_0)(a4)
; RV64-NEXT: and a0, a0, a2
; RV64-NEXT: and a2, a3, a2
; RV64-NEXT: add a0, a0, a2
; RV64-NEXT: srli a1, a1, 56
; RV64-NEXT: add a0, a0, a1
; RV64-NEXT: mulhu a1, a0, a4
; RV64-NEXT: srli a1, a1, 1
; RV64-NEXT: slli a2, a1, 3
; RV64-NEXT: sub a1, a1, a2
; RV64-NEXT: add a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 7
ret iXLen2 %a
}
define iXLen2 @test_urem_9(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_9:
; RV32: # %bb.0:
; RV32-NEXT: lui a2, 262144
; RV32-NEXT: slli a3, a1, 2
; RV32-NEXT: srli a4, a0, 30
; RV32-NEXT: srli a1, a1, 28
; RV32-NEXT: or a3, a4, a3
; RV32-NEXT: lui a4, 233017
; RV32-NEXT: addi a2, a2, -1
; RV32-NEXT: and a0, a0, a2
; RV32-NEXT: and a2, a3, a2
; RV32-NEXT: add a0, a0, a2
; RV32-NEXT: add a0, a0, a1
; RV32-NEXT: addi a1, a4, -455
; RV32-NEXT: mulhu a1, a0, a1
; RV32-NEXT: srli a1, a1, 1
; RV32-NEXT: slli a2, a1, 3
; RV32-NEXT: add a1, a2, a1
; RV32-NEXT: sub a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_9:
; RV64: # %bb.0:
; RV64-NEXT: li a2, -1
; RV64-NEXT: slli a3, a1, 4
; RV64-NEXT: srli a4, a0, 60
; RV64-NEXT: or a3, a4, a3
; RV64-NEXT: lui a4, %hi(.LCPI3_0)
; RV64-NEXT: srli a2, a2, 4
; RV64-NEXT: ld a4, %lo(.LCPI3_0)(a4)
; RV64-NEXT: and a0, a0, a2
; RV64-NEXT: and a2, a3, a2
; RV64-NEXT: add a0, a0, a2
; RV64-NEXT: srli a1, a1, 56
; RV64-NEXT: add a0, a0, a1
; RV64-NEXT: mulhu a1, a0, a4
; RV64-NEXT: slli a2, a1, 3
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: sub a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 9
ret iXLen2 %a
}
define iXLen2 @test_urem_15(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_15:
; RV32: # %bb.0:
; RV32-NEXT: add a1, a0, a1
; RV32-NEXT: lui a2, 559241
; RV32-NEXT: sltu a0, a1, a0
; RV32-NEXT: add a0, a1, a0
; RV32-NEXT: addi a1, a2, -1911
; RV32-NEXT: mulhu a1, a0, a1
; RV32-NEXT: srli a1, a1, 3
; RV32-NEXT: slli a2, a1, 4
; RV32-NEXT: sub a1, a1, a2
; RV32-NEXT: add a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_15:
; RV64: # %bb.0:
; RV64-NEXT: add a1, a0, a1
; RV64-NEXT: lui a2, 559241
; RV64-NEXT: sltu a0, a1, a0
; RV64-NEXT: addi a2, a2, -1911
; RV64-NEXT: add a0, a1, a0
; RV64-NEXT: slli a1, a2, 32
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: mulhu a1, a0, a1
; RV64-NEXT: srli a1, a1, 3
; RV64-NEXT: slli a2, a1, 4
; RV64-NEXT: sub a1, a1, a2
; RV64-NEXT: add a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 15
ret iXLen2 %a
}
define iXLen2 @test_urem_17(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_17:
; RV32: # %bb.0:
; RV32-NEXT: add a1, a0, a1
; RV32-NEXT: lui a2, 986895
; RV32-NEXT: sltu a0, a1, a0
; RV32-NEXT: addi a2, a2, 241
; RV32-NEXT: add a0, a1, a0
; RV32-NEXT: mulhu a1, a0, a2
; RV32-NEXT: srli a2, a1, 4
; RV32-NEXT: andi a1, a1, -16
; RV32-NEXT: add a1, a1, a2
; RV32-NEXT: sub a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_17:
; RV64: # %bb.0:
; RV64-NEXT: add a1, a0, a1
; RV64-NEXT: lui a2, 986895
; RV64-NEXT: sltu a0, a1, a0
; RV64-NEXT: addi a2, a2, 241
; RV64-NEXT: add a0, a1, a0
; RV64-NEXT: slli a1, a2, 32
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: mulhu a1, a0, a1
; RV64-NEXT: srli a2, a1, 4
; RV64-NEXT: andi a1, a1, -16
; RV64-NEXT: add a1, a1, a2
; RV64-NEXT: sub a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 17
ret iXLen2 %a
}
define iXLen2 @test_urem_255(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_255:
; RV32: # %bb.0:
; RV32-NEXT: add a1, a0, a1
; RV32-NEXT: lui a2, 526344
; RV32-NEXT: sltu a0, a1, a0
; RV32-NEXT: add a0, a1, a0
; RV32-NEXT: addi a1, a2, 129
; RV32-NEXT: mulhu a1, a0, a1
; RV32-NEXT: srli a1, a1, 7
; RV32-NEXT: slli a2, a1, 8
; RV32-NEXT: sub a1, a1, a2
; RV32-NEXT: add a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_255:
; RV64: # %bb.0:
; RV64-NEXT: add a1, a0, a1
; RV64-NEXT: lui a2, 526344
; RV64-NEXT: sltu a0, a1, a0
; RV64-NEXT: addi a2, a2, 129
; RV64-NEXT: add a0, a1, a0
; RV64-NEXT: slli a1, a2, 32
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: mulhu a1, a0, a1
; RV64-NEXT: srli a1, a1, 7
; RV64-NEXT: slli a2, a1, 8
; RV64-NEXT: sub a1, a1, a2
; RV64-NEXT: add a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 255
ret iXLen2 %a
}
define iXLen2 @test_urem_257(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_257:
; RV32: # %bb.0:
; RV32-NEXT: add a1, a0, a1
; RV32-NEXT: lui a2, 1044496
; RV32-NEXT: sltu a0, a1, a0
; RV32-NEXT: addi a2, a2, -255
; RV32-NEXT: add a0, a1, a0
; RV32-NEXT: mulhu a1, a0, a2
; RV32-NEXT: srli a2, a1, 8
; RV32-NEXT: andi a1, a1, -256
; RV32-NEXT: add a1, a1, a2
; RV32-NEXT: sub a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_257:
; RV64: # %bb.0:
; RV64-NEXT: add a1, a0, a1
; RV64-NEXT: lui a2, 1044496
; RV64-NEXT: sltu a0, a1, a0
; RV64-NEXT: addi a2, a2, -255
; RV64-NEXT: add a0, a1, a0
; RV64-NEXT: slli a1, a2, 32
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: mulhu a1, a0, a1
; RV64-NEXT: srli a2, a1, 8
; RV64-NEXT: andi a1, a1, -256
; RV64-NEXT: add a1, a1, a2
; RV64-NEXT: sub a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 257
ret iXLen2 %a
}
define iXLen2 @test_urem_65535(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_65535:
; RV32: # %bb.0:
; RV32-NEXT: add a1, a0, a1
; RV32-NEXT: lui a2, 524296
; RV32-NEXT: sltu a0, a1, a0
; RV32-NEXT: add a0, a1, a0
; RV32-NEXT: addi a2, a2, 1
; RV32-NEXT: mulhu a1, a0, a2
; RV32-NEXT: srli a1, a1, 15
; RV32-NEXT: slli a2, a1, 16
; RV32-NEXT: sub a1, a1, a2
; RV32-NEXT: add a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_65535:
; RV64: # %bb.0:
; RV64-NEXT: add a1, a0, a1
; RV64-NEXT: lui a2, 524296
; RV64-NEXT: sltu a0, a1, a0
; RV64-NEXT: addi a2, a2, 1
; RV64-NEXT: add a0, a1, a0
; RV64-NEXT: slli a1, a2, 32
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: mulhu a1, a0, a1
; RV64-NEXT: srli a1, a1, 15
; RV64-NEXT: slli a2, a1, 16
; RV64-NEXT: sub a1, a1, a2
; RV64-NEXT: add a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 65535
ret iXLen2 %a
}
define iXLen2 @test_urem_65537(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_65537:
; RV32: # %bb.0:
; RV32-NEXT: add a1, a0, a1
; RV32-NEXT: lui a2, 1048560
; RV32-NEXT: sltu a0, a1, a0
; RV32-NEXT: add a0, a1, a0
; RV32-NEXT: addi a1, a2, 1
; RV32-NEXT: mulhu a1, a0, a1
; RV32-NEXT: and a2, a1, a2
; RV32-NEXT: srli a1, a1, 16
; RV32-NEXT: or a1, a2, a1
; RV32-NEXT: sub a0, a0, a1
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_65537:
; RV64: # %bb.0:
; RV64-NEXT: add a1, a0, a1
; RV64-NEXT: lui a2, 1048560
; RV64-NEXT: sltu a0, a1, a0
; RV64-NEXT: addi a3, a2, 1
; RV64-NEXT: add a0, a1, a0
; RV64-NEXT: slli a1, a3, 32
; RV64-NEXT: add a1, a3, a1
; RV64-NEXT: mulhu a1, a0, a1
; RV64-NEXT: and a2, a1, a2
; RV64-NEXT: srli a1, a1, 16
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: sub a0, a0, a1
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 65537
ret iXLen2 %a
}
define iXLen2 @test_urem_12(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_12:
; RV32: # %bb.0:
; RV32-NEXT: slli a2, a1, 30
; RV32-NEXT: srli a3, a0, 2
; RV32-NEXT: srli a1, a1, 2
; RV32-NEXT: or a2, a3, a2
; RV32-NEXT: lui a3, 699051
; RV32-NEXT: addi a3, a3, -1365
; RV32-NEXT: add a1, a2, a1
; RV32-NEXT: sltu a2, a1, a2
; RV32-NEXT: add a1, a1, a2
; RV32-NEXT: mulhu a2, a1, a3
; RV32-NEXT: srli a3, a2, 1
; RV32-NEXT: andi a2, a2, -2
; RV32-NEXT: add a2, a2, a3
; RV32-NEXT: sub a1, a1, a2
; RV32-NEXT: slli a1, a1, 2
; RV32-NEXT: andi a0, a0, 3
; RV32-NEXT: or a0, a1, a0
; RV32-NEXT: li a1, 0
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_12:
; RV64: # %bb.0:
; RV64-NEXT: slli a2, a1, 62
; RV64-NEXT: srli a3, a0, 2
; RV64-NEXT: lui a4, 699051
; RV64-NEXT: or a2, a3, a2
; RV64-NEXT: addi a3, a4, -1365
; RV64-NEXT: slli a4, a3, 32
; RV64-NEXT: add a3, a3, a4
; RV64-NEXT: srli a1, a1, 2
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: sltu a2, a1, a2
; RV64-NEXT: add a1, a1, a2
; RV64-NEXT: mulhu a2, a1, a3
; RV64-NEXT: srli a3, a2, 1
; RV64-NEXT: andi a2, a2, -2
; RV64-NEXT: add a2, a2, a3
; RV64-NEXT: sub a1, a1, a2
; RV64-NEXT: slli a1, a1, 2
; RV64-NEXT: andi a0, a0, 3
; RV64-NEXT: or a0, a1, a0
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, 12
ret iXLen2 %a
}
; Divisor: 7 * 2^30 (has 30 trailing zeros, < HBitWidth for RV32 and RV64)
define iXLen2 @test_urem_7_shl_30(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_7_shl_30:
; RV32: # %bb.0:
; RV32-NEXT: slli a2, a1, 2
; RV32-NEXT: srli a3, a0, 30
; RV32-NEXT: lui a4, 262144
; RV32-NEXT: srli a1, a1, 28
; RV32-NEXT: or a2, a3, a2
; RV32-NEXT: lui a3, 599186
; RV32-NEXT: addi a4, a4, -1
; RV32-NEXT: addi a3, a3, 1171
; RV32-NEXT: and a2, a2, a4
; RV32-NEXT: and a0, a0, a4
; RV32-NEXT: add a1, a2, a1
; RV32-NEXT: mulhu a2, a1, a3
; RV32-NEXT: srli a2, a2, 2
; RV32-NEXT: slli a3, a2, 3
; RV32-NEXT: sub a2, a2, a3
; RV32-NEXT: add a1, a1, a2
; RV32-NEXT: slli a2, a1, 30
; RV32-NEXT: or a0, a2, a0
; RV32-NEXT: srli a1, a1, 2
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_7_shl_30:
; RV64: # %bb.0:
; RV64-NEXT: slli a2, a1, 34
; RV64-NEXT: srli a3, a0, 30
; RV64-NEXT: srli a1, a1, 26
; RV64-NEXT: or a2, a3, a2
; RV64-NEXT: lui a3, %hi(.LCPI11_0)
; RV64-NEXT: slli a0, a0, 34
; RV64-NEXT: ld a3, %lo(.LCPI11_0)(a3)
; RV64-NEXT: slli a2, a2, 4
; RV64-NEXT: srli a2, a2, 4
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: mulhu a2, a1, a3
; RV64-NEXT: slli a3, a2, 3
; RV64-NEXT: sub a2, a2, a3
; RV64-NEXT: add a1, a1, a2
; RV64-NEXT: slli a1, a1, 30
; RV64-NEXT: srli a0, a0, 34
; RV64-NEXT: or a0, a1, a0
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, u0x1C0000000
ret iXLen2 %a
}
; Divisor: 3 * 2^32 (has 32 trailing zeros, exactly HBitWidth for RV32)
define iXLen2 @test_urem_3_shl_32(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_3_shl_32:
; RV32: # %bb.0:
; RV32-NEXT: lui a2, 699051
; RV32-NEXT: addi a2, a2, -1365
; RV32-NEXT: mulhu a2, a1, a2
; RV32-NEXT: srli a3, a2, 1
; RV32-NEXT: andi a2, a2, -2
; RV32-NEXT: add a2, a2, a3
; RV32-NEXT: sub a1, a1, a2
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_3_shl_32:
; RV64: # %bb.0:
; RV64-NEXT: slli a2, a1, 32
; RV64-NEXT: srli a3, a0, 32
; RV64-NEXT: lui a4, 699051
; RV64-NEXT: or a2, a3, a2
; RV64-NEXT: addi a3, a4, -1365
; RV64-NEXT: slli a4, a3, 32
; RV64-NEXT: add a3, a3, a4
; RV64-NEXT: srli a1, a1, 32
; RV64-NEXT: slli a0, a0, 32
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: sltu a2, a1, a2
; RV64-NEXT: add a1, a1, a2
; RV64-NEXT: mulhu a2, a1, a3
; RV64-NEXT: srli a3, a2, 1
; RV64-NEXT: andi a2, a2, -2
; RV64-NEXT: add a2, a2, a3
; RV64-NEXT: sub a1, a1, a2
; RV64-NEXT: slli a1, a1, 32
; RV64-NEXT: srli a0, a0, 32
; RV64-NEXT: or a0, a1, a0
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, u0x300000000
ret iXLen2 %a
}
; Divisor: 7 * 2^60 (has 60 trailing zeros, > HBitWidth for RV32)
define iXLen2 @test_urem_7_shl_60(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_7_shl_60:
; RV32: # %bb.0:
; RV32-NEXT: srli a2, a1, 28
; RV32-NEXT: lui a3, 149797
; RV32-NEXT: slli a1, a1, 4
; RV32-NEXT: addi a3, a3, -1755
; RV32-NEXT: mulhu a3, a2, a3
; RV32-NEXT: slli a4, a3, 3
; RV32-NEXT: add a2, a2, a3
; RV32-NEXT: sub a2, a2, a4
; RV32-NEXT: slli a2, a2, 28
; RV32-NEXT: srli a1, a1, 4
; RV32-NEXT: or a1, a2, a1
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_7_shl_60:
; RV64: # %bb.0:
; RV64-NEXT: slli a2, a1, 4
; RV64-NEXT: srli a3, a0, 60
; RV64-NEXT: li a4, -1
; RV64-NEXT: srli a1, a1, 56
; RV64-NEXT: or a2, a3, a2
; RV64-NEXT: lui a3, %hi(.LCPI13_0)
; RV64-NEXT: ld a3, %lo(.LCPI13_0)(a3)
; RV64-NEXT: srli a4, a4, 4
; RV64-NEXT: and a2, a2, a4
; RV64-NEXT: add a1, a2, a1
; RV64-NEXT: mulhu a2, a1, a3
; RV64-NEXT: slli a3, a2, 3
; RV64-NEXT: add a1, a1, a2
; RV64-NEXT: sub a1, a1, a3
; RV64-NEXT: slli a1, a1, 60
; RV64-NEXT: and a0, a0, a4
; RV64-NEXT: or a0, a1, a0
; RV64-NEXT: li a1, 0
; RV64-NEXT: ret
%a = urem iXLen2 %x, u0x7000000000000000
ret iXLen2 %a
}
; Divisor: 37 * 2^XLen (has XLen trailing zeros)
define iXLen2 @test_urem_37_shl_XL(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_37_shl_XL:
; RV32: # %bb.0:
; RV32-NEXT: srli a2, a1, 18
; RV32-NEXT: slli a1, a1, 14
; RV32-NEXT: lui a3, 64
; RV32-NEXT: srli a1, a1, 14
; RV32-NEXT: sub a1, a1, a2
; RV32-NEXT: lui a2, 765177
; RV32-NEXT: addi a3, a3, 1
; RV32-NEXT: addi a2, a2, 333
; RV32-NEXT: add a1, a1, a3
; RV32-NEXT: mulhu a2, a1, a2
; RV32-NEXT: sub a3, a1, a2
; RV32-NEXT: srli a3, a3, 1
; RV32-NEXT: add a2, a3, a2
; RV32-NEXT: srli a2, a2, 5
; RV32-NEXT: li a3, 37
; RV32-NEXT: mul a2, a2, a3
; RV32-NEXT: sub a1, a1, a2
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_37_shl_XL:
; RV64: # %bb.0:
; RV64-NEXT: srli a2, a1, 36
; RV64-NEXT: lui a3, %hi(.LCPI14_0)
; RV64-NEXT: ld a3, %lo(.LCPI14_0)(a3)
; RV64-NEXT: slli a1, a1, 28
; RV64-NEXT: srli a1, a1, 28
; RV64-NEXT: add a1, a1, a2
; RV64-NEXT: mulhu a2, a1, a3
; RV64-NEXT: li a3, 37
; RV64-NEXT: mul a2, a2, a3
; RV64-NEXT: sub a1, a1, a2
; RV64-NEXT: ret
%a = shl iXLen2 37, XLen
%b = urem iXLen2 %x, %a
ret iXLen2 %b
}
; Divisor: 3 * 2^(XLen+5) (has XLen+ trailing zeros)
define iXLen2 @test_urem_3_shl_XLplus5(iXLen2 %x) nounwind {
; RV32-LABEL: test_urem_3_shl_XLplus5:
; RV32: # %bb.0:
; RV32-NEXT: srli a2, a1, 5
; RV32-NEXT: lui a3, 349525
; RV32-NEXT: addi a3, a3, 1366
; RV32-NEXT: mulhu a3, a2, a3
; RV32-NEXT: slli a4, a3, 1
; RV32-NEXT: sub a2, a2, a3
; RV32-NEXT: sub a2, a2, a4
; RV32-NEXT: slli a2, a2, 5
; RV32-NEXT: andi a1, a1, 31
; RV32-NEXT: or a1, a2, a1
; RV32-NEXT: ret
;
; RV64-LABEL: test_urem_3_shl_XLplus5:
; RV64: # %bb.0:
; RV64-NEXT: lui a2, %hi(.LCPI15_0)
; RV64-NEXT: ld a2, %lo(.LCPI15_0)(a2)
; RV64-NEXT: srli a3, a1, 5
; RV64-NEXT: mulhu a2, a3, a2
; RV64-NEXT: slli a4, a2, 1
; RV64-NEXT: sub a3, a3, a2
; RV64-NEXT: sub a3, a3, a4
; RV64-NEXT: slli a3, a3, 5
; RV64-NEXT: andi a1, a1, 31
; RV64-NEXT: or a1, a3, a1
; RV64-NEXT: ret
%a = shl iXLen2 96, XLen
%b = urem iXLen2 %x, %a
ret iXLen2 %b
}