blob: b22007060c63a12fd47393083ece3d29f43a3420 [file] [log] [blame]
; Like frame-02.ll, but with long doubles rather than floats. Some of the
; cases are slightly different because we need to allocate pairs of FPRs.
;
; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
; This function should require all FPRs, but no other spill slots.
; We need to save and restore 8 of the 16 FPRs, so the frame size
; should be exactly 8 * 8 = 64. The CFA offset is 160
; (the caller-allocated part of the frame) + 64.
define void @f1(ptr %ptr) {
; CHECK-LABEL: f1:
; CHECK: aghi %r15, -64
; CHECK: .cfi_def_cfa_offset 224
; CHECK: std %f8, 56(%r15)
; CHECK: std %f9, 48(%r15)
; CHECK: std %f10, 40(%r15)
; CHECK: std %f11, 32(%r15)
; CHECK: std %f12, 24(%r15)
; CHECK: std %f13, 16(%r15)
; CHECK: std %f14, 8(%r15)
; CHECK: std %f15, 0(%r15)
; CHECK: .cfi_offset %f8, -168
; CHECK: .cfi_offset %f9, -176
; CHECK: .cfi_offset %f10, -184
; CHECK: .cfi_offset %f11, -192
; CHECK: .cfi_offset %f12, -200
; CHECK: .cfi_offset %f13, -208
; CHECK: .cfi_offset %f14, -216
; CHECK: .cfi_offset %f15, -224
; ...main function body...
; CHECK: ld %f8, 56(%r15)
; CHECK: ld %f9, 48(%r15)
; CHECK: ld %f10, 40(%r15)
; CHECK: ld %f11, 32(%r15)
; CHECK: ld %f12, 24(%r15)
; CHECK: ld %f13, 16(%r15)
; CHECK: ld %f14, 8(%r15)
; CHECK: ld %f15, 0(%r15)
; CHECK: aghi %r15, 64
; CHECK: br %r14
%l0 = load volatile fp128, ptr %ptr
%l1 = load volatile fp128, ptr %ptr
%l4 = load volatile fp128, ptr %ptr
%l5 = load volatile fp128, ptr %ptr
%l8 = load volatile fp128, ptr %ptr
%l9 = load volatile fp128, ptr %ptr
%l12 = load volatile fp128, ptr %ptr
%l13 = load volatile fp128, ptr %ptr
%add0 = fadd fp128 %l0, %l0
%add1 = fadd fp128 %l1, %add0
%add4 = fadd fp128 %l4, %add1
%add5 = fadd fp128 %l5, %add4
%add8 = fadd fp128 %l8, %add5
%add9 = fadd fp128 %l9, %add8
%add12 = fadd fp128 %l12, %add9
%add13 = fadd fp128 %l13, %add12
store volatile fp128 %add0, ptr %ptr
store volatile fp128 %add1, ptr %ptr
store volatile fp128 %add4, ptr %ptr
store volatile fp128 %add5, ptr %ptr
store volatile fp128 %add8, ptr %ptr
store volatile fp128 %add9, ptr %ptr
store volatile fp128 %add12, ptr %ptr
store volatile fp128 %add13, ptr %ptr
ret void
}
; Like f1, but requires one fewer FPR pair. We allocate in numerical order,
; so %f13+%f15 is the pair that gets dropped.
define void @f2(ptr %ptr) {
; CHECK-LABEL: f2:
; CHECK: aghi %r15, -48
; CHECK: .cfi_def_cfa_offset 208
; CHECK: std %f8, 40(%r15)
; CHECK: std %f9, 32(%r15)
; CHECK: std %f10, 24(%r15)
; CHECK: std %f11, 16(%r15)
; CHECK: std %f12, 8(%r15)
; CHECK: std %f14, 0(%r15)
; CHECK: .cfi_offset %f8, -168
; CHECK: .cfi_offset %f9, -176
; CHECK: .cfi_offset %f10, -184
; CHECK: .cfi_offset %f11, -192
; CHECK: .cfi_offset %f12, -200
; CHECK: .cfi_offset %f14, -208
; CHECK-NOT: %f13
; CHECK-NOT: %f15
; ...main function body...
; CHECK: ld %f8, 40(%r15)
; CHECK: ld %f9, 32(%r15)
; CHECK: ld %f10, 24(%r15)
; CHECK: ld %f11, 16(%r15)
; CHECK: ld %f12, 8(%r15)
; CHECK: ld %f14, 0(%r15)
; CHECK: aghi %r15, 48
; CHECK: br %r14
%l0 = load volatile fp128, ptr %ptr
%l1 = load volatile fp128, ptr %ptr
%l4 = load volatile fp128, ptr %ptr
%l5 = load volatile fp128, ptr %ptr
%l8 = load volatile fp128, ptr %ptr
%l9 = load volatile fp128, ptr %ptr
%l12 = load volatile fp128, ptr %ptr
%add0 = fadd fp128 %l0, %l0
%add1 = fadd fp128 %l1, %add0
%add4 = fadd fp128 %l4, %add1
%add5 = fadd fp128 %l5, %add4
%add8 = fadd fp128 %l8, %add5
%add9 = fadd fp128 %l9, %add8
%add12 = fadd fp128 %l12, %add9
store volatile fp128 %add0, ptr %ptr
store volatile fp128 %add1, ptr %ptr
store volatile fp128 %add4, ptr %ptr
store volatile fp128 %add5, ptr %ptr
store volatile fp128 %add8, ptr %ptr
store volatile fp128 %add9, ptr %ptr
store volatile fp128 %add12, ptr %ptr
ret void
}
; Like f1, but requires only one call-saved FPR pair. We allocate in
; numerical order so the pair should be %f8+%f10.
define void @f3(ptr %ptr) {
; CHECK-LABEL: f3:
; CHECK: aghi %r15, -16
; CHECK: .cfi_def_cfa_offset 176
; CHECK: std %f8, 8(%r15)
; CHECK: std %f10, 0(%r15)
; CHECK: .cfi_offset %f8, -168
; CHECK: .cfi_offset %f10, -176
; CHECK-NOT: %f9
; CHECK-NOT: %f11
; CHECK-NOT: %f12
; CHECK-NOT: %f13
; CHECK-NOT: %f14
; CHECK-NOT: %f15
; ...main function body...
; CHECK: ld %f8, 8(%r15)
; CHECK: ld %f10, 0(%r15)
; CHECK: aghi %r15, 16
; CHECK: br %r14
%l0 = load volatile fp128, ptr %ptr
%l1 = load volatile fp128, ptr %ptr
%l4 = load volatile fp128, ptr %ptr
%l5 = load volatile fp128, ptr %ptr
%l8 = load volatile fp128, ptr %ptr
%add0 = fadd fp128 %l0, %l0
%add1 = fadd fp128 %l1, %add0
%add4 = fadd fp128 %l4, %add1
%add5 = fadd fp128 %l5, %add4
%add8 = fadd fp128 %l8, %add5
store volatile fp128 %add0, ptr %ptr
store volatile fp128 %add1, ptr %ptr
store volatile fp128 %add4, ptr %ptr
store volatile fp128 %add5, ptr %ptr
store volatile fp128 %add8, ptr %ptr
ret void
}
; This function should use all call-clobbered FPRs but no call-saved ones.
; It shouldn't need to create a frame.
define void @f4(ptr %ptr) {
; CHECK-LABEL: f4:
; CHECK-NOT: %r15
; CHECK-NOT: %f8
; CHECK-NOT: %f9
; CHECK-NOT: %f10
; CHECK-NOT: %f11
; CHECK-NOT: %f12
; CHECK-NOT: %f13
; CHECK-NOT: %f14
; CHECK-NOT: %f15
; CHECK: br %r14
%l0 = load volatile fp128, ptr %ptr
%l1 = load volatile fp128, ptr %ptr
%l4 = load volatile fp128, ptr %ptr
%l5 = load volatile fp128, ptr %ptr
%add0 = fadd fp128 %l0, %l0
%add1 = fadd fp128 %l1, %add0
%add4 = fadd fp128 %l4, %add1
%add5 = fadd fp128 %l5, %add4
store volatile fp128 %add0, ptr %ptr
store volatile fp128 %add1, ptr %ptr
store volatile fp128 %add4, ptr %ptr
store volatile fp128 %add5, ptr %ptr
ret void
}