test/CodeGen/Hexagon/bfloat.ll - llvm-project/llvm - Git at Google

 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
 ; RUN: llc -mtriple=hexagon -hexagon-bit=false < %s | FileCheck %s

 define bfloat @load_scalar_bf(ptr %addr) {
 ; CHECK-LABEL: load_scalar_bf:
 ; CHECK:         .cfi_startproc
 ; CHECK-NEXT:  // %bb.0: // %entry
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[REG:r[0-9]+]] = memuh(r0+#0)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = aslh([[REG]])
 ; CHECK-NEXT:     jumpr r31
 ; CHECK-NEXT:    }

 entry:
   %0 = load bfloat, ptr %addr, align 2
   ret bfloat %0
 }

 define void @store_scalar_bf(bfloat %v, ptr %addr) {
 ; CHECK-LABEL: store_scalar_bf:
 ; CHECK:         .cfi_startproc
 ; CHECK-NEXT:  // %bb.0: // %entry
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R_A:r[0-9]+]] = ##131071
 ; CHECK-NEXT:     [[R_B:r[0-9]+]] = ##32768
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R_C:r[0-9]+]] = ##65535
 ; CHECK-NEXT:     [[R_D:r[0-9]+]] = asrh(r0)
 ; CHECK-NEXT:     [[R_A]] = and(r0,[[R_A]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[P0:p[0-9]+]] = sfclass(r0,#16)
 ; CHECK-NEXT:     [[R_E:r[0-9]+]] = and(r0,[[R_B]])
 ; CHECK-NEXT:     [[P1:p[0-9]+]] = cmp.eq([[R_A]],[[R_B]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = add(r0,[[R_E]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = asrh(r0)
 ; CHECK-NEXT:     if ([[P1]]) [[R_B]] = and([[R_D]],[[R_C]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     if (![[P1]]) [[R_B]] = and(r0,[[R_C]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     if ([[P0]]) [[R_B]] = ##32767
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     jumpr r31
 ; CHECK-NEXT:     memh(r1+#0) = [[R_B]]
 ; CHECK-NEXT:    }

 entry:
   store bfloat %v, ptr %addr, align 2
   ret void
 }

 define bfloat @sum(bfloat %a, bfloat %b) #0 {
 ; CHECK-LABEL: sum:
 ; CHECK:         .cfi_startproc
 ; CHECK-NEXT:  // %bb.0: // %entry
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R3:r[0-9]+]] = ##32768
 ; CHECK-NEXT:     [[R4:r[0-9]+]] = ##131071
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R2:r[0-9]+]] = ##65535
 ; CHECK-NEXT:     [[R6:r[0-9]+]] = and(r0,[[R3]])
 ; CHECK-NEXT:     [[R5:r[0-9]+]] = and(r0,[[R4]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R8:r[0-9]+]] = and(r1,[[R3]])
 ; CHECK-NEXT:     [[R7:r[0-9]+]] = and(r1,[[R4]])
 ; CHECK-NEXT:     [[R6]] = add(r0,[[R6]])
 ; CHECK-NEXT:     [[P0:p[0-9]+]] = cmp.eq([[R5]],[[R3]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R5]] = asrh(r0)
 ; CHECK-NEXT:     [[P1:p[0-9]+]] = cmp.eq([[R7]],[[R3]])
 ; CHECK-NEXT:     [[R7]] = asrh(r1)
 ; CHECK-NEXT:     [[R8]] = add(r1,[[R8]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R6]] = asrh([[R6]])
 ; CHECK-NEXT:     if ([[P0]]) [[R5]] = and([[R5]],[[R2]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[P0]] = sfclass(r0,#16)
 ; CHECK-NEXT:     if (![[P0]]) [[R5]] = and([[R6]],[[R2]])
 ; CHECK-NEXT:     [[R6]] = asrh([[R8]])
 ; CHECK-NEXT:     if ([[P1]]) [[R7]] = and([[R7]],[[R2]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[P1]] = sfclass(r1,#16)
 ; CHECK-NEXT:     [[R0:r[0-9]+]] = #32767
 ; CHECK-NEXT:     if (![[P1]]) [[R7]] = and([[R6]],[[R2]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     if ([[P0]]) [[R5]] = add([[R0]],#0)
 ; CHECK-NEXT:     if ([[P1]]) [[R7]] = add([[R0]],#0)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R6]] = aslh([[R7]])
 ; CHECK-NEXT:     [[R5]] = aslh([[R5]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R1:r[0-9]+]] = sfadd([[R5]],[[R6]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R5]] = and([[R1]],[[R3]])
 ; CHECK-NEXT:     [[R4]] = and([[R1]],[[R4]])
 ; CHECK-NEXT:     [[R6]] = asrh([[R1]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[P0]] = cmp.eq([[R4]],[[R3]])
 ; CHECK-NEXT:     [[R5]] = add([[R1]],[[R5]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R3]] = asrh([[R5]])
 ; CHECK-NEXT:     if ([[P0]]) [[R4]] = and([[R6]],[[R2]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[P0]] = sfclass([[R1]],#16)
 ; CHECK-NEXT:     if (![[P0]]) [[R4]] = and([[R3]],[[R2]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     if ([[P0]]) [[R4]] = add([[R0]],#0)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = aslh([[R4]])
 ; CHECK-NEXT:     jumpr r31
 ; CHECK-NEXT:    }

 entry:
   %add = fadd bfloat %a, %b
   ret bfloat %add
 }

 ; Function Attrs: noinline nounwind optnone
 define dso_local i32 @double_bf16(bfloat %a, bfloat %b) #0 {
 ; CHECK-LABEL: double_bf16:
 ; CHECK:         .cfi_startproc
 ; CHECK-NEXT:  // %bb.0: // %entry
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[PAIR_A:r[0-9]+:[0-9]+]] = convert_sf2df(r0)
 ; CHECK-NEXT:     [[PAIR_B:r[0-9]+:[0-9]+]] = convert_sf2df(r1)
 ; CHECK-NEXT:     [[SP:r[0-9]+]] = add([[SP]],#-16)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[RESULT:r[0-9]+:[0-9]+]] = dfadd([[PAIR_A]],[[PAIR_B]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     memd([[SP]]+#8) = [[RESULT]]
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[TMP:r[0-9]+]] = convert_df2sf([[RESULT]])
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[TMP1:r[0-9]+]] = lsr([[TMP]],#16)
 ; CHECK-NEXT:     [[R0:r[0-9]+]] = and([[TMP]],##-65536)
 ; CHECK-NEXT:     memh([[SP]]+#6) = [[TMP1]].new
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     [[R0]] = convert_sf2w([[R0]]):chop
 ; CHECK-NEXT:     jumpr r31
 ; CHECK-NEXT:     [[SP]] = add([[SP]],#16)
 ; CHECK-NEXT:    }

 entry:
   %c = alloca double, align 8
   %d = alloca bfloat, align 2
   %conv = fpext bfloat %a to double
   %conv1 = fpext bfloat %b to double
   %add = fadd double %conv, %conv1
   store double %add, ptr %c, align 8
   %2 = load double, ptr %c, align 8
   %conv2 = fptrunc double %2 to bfloat
   store bfloat %conv2, ptr %d, align 2
   %3 = load bfloat, ptr %d, align 2
   %conv3 = fptosi bfloat %3 to i32
   ret i32 %conv3
 }
	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=hexagon -hexagon-bit=false < %s \| FileCheck %s

	define bfloat @load_scalar_bf(ptr %addr) {
	; CHECK-LABEL: load_scalar_bf:
	; CHECK: .cfi_startproc
	; CHECK-NEXT: // %bb.0: // %entry
	; CHECK-NEXT: {
	; CHECK-NEXT: [[REG:r[0-9]+]] = memuh(r0+#0)
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: r0 = aslh([[REG]])
	; CHECK-NEXT: jumpr r31
	; CHECK-NEXT: }

	entry:
	%0 = load bfloat, ptr %addr, align 2
	ret bfloat %0
	}

	define void @store_scalar_bf(bfloat %v, ptr %addr) {
	; CHECK-LABEL: store_scalar_bf:
	; CHECK: .cfi_startproc
	; CHECK-NEXT: // %bb.0: // %entry
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R_A:r[0-9]+]] = ##131071
	; CHECK-NEXT: [[R_B:r[0-9]+]] = ##32768
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R_C:r[0-9]+]] = ##65535
	; CHECK-NEXT: [[R_D:r[0-9]+]] = asrh(r0)
	; CHECK-NEXT: [[R_A]] = and(r0,[[R_A]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[P0:p[0-9]+]] = sfclass(r0,#16)
	; CHECK-NEXT: [[R_E:r[0-9]+]] = and(r0,[[R_B]])
	; CHECK-NEXT: [[P1:p[0-9]+]] = cmp.eq([[R_A]],[[R_B]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: r0 = add(r0,[[R_E]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: r0 = asrh(r0)
	; CHECK-NEXT: if ([[P1]]) [[R_B]] = and([[R_D]],[[R_C]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: if (![[P1]]) [[R_B]] = and(r0,[[R_C]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: if ([[P0]]) [[R_B]] = ##32767
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: jumpr r31
	; CHECK-NEXT: memh(r1+#0) = [[R_B]]
	; CHECK-NEXT: }

	entry:
	store bfloat %v, ptr %addr, align 2
	ret void
	}

	define bfloat @sum(bfloat %a, bfloat %b) #0 {
	; CHECK-LABEL: sum:
	; CHECK: .cfi_startproc
	; CHECK-NEXT: // %bb.0: // %entry
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R3:r[0-9]+]] = ##32768
	; CHECK-NEXT: [[R4:r[0-9]+]] = ##131071
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R2:r[0-9]+]] = ##65535
	; CHECK-NEXT: [[R6:r[0-9]+]] = and(r0,[[R3]])
	; CHECK-NEXT: [[R5:r[0-9]+]] = and(r0,[[R4]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R8:r[0-9]+]] = and(r1,[[R3]])
	; CHECK-NEXT: [[R7:r[0-9]+]] = and(r1,[[R4]])
	; CHECK-NEXT: [[R6]] = add(r0,[[R6]])
	; CHECK-NEXT: [[P0:p[0-9]+]] = cmp.eq([[R5]],[[R3]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R5]] = asrh(r0)
	; CHECK-NEXT: [[P1:p[0-9]+]] = cmp.eq([[R7]],[[R3]])
	; CHECK-NEXT: [[R7]] = asrh(r1)
	; CHECK-NEXT: [[R8]] = add(r1,[[R8]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R6]] = asrh([[R6]])
	; CHECK-NEXT: if ([[P0]]) [[R5]] = and([[R5]],[[R2]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[P0]] = sfclass(r0,#16)
	; CHECK-NEXT: if (![[P0]]) [[R5]] = and([[R6]],[[R2]])
	; CHECK-NEXT: [[R6]] = asrh([[R8]])
	; CHECK-NEXT: if ([[P1]]) [[R7]] = and([[R7]],[[R2]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[P1]] = sfclass(r1,#16)
	; CHECK-NEXT: [[R0:r[0-9]+]] = #32767
	; CHECK-NEXT: if (![[P1]]) [[R7]] = and([[R6]],[[R2]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: if ([[P0]]) [[R5]] = add([[R0]],#0)
	; CHECK-NEXT: if ([[P1]]) [[R7]] = add([[R0]],#0)
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R6]] = aslh([[R7]])
	; CHECK-NEXT: [[R5]] = aslh([[R5]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R1:r[0-9]+]] = sfadd([[R5]],[[R6]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R5]] = and([[R1]],[[R3]])
	; CHECK-NEXT: [[R4]] = and([[R1]],[[R4]])
	; CHECK-NEXT: [[R6]] = asrh([[R1]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[P0]] = cmp.eq([[R4]],[[R3]])
	; CHECK-NEXT: [[R5]] = add([[R1]],[[R5]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R3]] = asrh([[R5]])
	; CHECK-NEXT: if ([[P0]]) [[R4]] = and([[R6]],[[R2]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[P0]] = sfclass([[R1]],#16)
	; CHECK-NEXT: if (![[P0]]) [[R4]] = and([[R3]],[[R2]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: if ([[P0]]) [[R4]] = add([[R0]],#0)
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: r0 = aslh([[R4]])
	; CHECK-NEXT: jumpr r31
	; CHECK-NEXT: }

	entry:
	%add = fadd bfloat %a, %b
	ret bfloat %add
	}

	; Function Attrs: noinline nounwind optnone
	define dso_local i32 @double_bf16(bfloat %a, bfloat %b) #0 {
	; CHECK-LABEL: double_bf16:
	; CHECK: .cfi_startproc
	; CHECK-NEXT: // %bb.0: // %entry
	; CHECK-NEXT: {
	; CHECK-NEXT: [[PAIR_A:r[0-9]+:[0-9]+]] = convert_sf2df(r0)
	; CHECK-NEXT: [[PAIR_B:r[0-9]+:[0-9]+]] = convert_sf2df(r1)
	; CHECK-NEXT: [[SP:r[0-9]+]] = add([[SP]],#-16)
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[RESULT:r[0-9]+:[0-9]+]] = dfadd([[PAIR_A]],[[PAIR_B]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: memd([[SP]]+#8) = [[RESULT]]
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[TMP:r[0-9]+]] = convert_df2sf([[RESULT]])
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[TMP1:r[0-9]+]] = lsr([[TMP]],#16)
	; CHECK-NEXT: [[R0:r[0-9]+]] = and([[TMP]],##-65536)
	; CHECK-NEXT: memh([[SP]]+#6) = [[TMP1]].new
	; CHECK-NEXT: }
	; CHECK-NEXT: {
	; CHECK-NEXT: [[R0]] = convert_sf2w([[R0]]):chop
	; CHECK-NEXT: jumpr r31
	; CHECK-NEXT: [[SP]] = add([[SP]],#16)
	; CHECK-NEXT: }

	entry:
	%c = alloca double, align 8
	%d = alloca bfloat, align 2
	%conv = fpext bfloat %a to double
	%conv1 = fpext bfloat %b to double
	%add = fadd double %conv, %conv1
	store double %add, ptr %c, align 8
	%2 = load double, ptr %c, align 8
	%conv2 = fptrunc double %2 to bfloat
	store bfloat %conv2, ptr %d, align 2
	%3 = load bfloat, ptr %d, align 2
	%conv3 = fptosi bfloat %3 to i32
	ret i32 %conv3
	}