test/CodeGen/NVPTX/convert-fp-i8.ll - llvm-project/llvm - Git at Google

 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
 ; RUN: llc < %s -march=nvptx64 -mcpu=sm_70 | FileCheck %s
 ; RUN: llc < %s -march=nvptx64 -mcpu=sm_80 | FileCheck %s
 ; RUN: llc < %s -march=nvptx64 -mcpu=sm_90 | FileCheck %s

 define i8 @cvt_u8_f32(float %x) {
 ; CHECK-LABEL: cvt_u8_f32(
 ; CHECK:       {
 ; CHECK-NEXT:    .reg .b16 %rs<2>;
 ; CHECK-NEXT:    .reg .b32 %r<3>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
 ; CHECK-NEXT:    ld.param.b32 %r1, [cvt_u8_f32_param_0];
 ; CHECK-NEXT:    cvt.rzi.u16.f32 %rs1, %r1;
 ; CHECK-NEXT:    cvt.u32.u16 %r2, %rs1;
 ; CHECK-NEXT:    st.param.b32 [func_retval0], %r2;
 ; CHECK-NEXT:    ret;
   %a = fptoui float %x to i8
   ret i8 %a
 }

 define i8 @cvt_u8_f64(double %x) {
 ; CHECK-LABEL: cvt_u8_f64(
 ; CHECK:       {
 ; CHECK-NEXT:    .reg .b16 %rs<2>;
 ; CHECK-NEXT:    .reg .b32 %r<2>;
 ; CHECK-NEXT:    .reg .b64 %rd<2>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
 ; CHECK-NEXT:    ld.param.b64 %rd1, [cvt_u8_f64_param_0];
 ; CHECK-NEXT:    cvt.rzi.u16.f64 %rs1, %rd1;
 ; CHECK-NEXT:    cvt.u32.u16 %r1, %rs1;
 ; CHECK-NEXT:    st.param.b32 [func_retval0], %r1;
 ; CHECK-NEXT:    ret;
   %a = fptoui double %x to i8
   ret i8 %a
 }

 define float @cvt_f32_i8(i8 %x) {
 ; CHECK-LABEL: cvt_f32_i8(
 ; CHECK:       {
 ; CHECK-NEXT:    .reg .b16 %rs<2>;
 ; CHECK-NEXT:    .reg .b32 %r<2>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
 ; CHECK-NEXT:    ld.param.b8 %rs1, [cvt_f32_i8_param_0];
 ; CHECK-NEXT:    cvt.rn.f32.u16 %r1, %rs1;
 ; CHECK-NEXT:    st.param.b32 [func_retval0], %r1;
 ; CHECK-NEXT:    ret;
   %a = uitofp i8 %x to float
   ret float %a
 }

 define double @cvt_f64_i8(i8 %x) {
 ; CHECK-LABEL: cvt_f64_i8(
 ; CHECK:       {
 ; CHECK-NEXT:    .reg .b16 %rs<2>;
 ; CHECK-NEXT:    .reg .b64 %rd<2>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
 ; CHECK-NEXT:    ld.param.b8 %rs1, [cvt_f64_i8_param_0];
 ; CHECK-NEXT:    cvt.rn.f64.u16 %rd1, %rs1;
 ; CHECK-NEXT:    st.param.b64 [func_retval0], %rd1;
 ; CHECK-NEXT:    ret;
   %a = uitofp i8 %x to double
   ret double %a
 }

 define float @cvt_f32_s8(i8 %x) {
 ; CHECK-LABEL: cvt_f32_s8(
 ; CHECK:       {
 ; CHECK-NEXT:    .reg .b16 %rs<2>;
 ; CHECK-NEXT:    .reg .b32 %r<2>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
 ; CHECK-NEXT:    ld.param.s8 %rs1, [cvt_f32_s8_param_0];
 ; CHECK-NEXT:    cvt.rn.f32.s16 %r1, %rs1;
 ; CHECK-NEXT:    st.param.b32 [func_retval0], %r1;
 ; CHECK-NEXT:    ret;
   %a = sitofp i8 %x to float
   ret float %a
 }

 define double @cvt_f64_s8(i8 %x) {
 ; CHECK-LABEL: cvt_f64_s8(
 ; CHECK:       {
 ; CHECK-NEXT:    .reg .b16 %rs<2>;
 ; CHECK-NEXT:    .reg .b64 %rd<2>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
 ; CHECK-NEXT:    ld.param.s8 %rs1, [cvt_f64_s8_param_0];
 ; CHECK-NEXT:    cvt.rn.f64.s16 %rd1, %rs1;
 ; CHECK-NEXT:    st.param.b64 [func_retval0], %rd1;
 ; CHECK-NEXT:    ret;
   %a = sitofp i8 %x to double
   ret double %a
 }

 define i8 @cvt_s8_f32(float %x) {
 ; CHECK-LABEL: cvt_s8_f32(
 ; CHECK:       {
 ; CHECK-NEXT:    .reg .b16 %rs<2>;
 ; CHECK-NEXT:    .reg .b32 %r<4>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
 ; CHECK-NEXT:    ld.param.b32 %r1, [cvt_s8_f32_param_0];
 ; CHECK-NEXT:    cvt.rzi.s16.f32 %rs1, %r1;
 ; CHECK-NEXT:    cvt.u32.u16 %r2, %rs1;
 ; CHECK-NEXT:    and.b32 %r3, %r2, 255;
 ; CHECK-NEXT:    st.param.b32 [func_retval0], %r3;
 ; CHECK-NEXT:    ret;
   %a = fptosi float %x to i8
   ret i8 %a
 }

 define i8 @cvt_s8_f64(double %x) {
 ; CHECK-LABEL: cvt_s8_f64(
 ; CHECK:       {
 ; CHECK-NEXT:    .reg .b16 %rs<2>;
 ; CHECK-NEXT:    .reg .b32 %r<3>;
 ; CHECK-NEXT:    .reg .b64 %rd<2>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
 ; CHECK-NEXT:    ld.param.b64 %rd1, [cvt_s8_f64_param_0];
 ; CHECK-NEXT:    cvt.rzi.s16.f64 %rs1, %rd1;
 ; CHECK-NEXT:    cvt.u32.u16 %r1, %rs1;
 ; CHECK-NEXT:    and.b32 %r2, %r1, 255;
 ; CHECK-NEXT:    st.param.b32 [func_retval0], %r2;
 ; CHECK-NEXT:    ret;
   %a = fptosi double %x to i8
   ret i8 %a
 }
	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
	; RUN: llc < %s -march=nvptx64 -mcpu=sm_70 \| FileCheck %s
	; RUN: llc < %s -march=nvptx64 -mcpu=sm_80 \| FileCheck %s
	; RUN: llc < %s -march=nvptx64 -mcpu=sm_90 \| FileCheck %s

	define i8 @cvt_u8_f32(float %x) {
	; CHECK-LABEL: cvt_u8_f32(
	; CHECK: {
	; CHECK-NEXT: .reg .b16 %rs<2>;
	; CHECK-NEXT: .reg .b32 %r<3>;
	; CHECK-EMPTY:
	; CHECK-NEXT: // %bb.0:
	; CHECK-NEXT: ld.param.b32 %r1, [cvt_u8_f32_param_0];
	; CHECK-NEXT: cvt.rzi.u16.f32 %rs1, %r1;
	; CHECK-NEXT: cvt.u32.u16 %r2, %rs1;
	; CHECK-NEXT: st.param.b32 [func_retval0], %r2;
	; CHECK-NEXT: ret;
	%a = fptoui float %x to i8
	ret i8 %a
	}

	define i8 @cvt_u8_f64(double %x) {
	; CHECK-LABEL: cvt_u8_f64(
	; CHECK: {
	; CHECK-NEXT: .reg .b16 %rs<2>;
	; CHECK-NEXT: .reg .b32 %r<2>;
	; CHECK-NEXT: .reg .b64 %rd<2>;
	; CHECK-EMPTY:
	; CHECK-NEXT: // %bb.0:
	; CHECK-NEXT: ld.param.b64 %rd1, [cvt_u8_f64_param_0];
	; CHECK-NEXT: cvt.rzi.u16.f64 %rs1, %rd1;
	; CHECK-NEXT: cvt.u32.u16 %r1, %rs1;
	; CHECK-NEXT: st.param.b32 [func_retval0], %r1;
	; CHECK-NEXT: ret;
	%a = fptoui double %x to i8
	ret i8 %a
	}

	define float @cvt_f32_i8(i8 %x) {
	; CHECK-LABEL: cvt_f32_i8(
	; CHECK: {
	; CHECK-NEXT: .reg .b16 %rs<2>;
	; CHECK-NEXT: .reg .b32 %r<2>;
	; CHECK-EMPTY:
	; CHECK-NEXT: // %bb.0:
	; CHECK-NEXT: ld.param.b8 %rs1, [cvt_f32_i8_param_0];
	; CHECK-NEXT: cvt.rn.f32.u16 %r1, %rs1;
	; CHECK-NEXT: st.param.b32 [func_retval0], %r1;
	; CHECK-NEXT: ret;
	%a = uitofp i8 %x to float
	ret float %a
	}

	define double @cvt_f64_i8(i8 %x) {
	; CHECK-LABEL: cvt_f64_i8(
	; CHECK: {
	; CHECK-NEXT: .reg .b16 %rs<2>;
	; CHECK-NEXT: .reg .b64 %rd<2>;
	; CHECK-EMPTY:
	; CHECK-NEXT: // %bb.0:
	; CHECK-NEXT: ld.param.b8 %rs1, [cvt_f64_i8_param_0];
	; CHECK-NEXT: cvt.rn.f64.u16 %rd1, %rs1;
	; CHECK-NEXT: st.param.b64 [func_retval0], %rd1;
	; CHECK-NEXT: ret;
	%a = uitofp i8 %x to double
	ret double %a
	}

	define float @cvt_f32_s8(i8 %x) {
	; CHECK-LABEL: cvt_f32_s8(
	; CHECK: {
	; CHECK-NEXT: .reg .b16 %rs<2>;
	; CHECK-NEXT: .reg .b32 %r<2>;
	; CHECK-EMPTY:
	; CHECK-NEXT: // %bb.0:
	; CHECK-NEXT: ld.param.s8 %rs1, [cvt_f32_s8_param_0];
	; CHECK-NEXT: cvt.rn.f32.s16 %r1, %rs1;
	; CHECK-NEXT: st.param.b32 [func_retval0], %r1;
	; CHECK-NEXT: ret;
	%a = sitofp i8 %x to float
	ret float %a
	}

	define double @cvt_f64_s8(i8 %x) {
	; CHECK-LABEL: cvt_f64_s8(
	; CHECK: {
	; CHECK-NEXT: .reg .b16 %rs<2>;
	; CHECK-NEXT: .reg .b64 %rd<2>;
	; CHECK-EMPTY:
	; CHECK-NEXT: // %bb.0:
	; CHECK-NEXT: ld.param.s8 %rs1, [cvt_f64_s8_param_0];
	; CHECK-NEXT: cvt.rn.f64.s16 %rd1, %rs1;
	; CHECK-NEXT: st.param.b64 [func_retval0], %rd1;
	; CHECK-NEXT: ret;
	%a = sitofp i8 %x to double
	ret double %a
	}

	define i8 @cvt_s8_f32(float %x) {
	; CHECK-LABEL: cvt_s8_f32(
	; CHECK: {
	; CHECK-NEXT: .reg .b16 %rs<2>;
	; CHECK-NEXT: .reg .b32 %r<4>;
	; CHECK-EMPTY:
	; CHECK-NEXT: // %bb.0:
	; CHECK-NEXT: ld.param.b32 %r1, [cvt_s8_f32_param_0];
	; CHECK-NEXT: cvt.rzi.s16.f32 %rs1, %r1;
	; CHECK-NEXT: cvt.u32.u16 %r2, %rs1;
	; CHECK-NEXT: and.b32 %r3, %r2, 255;
	; CHECK-NEXT: st.param.b32 [func_retval0], %r3;
	; CHECK-NEXT: ret;
	%a = fptosi float %x to i8
	ret i8 %a
	}

	define i8 @cvt_s8_f64(double %x) {
	; CHECK-LABEL: cvt_s8_f64(
	; CHECK: {
	; CHECK-NEXT: .reg .b16 %rs<2>;
	; CHECK-NEXT: .reg .b32 %r<3>;
	; CHECK-NEXT: .reg .b64 %rd<2>;
	; CHECK-EMPTY:
	; CHECK-NEXT: // %bb.0:
	; CHECK-NEXT: ld.param.b64 %rd1, [cvt_s8_f64_param_0];
	; CHECK-NEXT: cvt.rzi.s16.f64 %rs1, %rd1;
	; CHECK-NEXT: cvt.u32.u16 %r1, %rs1;
	; CHECK-NEXT: and.b32 %r2, %r1, 255;
	; CHECK-NEXT: st.param.b32 [func_retval0], %r2;
	; CHECK-NEXT: ret;
	%a = fptosi double %x to i8
	ret i8 %a
	}