llvm/test/CodeGen/X86/combine-movmsk.ll - llvm-project - Git at Google

 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 | FileCheck %s --check-prefixes=SSE,SSE2
 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42
 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx | FileCheck %s --check-prefix=AVX
 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 | FileCheck %s --check-prefix=AVX

 declare i32 @llvm.x86.sse.movmsk.ps(<4 x float>)
 declare i32 @llvm.x86.sse2.movmsk.pd(<2 x double>)
 declare i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8>)

 ; Use widest possible vector for movmsk comparisons (PR37087)

 define i1 @movmskps_noneof_bitcast_v2f64(<2 x double> %a0) {
 ; SSE-LABEL: movmskps_noneof_bitcast_v2f64:
 ; SSE:       # %bb.0:
 ; SSE-NEXT:    xorpd %xmm1, %xmm1
 ; SSE-NEXT:    cmpeqpd %xmm0, %xmm1
 ; SSE-NEXT:    movmskpd %xmm1, %eax
 ; SSE-NEXT:    testl %eax, %eax
 ; SSE-NEXT:    sete %al
 ; SSE-NEXT:    retq
 ;
 ; AVX-LABEL: movmskps_noneof_bitcast_v2f64:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vxorpd %xmm1, %xmm1, %xmm1
 ; AVX-NEXT:    vcmpeqpd %xmm0, %xmm1, %xmm0
 ; AVX-NEXT:    vmovmskpd %xmm0, %eax
 ; AVX-NEXT:    testl %eax, %eax
 ; AVX-NEXT:    sete %al
 ; AVX-NEXT:    retq
   %1 = fcmp oeq <2 x double> zeroinitializer, %a0
   %2 = sext <2 x i1> %1 to <2 x i64>
   %3 = bitcast <2 x i64> %2 to <4 x float>
   %4 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %3)
   %5 = icmp eq i32 %4, 0
   ret i1 %5
 }

 define i1 @movmskps_allof_bitcast_v2f64(<2 x double> %a0) {
 ; SSE-LABEL: movmskps_allof_bitcast_v2f64:
 ; SSE:       # %bb.0:
 ; SSE-NEXT:    xorpd %xmm1, %xmm1
 ; SSE-NEXT:    cmpeqpd %xmm0, %xmm1
 ; SSE-NEXT:    movmskpd %xmm1, %eax
 ; SSE-NEXT:    cmpl $3, %eax
 ; SSE-NEXT:    sete %al
 ; SSE-NEXT:    retq
 ;
 ; AVX-LABEL: movmskps_allof_bitcast_v2f64:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vxorpd %xmm1, %xmm1, %xmm1
 ; AVX-NEXT:    vcmpeqpd %xmm0, %xmm1, %xmm0
 ; AVX-NEXT:    vmovmskpd %xmm0, %eax
 ; AVX-NEXT:    cmpl $3, %eax
 ; AVX-NEXT:    sete %al
 ; AVX-NEXT:    retq
   %1 = fcmp oeq <2 x double> zeroinitializer, %a0
   %2 = sext <2 x i1> %1 to <2 x i64>
   %3 = bitcast <2 x i64> %2 to <4 x float>
   %4 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %3)
   %5 = icmp eq i32 %4, 15
   ret i1 %5
 }

 define i1 @pmovmskb_noneof_bitcast_v2i64(<2 x i64> %a0) {
 ; SSE2-LABEL: pmovmskb_noneof_bitcast_v2i64:
 ; SSE2:       # %bb.0:
 ; SSE2-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
 ; SSE2-NEXT:    movmskps %xmm0, %eax
 ; SSE2-NEXT:    testl %eax, %eax
 ; SSE2-NEXT:    sete %al
 ; SSE2-NEXT:    retq
 ;
 ; SSE42-LABEL: pmovmskb_noneof_bitcast_v2i64:
 ; SSE42:       # %bb.0:
 ; SSE42-NEXT:    movmskpd %xmm0, %eax
 ; SSE42-NEXT:    testl %eax, %eax
 ; SSE42-NEXT:    sete %al
 ; SSE42-NEXT:    retq
 ;
 ; AVX-LABEL: pmovmskb_noneof_bitcast_v2i64:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vmovmskpd %xmm0, %eax
 ; AVX-NEXT:    testl %eax, %eax
 ; AVX-NEXT:    sete %al
 ; AVX-NEXT:    retq
   %1 = icmp sgt <2 x i64> zeroinitializer, %a0
   %2 = sext <2 x i1> %1 to <2 x i64>
   %3 = bitcast <2 x i64> %2 to <16 x i8>
   %4 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %3)
   %5 = icmp eq i32 %4, 0
   ret i1 %5
 }

 define i1 @pmovmskb_allof_bitcast_v2i64(<2 x i64> %a0) {
 ; SSE2-LABEL: pmovmskb_allof_bitcast_v2i64:
 ; SSE2:       # %bb.0:
 ; SSE2-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
 ; SSE2-NEXT:    movmskps %xmm0, %eax
 ; SSE2-NEXT:    cmpl $15, %eax
 ; SSE2-NEXT:    sete %al
 ; SSE2-NEXT:    retq
 ;
 ; SSE42-LABEL: pmovmskb_allof_bitcast_v2i64:
 ; SSE42:       # %bb.0:
 ; SSE42-NEXT:    movmskpd %xmm0, %eax
 ; SSE42-NEXT:    cmpl $3, %eax
 ; SSE42-NEXT:    sete %al
 ; SSE42-NEXT:    retq
 ;
 ; AVX-LABEL: pmovmskb_allof_bitcast_v2i64:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vmovmskpd %xmm0, %eax
 ; AVX-NEXT:    cmpl $3, %eax
 ; AVX-NEXT:    sete %al
 ; AVX-NEXT:    retq
   %1 = icmp sgt <2 x i64> zeroinitializer, %a0
   %2 = sext <2 x i1> %1 to <2 x i64>
   %3 = bitcast <2 x i64> %2 to <16 x i8>
   %4 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %3)
   %5 = icmp eq i32 %4, 65535
   ret i1 %5
 }

 define i1 @pmovmskb_noneof_bitcast_v4f32(<4 x float> %a0) {
 ; SSE-LABEL: pmovmskb_noneof_bitcast_v4f32:
 ; SSE:       # %bb.0:
 ; SSE-NEXT:    xorps %xmm1, %xmm1
 ; SSE-NEXT:    cmpeqps %xmm0, %xmm1
 ; SSE-NEXT:    movmskps %xmm1, %eax
 ; SSE-NEXT:    testl %eax, %eax
 ; SSE-NEXT:    sete %al
 ; SSE-NEXT:    retq
 ;
 ; AVX-LABEL: pmovmskb_noneof_bitcast_v4f32:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vxorps %xmm1, %xmm1, %xmm1
 ; AVX-NEXT:    vcmpeqps %xmm1, %xmm0, %xmm0
 ; AVX-NEXT:    vmovmskps %xmm0, %eax
 ; AVX-NEXT:    testl %eax, %eax
 ; AVX-NEXT:    sete %al
 ; AVX-NEXT:    retq
   %1 = fcmp oeq <4 x float> %a0, zeroinitializer
   %2 = sext <4 x i1> %1 to <4 x i32>
   %3 = bitcast <4 x i32> %2 to <16 x i8>
   %4 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %3)
   %5 = icmp eq i32 %4, 0
   ret i1 %5
 }

 define i1 @pmovmskb_allof_bitcast_v4f32(<4 x float> %a0) {
 ; SSE-LABEL: pmovmskb_allof_bitcast_v4f32:
 ; SSE:       # %bb.0:
 ; SSE-NEXT:    xorps %xmm1, %xmm1
 ; SSE-NEXT:    cmpeqps %xmm0, %xmm1
 ; SSE-NEXT:    movmskps %xmm1, %eax
 ; SSE-NEXT:    cmpl $15, %eax
 ; SSE-NEXT:    sete %al
 ; SSE-NEXT:    retq
 ;
 ; AVX-LABEL: pmovmskb_allof_bitcast_v4f32:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vxorps %xmm1, %xmm1, %xmm1
 ; AVX-NEXT:    vcmpeqps %xmm1, %xmm0, %xmm0
 ; AVX-NEXT:    vmovmskps %xmm0, %eax
 ; AVX-NEXT:    cmpl $15, %eax
 ; AVX-NEXT:    sete %al
 ; AVX-NEXT:    retq
   %1 = fcmp oeq <4 x float> %a0, zeroinitializer
   %2 = sext <4 x i1> %1 to <4 x i32>
   %3 = bitcast <4 x i32> %2 to <16 x i8>
   %4 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %3)
   %5 = icmp eq i32 %4, 65535
   ret i1 %5
 }

 ; MOVMSK(ICMP_SGT(X,-1)) -> NOT(MOVMSK(X)))
 define i1 @movmskps_allof_v4i32_positive(<4 x i32> %a0) {
 ; SSE-LABEL: movmskps_allof_v4i32_positive:
 ; SSE:       # %bb.0:
 ; SSE-NEXT:    movmskps %xmm0, %eax
 ; SSE-NEXT:    xorl $15, %eax
 ; SSE-NEXT:    cmpl $15, %eax
 ; SSE-NEXT:    sete %al
 ; SSE-NEXT:    retq
 ;
 ; AVX-LABEL: movmskps_allof_v4i32_positive:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vmovmskps %xmm0, %eax
 ; AVX-NEXT:    xorl $15, %eax
 ; AVX-NEXT:    cmpl $15, %eax
 ; AVX-NEXT:    sete %al
 ; AVX-NEXT:    retq
   %1 = icmp sgt <4 x i32> %a0, <i32 -1, i32 -1, i32 -1, i32 -1>
   %2 = sext <4 x i1> %1 to <4 x i32>
   %3 = bitcast <4 x i32> %2 to <4 x float>
   %4 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %3)
   %5 = icmp eq i32 %4, 15
   ret i1 %5
 }

 define i1 @pmovmskb_noneof_v16i8_positive(<16 x i8> %a0) {
 ; SSE-LABEL: pmovmskb_noneof_v16i8_positive:
 ; SSE:       # %bb.0:
 ; SSE-NEXT:    pmovmskb %xmm0, %eax
 ; SSE-NEXT:    xorl $65535, %eax # imm = 0xFFFF
 ; SSE-NEXT:    sete %al
 ; SSE-NEXT:    retq
 ;
 ; AVX-LABEL: pmovmskb_noneof_v16i8_positive:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vpmovmskb %xmm0, %eax
 ; AVX-NEXT:    xorl $65535, %eax # imm = 0xFFFF
 ; AVX-NEXT:    sete %al
 ; AVX-NEXT:    retq
   %1 = icmp sgt <16 x i8> %a0, <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>
   %2 = sext <16 x i1> %1 to <16 x i8>
   %3 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %2)
   %4 = icmp eq i32 %3, 0
   ret i1 %4
 }

 ; AND(MOVMSK(X),MOVMSK(Y)) -> MOVMSK(AND(X,Y))
 ; XOR(MOVMSK(X),MOVMSK(Y)) -> MOVMSK(XOR(X,Y))
 ; OR(MOVMSK(X),MOVMSK(Y)) -> MOVMSK(OR(X,Y))
 ; if the elements are the same width.

 define i32 @and_movmskpd_movmskpd(<2 x double> %a0, <2 x i64> %a1) {
 ; SSE-LABEL: and_movmskpd_movmskpd:
 ; SSE:       # %bb.0:
 ; SSE-NEXT:    xorpd %xmm2, %xmm2
 ; SSE-NEXT:    cmpeqpd %xmm0, %xmm2
 ; SSE-NEXT:    andpd %xmm1, %xmm2
 ; SSE-NEXT:    movmskpd %xmm2, %eax
 ; SSE-NEXT:    retq
 ;
 ; AVX-LABEL: and_movmskpd_movmskpd:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vxorpd %xmm2, %xmm2, %xmm2
 ; AVX-NEXT:    vcmpeqpd %xmm0, %xmm2, %xmm0
 ; AVX-NEXT:    vandpd %xmm1, %xmm0, %xmm0
 ; AVX-NEXT:    vmovmskpd %xmm0, %eax
 ; AVX-NEXT:    retq
   %1 = fcmp oeq <2 x double> zeroinitializer, %a0
   %2 = sext <2 x i1> %1 to <2 x i64>
   %3 = bitcast <2 x i64> %2 to <2 x double>
   %4 = tail call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %3)
   %5 = icmp sgt <2 x i64> zeroinitializer, %a1
   %6 = bitcast <2 x i1> %5 to i2
   %7 = zext i2 %6 to i32
   %8 = and i32 %4, %7
   ret i32 %8
 }

 define i32 @xor_movmskps_movmskps(<4 x float> %a0, <4 x i32> %a1) {
 ; SSE-LABEL: xor_movmskps_movmskps:
 ; SSE:       # %bb.0:
 ; SSE-NEXT:    xorps %xmm2, %xmm2
 ; SSE-NEXT:    cmpeqps %xmm0, %xmm2
 ; SSE-NEXT:    xorps %xmm1, %xmm2
 ; SSE-NEXT:    movmskps %xmm2, %eax
 ; SSE-NEXT:    retq
 ;
 ; AVX-LABEL: xor_movmskps_movmskps:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vxorps %xmm2, %xmm2, %xmm2
 ; AVX-NEXT:    vcmpeqps %xmm0, %xmm2, %xmm0
 ; AVX-NEXT:    vxorps %xmm1, %xmm0, %xmm0
 ; AVX-NEXT:    vmovmskps %xmm0, %eax
 ; AVX-NEXT:    retq
   %1 = fcmp oeq <4 x float> zeroinitializer, %a0
   %2 = sext <4 x i1> %1 to <4 x i32>
   %3 = bitcast <4 x i32> %2 to <4 x float>
   %4 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %3)
   %5 = ashr <4 x i32> %a1, <i32 31, i32 31, i32 31, i32 31>
   %6 = bitcast <4 x i32> %5 to <4 x float>
   %7 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %6)
   %8 = xor i32 %4, %7
   ret i32 %8
 }

 define i32 @or_pmovmskb_pmovmskb(<16 x i8> %a0, <8 x i16> %a1) {
 ; SSE-LABEL: or_pmovmskb_pmovmskb:
 ; SSE:       # %bb.0:
 ; SSE-NEXT:    pxor %xmm2, %xmm2
 ; SSE-NEXT:    pcmpeqb %xmm0, %xmm2
 ; SSE-NEXT:    psraw $15, %xmm1
 ; SSE-NEXT:    por %xmm2, %xmm1
 ; SSE-NEXT:    pmovmskb %xmm1, %eax
 ; SSE-NEXT:    retq
 ;
 ; AVX-LABEL: or_pmovmskb_pmovmskb:
 ; AVX:       # %bb.0:
 ; AVX-NEXT:    vpxor %xmm2, %xmm2, %xmm2
 ; AVX-NEXT:    vpcmpeqb %xmm2, %xmm0, %xmm0
 ; AVX-NEXT:    vpsraw $15, %xmm1, %xmm1
 ; AVX-NEXT:    vpor %xmm1, %xmm0, %xmm0
 ; AVX-NEXT:    vpmovmskb %xmm0, %eax
 ; AVX-NEXT:    retq
   %1 = icmp eq <16 x i8> zeroinitializer, %a0
   %2 = sext <16 x i1> %1 to <16 x i8>
   %3 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %2)
   %4 = ashr <8 x i16> %a1, <i16 15, i16 15, i16 15, i16 15, i16 15, i16 15, i16 15, i16 15>
   %5 = bitcast <8 x i16> %4 to <16 x i8>
   %6 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %5)
   %7 = or i32 %3, %6
   ret i32 %7
 }
	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=SSE,SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s --check-prefixes=SSE,SSE42
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX

	declare i32 @llvm.x86.sse.movmsk.ps(<4 x float>)
	declare i32 @llvm.x86.sse2.movmsk.pd(<2 x double>)
	declare i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8>)

	; Use widest possible vector for movmsk comparisons (PR37087)

	define i1 @movmskps_noneof_bitcast_v2f64(<2 x double> %a0) {
	; SSE-LABEL: movmskps_noneof_bitcast_v2f64:
	; SSE: # %bb.0:
	; SSE-NEXT: xorpd %xmm1, %xmm1
	; SSE-NEXT: cmpeqpd %xmm0, %xmm1
	; SSE-NEXT: movmskpd %xmm1, %eax
	; SSE-NEXT: testl %eax, %eax
	; SSE-NEXT: sete %al
	; SSE-NEXT: retq
	;
	; AVX-LABEL: movmskps_noneof_bitcast_v2f64:
	; AVX: # %bb.0:
	; AVX-NEXT: vxorpd %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vcmpeqpd %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vmovmskpd %xmm0, %eax
	; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: sete %al
	; AVX-NEXT: retq
	%1 = fcmp oeq <2 x double> zeroinitializer, %a0
	%2 = sext <2 x i1> %1 to <2 x i64>
	%3 = bitcast <2 x i64> %2 to <4 x float>
	%4 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %3)
	%5 = icmp eq i32 %4, 0
	ret i1 %5
	}

	define i1 @movmskps_allof_bitcast_v2f64(<2 x double> %a0) {
	; SSE-LABEL: movmskps_allof_bitcast_v2f64:
	; SSE: # %bb.0:
	; SSE-NEXT: xorpd %xmm1, %xmm1
	; SSE-NEXT: cmpeqpd %xmm0, %xmm1
	; SSE-NEXT: movmskpd %xmm1, %eax
	; SSE-NEXT: cmpl $3, %eax
	; SSE-NEXT: sete %al
	; SSE-NEXT: retq
	;
	; AVX-LABEL: movmskps_allof_bitcast_v2f64:
	; AVX: # %bb.0:
	; AVX-NEXT: vxorpd %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vcmpeqpd %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vmovmskpd %xmm0, %eax
	; AVX-NEXT: cmpl $3, %eax
	; AVX-NEXT: sete %al
	; AVX-NEXT: retq
	%1 = fcmp oeq <2 x double> zeroinitializer, %a0
	%2 = sext <2 x i1> %1 to <2 x i64>
	%3 = bitcast <2 x i64> %2 to <4 x float>
	%4 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %3)
	%5 = icmp eq i32 %4, 15
	ret i1 %5
	}

	define i1 @pmovmskb_noneof_bitcast_v2i64(<2 x i64> %a0) {
	; SSE2-LABEL: pmovmskb_noneof_bitcast_v2i64:
	; SSE2: # %bb.0:
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE2-NEXT: movmskps %xmm0, %eax
	; SSE2-NEXT: testl %eax, %eax
	; SSE2-NEXT: sete %al
	; SSE2-NEXT: retq
	;
	; SSE42-LABEL: pmovmskb_noneof_bitcast_v2i64:
	; SSE42: # %bb.0:
	; SSE42-NEXT: movmskpd %xmm0, %eax
	; SSE42-NEXT: testl %eax, %eax
	; SSE42-NEXT: sete %al
	; SSE42-NEXT: retq
	;
	; AVX-LABEL: pmovmskb_noneof_bitcast_v2i64:
	; AVX: # %bb.0:
	; AVX-NEXT: vmovmskpd %xmm0, %eax
	; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: sete %al
	; AVX-NEXT: retq
	%1 = icmp sgt <2 x i64> zeroinitializer, %a0
	%2 = sext <2 x i1> %1 to <2 x i64>
	%3 = bitcast <2 x i64> %2 to <16 x i8>
	%4 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %3)
	%5 = icmp eq i32 %4, 0
	ret i1 %5
	}

	define i1 @pmovmskb_allof_bitcast_v2i64(<2 x i64> %a0) {
	; SSE2-LABEL: pmovmskb_allof_bitcast_v2i64:
	; SSE2: # %bb.0:
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE2-NEXT: movmskps %xmm0, %eax
	; SSE2-NEXT: cmpl $15, %eax
	; SSE2-NEXT: sete %al
	; SSE2-NEXT: retq
	;
	; SSE42-LABEL: pmovmskb_allof_bitcast_v2i64:
	; SSE42: # %bb.0:
	; SSE42-NEXT: movmskpd %xmm0, %eax
	; SSE42-NEXT: cmpl $3, %eax
	; SSE42-NEXT: sete %al
	; SSE42-NEXT: retq
	;
	; AVX-LABEL: pmovmskb_allof_bitcast_v2i64:
	; AVX: # %bb.0:
	; AVX-NEXT: vmovmskpd %xmm0, %eax
	; AVX-NEXT: cmpl $3, %eax
	; AVX-NEXT: sete %al
	; AVX-NEXT: retq
	%1 = icmp sgt <2 x i64> zeroinitializer, %a0
	%2 = sext <2 x i1> %1 to <2 x i64>
	%3 = bitcast <2 x i64> %2 to <16 x i8>
	%4 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %3)
	%5 = icmp eq i32 %4, 65535
	ret i1 %5
	}

	define i1 @pmovmskb_noneof_bitcast_v4f32(<4 x float> %a0) {
	; SSE-LABEL: pmovmskb_noneof_bitcast_v4f32:
	; SSE: # %bb.0:
	; SSE-NEXT: xorps %xmm1, %xmm1
	; SSE-NEXT: cmpeqps %xmm0, %xmm1
	; SSE-NEXT: movmskps %xmm1, %eax
	; SSE-NEXT: testl %eax, %eax
	; SSE-NEXT: sete %al
	; SSE-NEXT: retq
	;
	; AVX-LABEL: pmovmskb_noneof_bitcast_v4f32:
	; AVX: # %bb.0:
	; AVX-NEXT: vxorps %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: sete %al
	; AVX-NEXT: retq
	%1 = fcmp oeq <4 x float> %a0, zeroinitializer
	%2 = sext <4 x i1> %1 to <4 x i32>
	%3 = bitcast <4 x i32> %2 to <16 x i8>
	%4 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %3)
	%5 = icmp eq i32 %4, 0
	ret i1 %5
	}

	define i1 @pmovmskb_allof_bitcast_v4f32(<4 x float> %a0) {
	; SSE-LABEL: pmovmskb_allof_bitcast_v4f32:
	; SSE: # %bb.0:
	; SSE-NEXT: xorps %xmm1, %xmm1
	; SSE-NEXT: cmpeqps %xmm0, %xmm1
	; SSE-NEXT: movmskps %xmm1, %eax
	; SSE-NEXT: cmpl $15, %eax
	; SSE-NEXT: sete %al
	; SSE-NEXT: retq
	;
	; AVX-LABEL: pmovmskb_allof_bitcast_v4f32:
	; AVX: # %bb.0:
	; AVX-NEXT: vxorps %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vcmpeqps %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: cmpl $15, %eax
	; AVX-NEXT: sete %al
	; AVX-NEXT: retq
	%1 = fcmp oeq <4 x float> %a0, zeroinitializer
	%2 = sext <4 x i1> %1 to <4 x i32>
	%3 = bitcast <4 x i32> %2 to <16 x i8>
	%4 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %3)
	%5 = icmp eq i32 %4, 65535
	ret i1 %5
	}

	; MOVMSK(ICMP_SGT(X,-1)) -> NOT(MOVMSK(X)))
	define i1 @movmskps_allof_v4i32_positive(<4 x i32> %a0) {
	; SSE-LABEL: movmskps_allof_v4i32_positive:
	; SSE: # %bb.0:
	; SSE-NEXT: movmskps %xmm0, %eax
	; SSE-NEXT: xorl $15, %eax
	; SSE-NEXT: cmpl $15, %eax
	; SSE-NEXT: sete %al
	; SSE-NEXT: retq
	;
	; AVX-LABEL: movmskps_allof_v4i32_positive:
	; AVX: # %bb.0:
	; AVX-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: xorl $15, %eax
	; AVX-NEXT: cmpl $15, %eax
	; AVX-NEXT: sete %al
	; AVX-NEXT: retq
	%1 = icmp sgt <4 x i32> %a0, <i32 -1, i32 -1, i32 -1, i32 -1>
	%2 = sext <4 x i1> %1 to <4 x i32>
	%3 = bitcast <4 x i32> %2 to <4 x float>
	%4 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %3)
	%5 = icmp eq i32 %4, 15
	ret i1 %5
	}

	define i1 @pmovmskb_noneof_v16i8_positive(<16 x i8> %a0) {
	; SSE-LABEL: pmovmskb_noneof_v16i8_positive:
	; SSE: # %bb.0:
	; SSE-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: xorl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: sete %al
	; SSE-NEXT: retq
	;
	; AVX-LABEL: pmovmskb_noneof_v16i8_positive:
	; AVX: # %bb.0:
	; AVX-NEXT: vpmovmskb %xmm0, %eax
	; AVX-NEXT: xorl $65535, %eax # imm = 0xFFFF
	; AVX-NEXT: sete %al
	; AVX-NEXT: retq
	%1 = icmp sgt <16 x i8> %a0, <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>
	%2 = sext <16 x i1> %1 to <16 x i8>
	%3 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %2)
	%4 = icmp eq i32 %3, 0
	ret i1 %4
	}

	; AND(MOVMSK(X),MOVMSK(Y)) -> MOVMSK(AND(X,Y))
	; XOR(MOVMSK(X),MOVMSK(Y)) -> MOVMSK(XOR(X,Y))
	; OR(MOVMSK(X),MOVMSK(Y)) -> MOVMSK(OR(X,Y))
	; if the elements are the same width.

	define i32 @and_movmskpd_movmskpd(<2 x double> %a0, <2 x i64> %a1) {
	; SSE-LABEL: and_movmskpd_movmskpd:
	; SSE: # %bb.0:
	; SSE-NEXT: xorpd %xmm2, %xmm2
	; SSE-NEXT: cmpeqpd %xmm0, %xmm2
	; SSE-NEXT: andpd %xmm1, %xmm2
	; SSE-NEXT: movmskpd %xmm2, %eax
	; SSE-NEXT: retq
	;
	; AVX-LABEL: and_movmskpd_movmskpd:
	; AVX: # %bb.0:
	; AVX-NEXT: vxorpd %xmm2, %xmm2, %xmm2
	; AVX-NEXT: vcmpeqpd %xmm0, %xmm2, %xmm0
	; AVX-NEXT: vandpd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovmskpd %xmm0, %eax
	; AVX-NEXT: retq
	%1 = fcmp oeq <2 x double> zeroinitializer, %a0
	%2 = sext <2 x i1> %1 to <2 x i64>
	%3 = bitcast <2 x i64> %2 to <2 x double>
	%4 = tail call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %3)
	%5 = icmp sgt <2 x i64> zeroinitializer, %a1
	%6 = bitcast <2 x i1> %5 to i2
	%7 = zext i2 %6 to i32
	%8 = and i32 %4, %7
	ret i32 %8
	}

	define i32 @xor_movmskps_movmskps(<4 x float> %a0, <4 x i32> %a1) {
	; SSE-LABEL: xor_movmskps_movmskps:
	; SSE: # %bb.0:
	; SSE-NEXT: xorps %xmm2, %xmm2
	; SSE-NEXT: cmpeqps %xmm0, %xmm2
	; SSE-NEXT: xorps %xmm1, %xmm2
	; SSE-NEXT: movmskps %xmm2, %eax
	; SSE-NEXT: retq
	;
	; AVX-LABEL: xor_movmskps_movmskps:
	; AVX: # %bb.0:
	; AVX-NEXT: vxorps %xmm2, %xmm2, %xmm2
	; AVX-NEXT: vcmpeqps %xmm0, %xmm2, %xmm0
	; AVX-NEXT: vxorps %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovmskps %xmm0, %eax
	; AVX-NEXT: retq
	%1 = fcmp oeq <4 x float> zeroinitializer, %a0
	%2 = sext <4 x i1> %1 to <4 x i32>
	%3 = bitcast <4 x i32> %2 to <4 x float>
	%4 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %3)
	%5 = ashr <4 x i32> %a1, <i32 31, i32 31, i32 31, i32 31>
	%6 = bitcast <4 x i32> %5 to <4 x float>
	%7 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %6)
	%8 = xor i32 %4, %7
	ret i32 %8
	}

	define i32 @or_pmovmskb_pmovmskb(<16 x i8> %a0, <8 x i16> %a1) {
	; SSE-LABEL: or_pmovmskb_pmovmskb:
	; SSE: # %bb.0:
	; SSE-NEXT: pxor %xmm2, %xmm2
	; SSE-NEXT: pcmpeqb %xmm0, %xmm2
	; SSE-NEXT: psraw $15, %xmm1
	; SSE-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: retq
	;
	; AVX-LABEL: or_pmovmskb_pmovmskb:
	; AVX: # %bb.0:
	; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpsraw $15, %xmm1, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpmovmskb %xmm0, %eax
	; AVX-NEXT: retq
	%1 = icmp eq <16 x i8> zeroinitializer, %a0
	%2 = sext <16 x i1> %1 to <16 x i8>
	%3 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %2)
	%4 = ashr <8 x i16> %a1, <i16 15, i16 15, i16 15, i16 15, i16 15, i16 15, i16 15, i16 15>
	%5 = bitcast <8 x i16> %4 to <16 x i8>
	%6 = tail call i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8> %5)
	%7 = or i32 %3, %6
	ret i32 %7
	}