| ; RUN: opt -loop-unroll-and-jam -allow-unroll-and-jam -pass-remarks=loop-unroll < %s -S 2>&1 | FileCheck %s |
| |
| target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-a:0:32-n32-S64" |
| target triple = "thumbv8m.main-arm-none-eabi" |
| |
| ;; Common check for all tests. None should be unroll and jammed due to profitability |
| ; CHECK-NOT: remark: {{.*}} unroll and jammed |
| |
| |
| ; CHECK-LABEL: unprof1 |
| ; Multiple inner loop blocks |
| define void @unprof1(i32 %I, i32 %J, i32* noalias nocapture %A, i32* noalias nocapture readonly %B) #0 { |
| ; CHECK: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] |
| ; CHECK: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner2 ] |
| entry: |
| %cmp = icmp ne i32 %J, 0 |
| %cmp122 = icmp ne i32 %I, 0 |
| %or.cond = and i1 %cmp, %cmp122 |
| br i1 %or.cond, label %for.outer.preheader, label %for.end |
| |
| for.outer.preheader: |
| br label %for.outer |
| |
| for.outer: |
| %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] |
| br label %for.inner |
| |
| for.inner: |
| %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner2 ] |
| %sum1 = phi i32 [ 0, %for.outer ], [ %add, %for.inner2 ] |
| %arrayidx = getelementptr inbounds i32, i32* %B, i32 %j |
| %0 = load i32, i32* %arrayidx, align 4 |
| %add = add i32 %0, %sum1 |
| br label %for.inner2 |
| |
| for.inner2: |
| %inc = add nuw i32 %j, 1 |
| %exitcond = icmp eq i32 %inc, %J |
| br i1 %exitcond, label %for.latch, label %for.inner |
| |
| for.latch: |
| %add.lcssa = phi i32 [ %add, %for.inner2 ] |
| %arrayidx6 = getelementptr inbounds i32, i32* %A, i32 %i |
| store i32 %add.lcssa, i32* %arrayidx6, align 4 |
| %addinc = add nuw i32 %i, 1 |
| %exitcond25 = icmp eq i32 %addinc, %I |
| br i1 %exitcond25, label %for.loopexit, label %for.outer |
| |
| for.loopexit: |
| br label %for.end |
| |
| for.end: |
| ret void |
| } |
| |
| |
| ; CHECK-LABEL: unprof2 |
| ; Constant inner loop count |
| define void @unprof2(i32 %I, i32 %J, i32* noalias nocapture %A, i32* noalias nocapture readonly %B) #0 { |
| ; CHECK: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] |
| ; CHECK: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] |
| entry: |
| %cmp = icmp ne i32 %J, 0 |
| %cmp122 = icmp ne i32 %I, 0 |
| %or.cond = and i1 %cmp, %cmp122 |
| br i1 %or.cond, label %for.outer.preheader, label %for.end |
| |
| for.outer.preheader: |
| br label %for.outer |
| |
| for.outer: |
| %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] |
| br label %for.inner |
| |
| for.inner: |
| %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] |
| %sum1 = phi i32 [ 0, %for.outer ], [ %add, %for.inner ] |
| %arrayidx = getelementptr inbounds i32, i32* %B, i32 %j |
| %0 = load i32, i32* %arrayidx, align 4 |
| %add = add i32 %0, %sum1 |
| %inc = add nuw i32 %j, 1 |
| %exitcond = icmp eq i32 %inc, 10 |
| br i1 %exitcond, label %for.latch, label %for.inner |
| |
| for.latch: |
| %add.lcssa = phi i32 [ %add, %for.inner ] |
| %arrayidx6 = getelementptr inbounds i32, i32* %A, i32 %i |
| store i32 %add.lcssa, i32* %arrayidx6, align 4 |
| %addinc = add nuw i32 %i, 1 |
| %exitcond25 = icmp eq i32 %addinc, %I |
| br i1 %exitcond25, label %for.loopexit, label %for.outer |
| |
| for.loopexit: |
| br label %for.end |
| |
| for.end: |
| ret void |
| } |
| |
| |
| ; CHECK-LABEL: unprof3 |
| ; Complex inner loop |
| define void @unprof3(i32 %I, i32 %J, i32* noalias nocapture %A, i32* noalias nocapture readonly %B) #0 { |
| ; CHECK: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] |
| ; CHECK: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] |
| entry: |
| %cmp = icmp ne i32 %J, 0 |
| %cmp122 = icmp ne i32 %I, 0 |
| %or.cond = and i1 %cmp, %cmp122 |
| br i1 %or.cond, label %for.outer.preheader, label %for.end |
| |
| for.outer.preheader: |
| br label %for.outer |
| |
| for.outer: |
| %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] |
| br label %for.inner |
| |
| for.inner: |
| %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] |
| %sum1 = phi i32 [ 0, %for.outer ], [ %add, %for.inner ] |
| %arrayidx = getelementptr inbounds i32, i32* %B, i32 %j |
| %0 = load i32, i32* %arrayidx, align 4 |
| %add = add i32 %0, %sum1 |
| %add0 = add i32 %0, %sum1 |
| %add1 = add i32 %0, %sum1 |
| %add2 = add i32 %0, %sum1 |
| %add3 = add i32 %0, %sum1 |
| %add4 = add i32 %0, %sum1 |
| %add5 = add i32 %0, %sum1 |
| %add6 = add i32 %0, %sum1 |
| %add7 = add i32 %0, %sum1 |
| %add8 = add i32 %0, %sum1 |
| %add9 = add i32 %0, %sum1 |
| %add10 = add i32 %0, %sum1 |
| %add11 = add i32 %0, %sum1 |
| %add12 = add i32 %0, %sum1 |
| %add13 = add i32 %0, %sum1 |
| %add14 = add i32 %0, %sum1 |
| %add15 = add i32 %0, %sum1 |
| %add16 = add i32 %0, %sum1 |
| %add17 = add i32 %0, %sum1 |
| %add18 = add i32 %0, %sum1 |
| %add19 = add i32 %0, %sum1 |
| %add20 = add i32 %0, %sum1 |
| %add21 = add i32 %0, %sum1 |
| %add22 = add i32 %0, %sum1 |
| %add23 = add i32 %0, %sum1 |
| %add24 = add i32 %0, %sum1 |
| %add25 = add i32 %0, %sum1 |
| %add26 = add i32 %0, %sum1 |
| %add27 = add i32 %0, %sum1 |
| %add28 = add i32 %0, %sum1 |
| %add29 = add i32 %0, %sum1 |
| %inc = add nuw i32 %j, 1 |
| %exitcond = icmp eq i32 %inc, %J |
| br i1 %exitcond, label %for.latch, label %for.inner |
| |
| for.latch: |
| %add.lcssa = phi i32 [ %add, %for.inner ] |
| %arrayidx6 = getelementptr inbounds i32, i32* %A, i32 %i |
| store i32 %add.lcssa, i32* %arrayidx6, align 4 |
| %addinc = add nuw i32 %i, 1 |
| %exitcond25 = icmp eq i32 %addinc, %I |
| br i1 %exitcond25, label %for.loopexit, label %for.outer |
| |
| for.loopexit: |
| br label %for.end |
| |
| for.end: |
| ret void |
| } |
| |
| |
| ; CHECK-LABEL: unprof4 |
| ; No loop invariant loads |
| define void @unprof4(i32 %I, i32 %J, i32* noalias nocapture %A, i32* noalias nocapture readonly %B) #0 { |
| ; CHECK: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] |
| ; CHECK: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] |
| entry: |
| %cmp = icmp ne i32 %J, 0 |
| %cmp122 = icmp ne i32 %I, 0 |
| %or.cond = and i1 %cmp, %cmp122 |
| br i1 %or.cond, label %for.outer.preheader, label %for.end |
| |
| for.outer.preheader: |
| br label %for.outer |
| |
| for.outer: |
| %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] |
| br label %for.inner |
| |
| for.inner: |
| %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] |
| %sum1 = phi i32 [ 0, %for.outer ], [ %add, %for.inner ] |
| %j2 = add i32 %j, %i |
| %arrayidx = getelementptr inbounds i32, i32* %B, i32 %j2 |
| %0 = load i32, i32* %arrayidx, align 4 |
| %add = add i32 %0, %sum1 |
| %inc = add nuw i32 %j, 1 |
| %exitcond = icmp eq i32 %inc, %J |
| br i1 %exitcond, label %for.latch, label %for.inner |
| |
| for.latch: |
| %add.lcssa = phi i32 [ %add, %for.inner ] |
| %arrayidx6 = getelementptr inbounds i32, i32* %A, i32 %i |
| store i32 %add.lcssa, i32* %arrayidx6, align 4 |
| %addinc = add nuw i32 %i, 1 |
| %exitcond25 = icmp eq i32 %addinc, %I |
| br i1 %exitcond25, label %for.loopexit, label %for.outer |
| |
| for.loopexit: |
| br label %for.end |
| |
| for.end: |
| ret void |
| } |