HardBirch

i++循环与i–循环的执行效率

时间:09-09-26 栏目:系统技术篇 作者:鲁智森也有文化 评论:0 点击: 1,492 次

昨天同事问了我一个问题,有两个循环语句:

for(i = n; i > 0; i--)
{

}

for(i = 0; i < n; i++)
{

}

为什么前者比后者快?

我当时的解释是:

i--操作本身会影响CPSR(当前程序状态寄存器),CPSR常见的标志有N(结果为负), Z(结果为0),C(有进位),O(有溢出)。i > 0,可以直接通过Z标志判断出来。

i++操作也会影响CPSR(当前程序状态寄存器),但只影响O(有溢出)标志,这对于i < n的判断没有任何帮助。所以还需要一条额外的比较指令,也就是说每个循环要多执行一条指令。

(这是五年前tjww告诉我的,当时他在AVR上写一个LCD驱动程序,使用后者LCD会闪烁,使用前者则没有问题。)

为了确认我的理解是正确的,做了个实验:

int loop_dec(int n)

{

    int i = 0;

    int v = 0;

    for(i = n; i > 0; i--)

        v +=i;

    return v;

}

 

int loop_inc(int n)

{

    int i = 0;

    int v = 0;

    for(i = 0; i < n; i++)

        v +=i;

    return v;

}

用arm-linux-gcc编译,然后反汇编:

i--的循环条件:

  4c:   e51b3014        ldr     r3, [fp, #-20]

  50:   e3530000        cmp     r3, #0  ; 0x0

  54:   cafffff5        bgt     30

 

i++的循环条件:

  b8:   e51b3018        ldr     r3, [fp, #-24]

  bc:   e1520003        cmp     r2, r3

  c0:   bafffff4        blt     98

 

结果和我想象的并不一样,这是怎么回事呢?我想可能因为没有加优化选项,于是加上-O选项,结果变为:

 

i--的循环条件:

  14:   e2500001        subs    r0, r0, #1      ; 0x1

  18:   1afffffc        bne     10

i++的循环条件:

  3c:   e2833001        add     r3, r3, #1      ; 0x1

  40:   e1500003        cmp     r0, r3

  44:   1afffffb        bne     38

 

这下没错了,果然少一个cmp指令。

 

——转载自李先静老师博客处

声明: 本文由( 鲁智森也有文化 )原创编译,转载请保留链接: i++循环与i–循环的执行效率

i++循环与i–循环的执行效率:等您坐沙发呢!

发表评论


QQ群互动

Linux系统与内核学习群:194051772

WP建站技术学习交流群:194062106

魔豆之路QR

魔豆的Linux内核之路

魔豆的Linux内核之路

优秀工程师当看优秀书籍

优秀程序员,要看优秀书!

赞助商广告

友荐云推荐