本文作者:sodme
本文出处:
http://blog.csdn.net/sodme声明:本文可以不经作者同意任意转载、复制、传播,但任何对本文的引用均须保留本文的作者、出处及本行声明信息!谢谢!
前段时间作性能优化时, 研究过一段时间的linux AT&T asm, 一点体会写出来与大家共享.
我们知道linux的asm采用的是AT&T汇编语法, 关于它的详细文档在以下的地址可以获得:
http://asm.sourceforge.net/articles/linasm.html看文档虽然是比较规矩的作法, 但对于诸如我等对未知世界好奇心过盛而又心急易上火的人类而言, 看代码要远来得轻松和契意:
#include <iostream>
int main(void)
{
int result, input;
input = 2;
result = 3;
__asm__
(
"movl %1, %0\n"
"subl $1, %1\n"
"movl %1, %0"
: "=r"(result)
: "m"(input)
);
std::cout << "result=" << result << std::endl;
return 0;
}
形如以上形式, 加两个":", 是很多AT&T asm教程里都会说到的方法, 其作用在于规定输入输出参数, 而在汇编里会以%1和0%之类的来代替这些参数, 这样就实现了参数传递和计算结果的返回. 但是, 我一向比较少采用这种作法.
个人认为, 对于性能优化而言, gcc -O3选项所作的确实已经非常牛X了, 但对于不便采用-O3优化处理的, 手动优化还是有必要的. 而在手动优化这方面, 一般都会比较关注如何在C或C++里嵌入汇编, 直接使用汇编语言的方法写算法我觉得没必要而且编码时间较长也复杂. 所以, 一般我会这么干: 先用高级语言写出函数原型, 对于已有算法, 我会先gcc -S编译生成汇编代码, 然后在这个代码的基础之上再作优化. 这样作的另一个好处是, 对于参数和局部变量的地址引用可以通过分析编译后的汇编代码而轻易获得, 这样也方便我们在自己的汇编算法里来引用它们. 当然, 另外遇到的一种问题是, 可能有时我们会直接写汇编, 比如进行一些简单且快速运算之类的.
我所使用的内嵌汇编形式, 一般会直接这么写:
int func( int a, int b)
{
...
__asm__
(
...
"movl $1, %eax\n"
...
);
...
}
想把哪段代码进行优化, 就直接将那段代码用__asm__()的方式括起来, 但不用加":"的方式规定输入输出参数, 因为我觉得%1和%0这样的方式更象是机器所看的东西, 而不是人类应该看的, 人类最起码也要看个"以字母开头的, 字母和数字的集合"这样定义出来的东西. 我一般会使用经过对ebp修正的地址来间接寻址访问变量, 也就是一般情况下, 函数变量访问的最普通方式[ebp + xx].
为了有一个更加感性的认识, 下面再贴段AT&T asm代码:
.LFB1411:
pushl %ebp
.LCFI0:
movl %esp, %ebp
.LCFI1:
subl $4, %esp
.LCFI2:
movl %eax, -4(%ebp)
movl -4(%ebp), %eax
movl (%eax), %eax
movl %eax, %edx
shrl $31, %edx
movl -4(%ebp), %eax
movl (%eax), %eax
shrl $6, %eax
xorl %eax, %edx
movl -4(%ebp), %eax
movl (%eax), %eax
shrl $4, %eax
xorl %eax, %edx
movl -4(%ebp), %eax
movl (%eax), %eax
shrl $2, %eax
xorl %eax, %edx
movl -4(%ebp), %eax
movl (%eax), %eax
shrl %eax
xorl %eax, %edx
movl -4(%ebp), %eax
movl (%eax), %eax
xorl %edx, %eax
andl $1, %eax
movl %eax, %edx
sall $31, %edx
movl -4(%ebp), %eax
movl (%eax), %eax
shrl %eax
orl %eax, %edx
movl -4(%ebp), %eax
movl %edx, (%eax)
leave
ret
由这段代码来看AT&T asm与intel asm的不同点可能印象更深刻一些:
1.源操作数与目的操作数,在两种语法下截然相反, AT&T asm中, 左边的是源, 右边的是目的;
2.几乎所有的数据操作指令都会有intel asm指令字后加个l, 表示的是long;
3.立即数用$开头;
4.寄存器是以%开头;
5.间接寻址符号是"()", 而不是intel asm的"[]";
从形式上来看, 似乎两种语法的不同之处也就这么多. 但实际的应用中, 可能还存在很多的不一样, 比如:
intel asm下的:
mov ebx, dword ptr [LABLE_TEST]
到了AT&T asm下可能就不得不换成:
lea LABLE_TEST, %ebx
movl (%ebx), %ebx
(未完待续, 想起来再加)
分享到:
相关推荐
PDF电子书《AT&T x86 asm 语法》,和大家分享~
AT&T 风格 x86 体系 汇编 语法 学习
如果我们选择的OS开发工具是GCC以及GAS的话,就必须了解AT&T汇编语言语法,因为GCC/GAS只支持这种汇编语法。 本书不会去讨论8086/80386的汇编编程,这类的书籍很多,你可以参考它们。这里只会讨论AT&T的汇编语法...
linux下intel asm 转at & t asm
AT&T VS INTEL in ASM.pdf
一本好的汇编书,牛人推荐,较全面的ASM语法介绍和分析
linux下流行的汇编格式,AT&T asm,初级入门教程,写的非常不错。
x86 Assembly Language Reference Manual。SUN官方出品。学习AT&T汇编的好材料。
AT&T汇编语言格式
对AT&T汇编语法详尽清晰的描述,看过一遍就会了,非常清晰
这里是我在网上收集的,然后转换成PDF的,希望对大家有用。
讨论AT&T 的汇编语法,以及GCC 的内嵌汇编语法。
收集的关于at&t的资料; 包括语法,例子等,倚望对大家有用
开发一个OS,尽管绝大部分代码只需要用C/C++等高级语言就可以了,但至少和硬件相关部分的代码需要使用汇编语言,另外,由于 启动部分的代码有大小限制,使用精练的汇编可以缩小目标代码的Size。
linux 上的汇编开发指南,用at&t格式,使用于想学习linux asm 和 at&t asm 的开发人员.
安装linux6.5 Oracle数据库时配置asm的asm的linux6.5包
中文Linux asm入门
ASM9260T的中文数据手册,使用ASM9260T芯片的首选
oracle10g rac asm for linux oracle10g rac asm for linux