`
isiqi
  • 浏览: 16027369 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

linux内核中jiffies的回绕问题

阅读更多

1。网上遇到的一个问题。先贴出来问题,再说解决方法。

看“linux 内核设计与实现” 的 jiffies 的回绕这里,产生一个疑问(后面再说),于是又到网上查到了这么一篇文章:

http://ericchan77.spaces.live.com/blog/cns!b2dc351bf474ddf2!287.entry

关于jiffies变量:
全局变量jiffies用来记录自启动以来产生的节拍的总数。系统启动时会将该变量初始化为0,此后,每当时钟中断产生时就会增加该变量的值。jiffies和另外一个变量息息相关:HZ。HZ是每秒系统产生的时钟中断次数,所以jiffies每秒增加的值也就是HZ;在x86体系结构中,内核版本在2.4以前的值为100,在2.6内核中被定义为1000。 jiffies的定义:
extern unsigned long volatile jiffies; //定义于<linux/jiffies.h>
从定义可以看出,jiffies的类型为unsigned long,在32位体系结构上unsigned long是32位,在64位体系结构上是64位。 在32位体系结构上,在系统的HZ值为100的情况下,jiffies的回绕时间大约为500天左右,如果HZ为1000,那么回绕时间将只有50天左右。如果发生了回绕现象,对内核中直接利用jiffies来比较时间的代码将产生很不利的影响,比如在<<Linux Kernle Developmen>>一书中有一个例子可以说明这个问题:
unsigned long timeout = jiffies + HZ/2; //0.5后超时
/*执行一些任务*/
........
/*然后检查时间是否过长*/
if(timeout>jiffies){
/*没有超时...*/
}else{
/*超时了....*/
}
在这个例子中,如果设置了timeout后发生了回绕,那么第一个判断条件将变为真,这与实际情况不符,尽管因为实际的时间比timeout要大,但因为jiffies发生了回绕变成了0,所以jiffies肯定小于timeout的值。 内核也专门针对这种情况提供了四个宏来帮助比较jiffies计数:
#define time_after(unknown,known) ((long)(known) - (long)(unknown)<0)
#define time_before(unkonwn,known) ((long)(unknown) - (long)(known)<0)
#define time_after_eq(unknown,known) ((long)(unknown) - (long)(known)>=0)
#define time_before_eq(unknown,known) ((long)(known) -(long)(unknown)>=0)
这些宏看起来很奇妙,只是将计数值强制转换为long类型然后比较就能避免回绕带来的问题,这是为什么呢?这和计算机中数据存储的形式有关!!
计算机中数据的存储是按照二进制补码的方式存储的,之所以采用补码的方式存储是因为这样可以简化运算规则和线路设计。另外一个相关的概念就是原码,原码采用一个最高位作为符号位,其余位是数据大小的二进制表示。 补码的定义是这样的:正数的补码即为原码,负数的补码为原码除符号位外其他各位取反再加1。举例如下:
[+1]补码 = [+1]原码 = 0000 0001
[- 1]补码 = [- 1]原码取反+1 = 1111 1110 + 1 = 1111 1111
而c语言中的数据类型相当于在代码和实际机器的存储之间的一个中间层,机器中存储的数据,如果按照不同的类型格式取读取就会得到不同的结果,才代码和实际存储之间,编译器充当了翻译者的角色。这是编译器能实现多种数据类型和强制类型转换的基础。
有了这些基础后,就不难理解上述宏定义的巧妙之处了,为了便于说明,以下假设jiffies是单字节的无符号数,范围为0~255。假如jiffies开始为250,由于是无符号数据,那么它在机器中实际存储的补码为11111010,记为J1;timeout如果被设为252,实际存储为11111100;而过了一会jiffies发生回绕编变成了1,实际存储变为00000001,记为J2。 那么此时如果按照无符号数比较其大小关系,有: J1<timeout & J2 <timeout,这样的结果与实际的时间节拍统计是不符的,但是如果我们按照有符号数来比较会有什么结果呢?
J1如果按照有符号数读取,首先从补码转换成原码:10000110,转换成十进制为-6;
timeout按照有符号数读取,首先从补码转换成原码:10000100,转换成十进制为-4;
J2按照有符号数读取,首先从补码转换成原码:00000001,转换成十进制为1;
这样它们的大小关系为: J1<timeout<J2。 这与实际的节拍计数就吻合了,以上内核定义的几个宏就是通过这种方式巧妙解决jiffies回绕问题的

//////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

这段文字把:
#define time_after(unknown,known) ((long)(known) - (long)(unknown)<0)
#define time_before(unkonwn,known) ((long)(unknown) - (long)(known)<0)
#define time_after_eq(unknown,known) ((long)(unknown) - (long)(known)>=0)
#define time_before_eq(unknown,known) ((long)(known) -(long)(unknown)>=0)

这四个宏的作用说得非常清楚了,

而我的疑问是:这四个宏虽然避免了在零处的回绕,但如何避免从无符号long , unsigned long, 到有符号long ,signed long ,的回绕呢?

也就是说,比如无符号long 是32位,现在 J1 是 7FFF FFF0,timeout 是 7FFF FFFF ,J2 是 7FFF FFFF + 1 ,转成有符号long 后,J1 是 7FFF FFF0 (一个很大正数,是 2 的 31 次方减 15 ),timeout 是 7FFF FFFF (一个很大正数,是 2 的 31 次方减 1 ),而 J2 成了 8000 0000 ,一个非常小的负数,是 负 2 的 31 次方,这就是说,本来 J1 < timeout < J2 ,此时, J2 << J1 < timeout ,怎么办?

2。再说一下自己验证的程序和结果。

我的程序如下:

#include <linux/init.h>
#include <linux/module.h>
#include <linux/jiffies.h>

static int __init hello_mode_init(void)
{
printk("\nHello ,Module\n");
unsigned long j1= 0x7ffffff0;
unsigned long timeout= 0x7fffffff;
unsigned long j2= 0x80000002;

printk("\nj2:%x,timeout:%x,time_after(j2, timeout):%d\n",
j2, timeout, time_after(j2, timeout));
printk("j2:%d, timeout:%d\n", (long)j2, (long)timeout);
printk("typecheck(unsigned long, j2):%d,typecheck(unsigned long, timeout):%d\n",
typecheck(unsigned long, j2), typecheck(unsigned long, timeout));
printk("( ((long)timeout - (long)j2<0)):%d \n", ((long)timeout - (long)j2<0));
printk("( (( (long)timeout - (long)j2 )<0) ):%d \n", (((long)timeout - (long)j2)<0));

return 0;
}
static void __exit hello_mode_exit(void)
{
printk(KERN_EMERG "\nBYe, MOdule!\n");
}

module_init(hello_mode_init);
module_exit(hello_mode_exit);

MODULE_LICENSE("Dual BSD/GPL");

打印的结果如下:

[root@lpc3250 tmp]# insmod hello_mod.ko

Hello ,Module

j2:80000002,timeout:7fffffff,time_after(j2, timeout):1
j2:-2147483646, timeout:2147483647
typecheck(unsigned long, j2):1,typecheck(unsigned long, timeout):1
( ((long)timeout - (long)j2<0)):1
( (( (long)timeout - (long)j2 )<0) ):1

3。问题分析与解决

程序的结果是正确的,这说明内核中的time_after()这个宏是没问题的。

内核中time_after的定义为:

#define time_after(a,b)\
(typecheck(unsigned long, a) && \
typecheck(unsigned long, b) && \
((long)(b) - (long)(a) < 0))

typecheck是类型检查,是unsigned long类型就会返回1,打印信息表明它的确返回了1:typecheck(unsigned long, j2):1,typecheck(unsigned long, timeout):1

问题是(long)timeout - (long)j2<0为什么会为真。

我们打印的结果显示,j2转化为long类型以后变为负数,一个正数减去一个负数会小于0?有这回事?还真有。

j1,j2,timeout的关系如图。

转化为long类型之后,大于2^31-1的unsigned long类型的数变为负数。大小关系如下图

现在看到(long)timeout - (long)j2的值其实就是图中x2的值,只要第一张图片中的x1小于2^31-1, x2就大于2^31-1。大于2^31-1的数,最高的比特位(bit31)必定为1,由于计算是按long类型计算的,所以bit31上的1被当做负号处理,(long)timeout - (long)j2的结果其实是一个负数,当然小于0。因此正数减去负数也会小于0,。

好了,现在说说使用范围,为了使,(long)timeout - (long)j2小于零,必须使x1小于2^31-1。也就是说只要timeout和j2之差绝对值不超过2^31-1,time_after这组宏就不会出问题。

这组宏其实是牺牲了范围换取正确性。

分享到:
评论

相关推荐

    Linux2.6内核标准教程(共计8-- 第1个)

    Linux内核是Linux操作系统中最核心的部分,用于实现对硬件部件的编程控制和接口操作。《Linux2.6内核标准教程》深入、系统地讲解了 Linux内核的工作原理,对Linux内核的核心组件逐一进行深入讲解。 全书共8章,首先...

    Linux2.6内核标准教程(共计8--第8个)

    Linux内核是Linux操作系统中最核心的部分,用于实现对硬件部件的编程控制和接口操作。《Linux2.6内核标准教程》深入、系统地讲解了 Linux内核的工作原理,对Linux内核的核心组件逐一进行深入讲解。 全书共8章,首先...

    Linux2.6内核标准教程(共计8--第6个)

    Linux内核是Linux操作系统中最核心的部分,用于实现对硬件部件的编程控制和接口操作。《Linux2.6内核标准教程》深入、系统地讲解了 Linux内核的工作原理,对Linux内核的核心组件逐一进行深入讲解。 全书共8章,首先...

    Linux2.6内核标准教程(共计8--第3个)

    Linux内核是Linux操作系统中最核心的部分,用于实现对硬件部件的编程控制和接口操作。《Linux2.6内核标准教程》深入、系统地讲解了 Linux内核的工作原理,对Linux内核的核心组件逐一进行深入讲解。 全书共8章,首先...

    Linux2.6内核标准教程(共计8--第7个)

    Linux内核是Linux操作系统中最核心的部分,用于实现对硬件部件的编程控制和接口操作。《Linux2.6内核标准教程》深入、系统地讲解了 Linux内核的工作原理,对Linux内核的核心组件逐一进行深入讲解。 全书共8章,首先...

    linux内核定时器

    这是一个内核定时器程序,写出了内核定时器的基本骨架,实现每隔10秒打印一句话。

    Linux2.6内核标准教程(共计8--第4个)

    Linux内核是Linux操作系统中最核心的部分,用于实现对硬件部件的编程控制和接口操作。《Linux2.6内核标准教程》深入、系统地讲解了 Linux内核的工作原理,对Linux内核的核心组件逐一进行深入讲解。 全书共8章,首先...

    Linux2.6内核标准教程(共计8--第2个)

    Linux内核是Linux操作系统中最核心的部分,用于实现对硬件部件的编程控制和接口操作。《Linux2.6内核标准教程》深入、系统地讲解了 Linux内核的工作原理,对Linux内核的核心组件逐一进行深入讲解。 全书共8章,首先...

    Linux2.6内核标准教程(共计8--第5个)

    Linux内核是Linux操作系统中最核心的部分,用于实现对硬件部件的编程控制和接口操作。《Linux2.6内核标准教程》深入、系统地讲解了 Linux内核的工作原理,对Linux内核的核心组件逐一进行深入讲解。 全书共8章,首先...

    【嵌入式Linux驱动开发】十四、了解Linux内核定时器使用流程,实现LED闪烁

    一、Linux内核定时器初探 1.1、图形界面配置系统节拍率   中断周期性产生的频率就是系统频率,也叫做节拍率(tick rate),单位是 Hz。系统节拍率是可以设置的,在编译 Linux 内核的时候可以通过图形化界面设置系统...

    6_jiffies.tasr.gz

    获取内核jiffies值(此为博客http://blog.csdn.net/shallnet 文章对应源码下载)

    Linux时间子系统.docx

    这些文件主要讨论了Linux内核中的时间子系统,包括时钟源(clock source)、时间表示、时间维护者(timekeeper)、定时器引擎(clock_event_device)、低分辨率定时器、高精度定时器(HRTIMER)、动态时钟框架...

    Linux内核中的定时

    系统定时器频率(节拍率)是通过静态预处理器定义的,也是HZ,编写内核代码时,不要以为HZ值是固定不变的值。连续两次时钟的间隔时间叫做节拍,它等于节拍率分之一秒。高HZ有利于提供诸如poll和select函数运行的精度...

    Linux时间子系统之时间的表示示例详解

    在Linux内核中,为了兼容原有的代码,或者符合某种规范,并且还要满足当前精度日益提高的要求,实现了多种与时间相关但用于不同目的的数据结构: 1)jiffies和jiffies_64 内核用jiffies_64全局变量记录系统自启动...

    《精通Linux 设备驱动程序开发》.(Sreekrishnan).pdf

     本书适合中高级linux开发人员阅读。 目录 第1章 引言1 1.1 演进1 1.2 gnu copyleft2 1.3 kernel.org2 1.4 邮件列表和论坛3 1.5 linux发行版3 1.6 查看源代码4 1.7 编译内核7 1.8 可加载的模块...

    精通LINUX设备驱动程序开发

    目 录 第1章 引言 1 1.1 演进 1 1.2 gnu copyleft 2 1.3 kernel.org 2 1.4 邮件列表和论坛 3 1.5 linux发行版 3 1.6 查看源代码 4 1.7 编译内核 7 1.8 可加载的模块 8 1.9 整装待发 9 第2章 内核 11 2.1...

    ARM_Linux启动分析.pdf

    在i386体系结构中,因为i386本身的问题,在 "arch/alpha/kernel/head.S"中需要更多的设置,但最终也是通过call SYMBOL_NAME(start_kernel)转到start_kernel()这个体系结构无关的函数中去执行了。 所不同的是,在...

    vmm_clock:在OpenBSD的管理程序下针对Linux来宾的kvmclock派生的时钟源的实验实现

    它是专门为在OpenBSD的vmm(4)/ vmd(8)虚拟机管理程序框架下以来宾身份运行Linux内核时使用而设计的。 主要目标: 提供的时钟源不会受到无法控制的时钟漂移的影响,这与在较新Linux LTS内核(例如5.4)中使用...

Global site tag (gtag.js) - Google Analytics