Linux系统编程 —时序竞态

  • A+
所属分类:linux技术
摘要

什么是时序竞态?将同一个程序执行两次,正常情况下,前后两次执行得到的结果应该是一样的。但由于系统资源竞争的原因,前后两次执行的结果有可能得到不一样的结果,这个现象就是时序竞态。


时序竞态

什么是时序竞态?将同一个程序执行两次,正常情况下,前后两次执行得到的结果应该是一样的。但由于系统资源竞争的原因,前后两次执行的结果有可能得到不一样的结果,这个现象就是时序竞态

pause函数

函数原型:

int pause(void);

函数作用:

进程调用pause函数时,会造成进程主动挂起(处于阻塞状态,并主动放弃CPU),并且等待信号将其唤醒。

返回值:

我们知道,信号的处理方式有三种:1. 默认动作;2. 忽略处理;3. 捕捉。进程收到一个信号后,会先处理响应信号,再唤醒pause函数。于是有下面几种情况:

① 如果信号的默认处理动作是终止进程,则进程将被终止,也就是说一收到信号进程就终止了,pause函数根本就没有机会返回;

② 如果信号的默认处理动作是忽略,则进程将直接忽略该信号,相当于没收到这个信号,进程继续处于挂起状态,pause函数不返回;

③ 如果信号的处理动作是捕捉,则进程调用完信号处理函数之后,pause返回-1,errno设置为EINTR,表示“被信号中断”。

④ pause收到的信号不能被屏蔽,如果被屏蔽,那么pause就不能被唤醒。

因为alarm函数可以在设定的时间之后发送SIGALRM信号,pause函数又可以将进程挂起等待信号,则二者结合可以自己写一个sleep函数,如下:

 1#include <unistd.h>  2#include <signal.h>  3#include <stdio.h>  4  5void sig_alrm(int signo)  6{  7    /* nothing to do */  8}  9 10unsigned int mysleep(unsigned int nsecs) 11{ 12    unsigned int unslept; 13 14    signal(SIGALRM, &sig_alrm); 15    unslept = alarm(nsecs);  16    pause(); 17 18    return unslept; 19} 20 21 22int main(void) 23{ 24    while(1){ 25        mysleep(2); 26        printf("Two seconds passedn"); 27    } 28 29    return 0; 30} 

时序竞态前导例

在讲时序竞态具体现象之前,我们先来看一个生活中常见的场景:

想午睡10分钟,于是定了个10分钟的闹钟,希望10分钟后闹钟将自己叫醒。

正常情况:定好闹钟,午睡,10分钟后闹钟叫醒自己;

异常情况:定好闹钟,躺下睡觉2分钟,被同学叫醒去打球,打了20分钟后回来继续睡觉。但在打球期间,闹钟早就响过了,将不会再唤醒自己。

这个例子与之后要讲的时序竞态有很大的相似之处。

时序竞态问题分析

我们再回过头来看上面所写的mysleep程序。这个函数有可能是下面的时序:

  1. SIGALRM默认动作是终止进程,因此我们要将其捕捉,对SIGALRM注册信号处理函数;

  2. 调用alarm(1)函数定时1秒钟;

  3. alarm(1)调用结束,定时器开始计时。就在这时,进程失去CPU,进入就绪态等待CPU(相当于被同学叫醒去打球)。失去CPU的方式有可能是内核调度了优先级更高的进程取代了当前进程,使得当前进程无法获得CPU;

  4. 我们知道,alarm函数如果采用自然定时法的话,定时器将一直计时,与进程状态无关。于是,1秒后,闹钟定时时间到,内核向当前进程发送SIGALRM信号。高优先级进程尚未执行完毕,当前进程仍然无法获得CPU,继续处于就绪态,信号无法处理(处于未决状态);

  5. 优先级高的进程执行完毕,当前进程获得CPU资源,内核调度回当前进程执行。SIGALRM信号递达,并被进程处理;

  6. 信号处理完毕后,返回当前主控流程,并调用pause()函数,挂起等待alarm函数发送的SIGALRM信号将自己唤醒;

  7. 但实际SIGALRM信号已经处理完毕,pause()函数永远不会等到。

解决时序竞态问题

通过以上时序分析,我们可以看出,造成时序竞态的原因就是SIGALRM信号在进程失去CPU的时候就已经发送过来。为了防止这个现象出现,我们可以先将该信号阻塞,将其“抓住”,再在解除阻塞的时候立刻调用pause函数挂起等待。这样即使在调用alarm就失去CPU,也可以在进程重新获得CPU时将抓到的SIGALRM信号重新“放出来”,并将之后的pause函数唤醒。

但在解除阻塞与pause等待挂起信号之间,还是有可能失去CPU,除非将这两个步骤做成一个“原子操作”。Linux系统提供的sigsuspend函数就具备这个功能。所以,在时序要求比较严格的场合下都应该使用sigsuspend函数,而非pause函数。

函数原型:

int sigsuspend(const sigset_t *mask);

函数作用:

挂起等待信号;

函数参数:

mask,传入参数,sigsuspend函数调用期间,进程信号屏蔽字由参数mask指定。

具体用法:可将某个信号(如SIGALRM)从临时信号屏蔽字mask中删除,也就是在调用sigsuspend函数时对该信号解除屏蔽,然后挂起等待信号。但我们此时已经改变了进程的信号屏蔽字,所以调用完sigsuspend函数之后,应将进程的信号屏蔽字恢复原样。

 1#include <unistd.h>  2#include <signal.h>  3#include <stdio.h>  4  5void sig_alrm(int signo)  6{  7    /* nothing to do */  8}  9 10unsigned int mysleep(unsigned int nsecs) 11{ 12    struct sigaction newact, oldact; 13    sigset_t newmask, oldmask, suspmask; 14    unsigned int unslept; 15 16    //1.为SIGALRM设置捕捉函数,一个空函数 17    newact.sa_handler = sig_alrm; 18    sigemptyset(&newact.sa_mask); 19    newact.sa_flags = 0; 20    sigaction(SIGALRM, &newact, &oldact); 21 22    //2.设置阻塞信号集,阻塞SIGALRM信号 23    sigemptyset(&newmask); 24    sigaddset(&newmask, SIGALRM); 25   sigprocmask(SIG_BLOCK, &newmask, &oldmask);   //信号屏蔽字 mask 26 27    //3.定时n秒,到时后可以产生SIGALRM信号 28    alarm(nsecs); 29 30    /*4.构造一个调用sigsuspend临时有效的阻塞信号集, 31     *  在临时阻塞信号集里解除SIGALRM的阻塞*/ 32    suspmask = oldmask; 33    sigdelset(&suspmask, SIGALRM); 34 35    /*5.sigsuspend调用期间,采用临时阻塞信号集suspmask替换原有阻塞信号集 36     *  这个信号集中不包含SIGALRM信号,同时挂起等待, 37     *  当sigsuspend被信号唤醒返回时,恢复原有的阻塞信号集*/ 38    sigsuspend(&suspmask);  39 40    unslept = alarm(0); 41    //6.恢复SIGALRM原有的处理动作,呼应前面注释1 42    sigaction(SIGALRM, &oldact, NULL); 43 44    //7.解除对SIGALRM的阻塞,呼应前面注释2 45    sigprocmask(SIG_SETMASK, &oldmask, NULL); 46 47    return(unslept); 48} 49 50int main(void) 51{ 52    while(1){ 53        mysleep(2); 54        printf("Two seconds passedn"); 55    } 56 57    return 0; 58} 

可重入函数/不可重入函数

一个函数在被调用执行期间尚未调用结束的时候,由于某种时序,该函数又被重复调用,这种情况称为「重入」。如果从信号处理程序返回,则继续执行进程断点处的正常指令序列,从重新恢复到断点重新执行的过程中,函数所依赖的环境没有发生改变,就说这个函数是可重入的,反之就是不可重入的。

如果要将函数做成可重入函数,则函数内不能含有全局变量及static变量,也不能使用malloc、free。

更多精彩内容,请关注