1.linux线程概念
1.1什么是线程
在一个程序里的一个执行路线就叫线程(thread)。更准确的定义是:线程是“一个进程内部的控制序列”
一切进程至少都有一个执行线程
线程在进程内部执行,本质是在进程地址空间内运行
在linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化
透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就形成了线程执行流
1.2 线程的优点
创建一个新线程的代价要比创建一个新进程小很多
与进程之间的切换相比,线程之间的切换需要OS做的工作要少很多
线程占用的资源要比进程少很多
能充分利用多处理器的可并行数量
在等待慢速I/O操作结束的同时,程序可执行其他的计算任务
计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
I/O密集型应用,为了提高性能,将I/O操作重叠,线程可以同时等待不同的I/O操作
1.3 线程的缺点
性能缺失:一个很少被外部事件阻塞的计算密集线程往往无法与其他线程共享一个处理器。如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是额外的同步和调度开销,而可用的资源不变。
健壮性降低:编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性很大,换句话说线程之间是缺乏保护的
缺乏访问控制:进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响
编程难度提高:编写与调试一个多线程程序比单线程程序困难很多
1.4 线程异常
1.5 线程用途
1.6 linux线程vs进程

2 linux线程控制
2.1 POSIX线程库:
与线程相关的函数构成了一个完成的系列,绝大多数函数的名字都是以“pthread_”打头的
要使用这些函数库,要通过引入头文件<pthread.h>
链接这些线程函数库时要使用编译命令的“-lpthread”选项
创建线程:
功能:创建一个新的线程原型int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void * (*start_routine)(void*), void *arg);
参数thread:返回线程 IDattr:设置线程的属性, attr 为 NULL 表示使用默认属性start_routine:是个函数地址,线程启动后要执行的函数arg:传给线程启动函数的参数返回值:成功返回 0 ;失败返回错误码
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <pthread.h>
void *run(void *arg)
{
int i;
for(;;)
{
printf("I am thread 1\n");
sleep(1);
}
}
int main()
{
pthread_t tid;
int ret;
if((ret = pthread_create(&tid,nullptr,run,nullptr)) != 0)
{
fprintf(stderr,"pthread_create : %s \n", strerror(ret));
exit(EXIT_FAILURE);
}
int i;
for(;;)
{
printf("I am main thread 1\n");
sleep(1);
}
return 0;
}
这份代码一但创建线程失败,主线程将读取返回的错误码
pthread_t pthread_self(void);
pthread_t对于现在的linux实现的NPTL而言,其本质上就是一个进程地址空间上的一个地址
线程终止
如果需要某个线程而不是整个进程,可以有三种方法:
1.从线程函数return。这种方法对主线程不适用,从main函数return相当于调用exit
2.线程可以调用pthread_exit终止自己
3.一个线程可以调用pthread_cance终止同一个进程的另一个线程
功能:线程终止
原型
void pthread_exit(void *value_ptr);
参数
value_ptr:value_ptr不要指向一个局部变量。
返回值:无返回值,跟进程一样,线程结束的时候无法返回到它的调用者(自身)
需要注意pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的,不能在线程函数的栈上分配,因为其他线程获取这个返回指针时线程函数已经退出了。
功能:取消一个执行中的线程
原型
int pthread_cancel(pthread_t thread);
参数
thread:线程ID
返回值:成功返回0;失败返回错误码
线程等待
已经退出的线程,其空间没有释放,仍然在进程的地址空间内。
创建新的线程不会复用刚才退出线程的地址空间
功能:等待线程结束
原型
int pthread_join(pthread_t thread, void **value_ptr);
参数
thread:线程ID
value_ptr:它指向一个指针,后者指向线程的返回值
返回值:成功返回0;失败返回错误码

下面通过代码演示这三种退出方式
void *thread1(void *arg)
{
printf("thread 1 returning ... \n");
int *p = (int *)malloc(sizeof(int));
*p = 1;
return (void *)p;
}
void *thread2(void *arg)
{
printf("thread 2 exiting ...\n");
int *p = (int *)malloc(sizeof(int));
*p = 2;
pthread_exit((void *)p);
}
void *thread3(void *arg)
{
while (1)
{ //
printf("thread 3 is running ...\n");
sleep(1);
}
return NULL;
}
int main(void)
{
pthread_t tid;
void *ret;
// thread 1 return
pthread_create(&tid, NULL, thread1, NULL);
pthread_join(tid, &ret);
printf("thread return, thread id %X, return code:%d\n", tid, (int *)ret);
free(ret);
// thread 2 exit
pthread_create(&tid, NULL, thread2, NULL);
pthread_join(tid, &ret);
printf("thread return, thread id %X, return code:%d\n", tid, (int *)ret);
free(ret);
// thread 3 cancel by other
pthread_create(&tid, NULL, thread3, NULL);
sleep(3);
pthread_cancel(tid);
pthread_join(tid, &ret);
if (ret == PTHREAD_CANCELED)
printf("thread return, thread id %X, return code:PTHREAD_CANCELED\n", tid);
else
printf("thread return, thread id %X, return code:NULL\n", tid);
}
分离线程:
默认情况下,新创建的线程是joinable的,线程退出后,需要对其进行pthread_join操作,否则无法释放资源,从而造成资源泄漏
如果不关心线程的返回值,join是一种负担,这个时候,我们可以告诉系统,当线程退出时,自动释放线程资源。
int pthread_detach(pthread_t thread);
可以是线程组内其他线程对目标线程进行分离,也可以是线程自己分离:
pthread_detach(pthread_self());
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>
void *thread_run(void *arg)
{
pthread_detach(pthread_self());
printf("%s\n", (char *)arg);
return NULL;
}
int main(void)
{
pthread_t tid;
const char* tmp = "thread1 run...";
if (pthread_create(&tid, NULL, thread_run, (void *)tmp) != 0)
{
printf("create thread error\n");
return 1;
}
int ret = 0;
sleep(1); // 很重要,要让线程先分离,再等待
if (pthread_join(tid, NULL) == 0)
{
printf("pthread wait success\n");
ret = 0;
}
else
{
printf("pthread wait failed\n");
ret = 1;
}
return ret;
}
2.2 linux线程互斥
进程线程间的互斥相关背景概念
临界资源:多线程执行流共享的资源就叫做临界资源
临界区:每个线程内部,访问临界资源的代码,就叫做临界区
互斥:任何时刻,互斥保证有且只有一个执行流进入临界区,访问临界资源,通常对临界资源起保护作用
原子性(后面讨论如何实现):不会被任何调度机制打断的操作,该操作只有两态,要么完成,要么未完成
int ticket =100;
void *run(void *arg)
{
char *id = (char*) arg;
while(1){
if(ticket > 0)
{
usleep(1000);
printf("%s sells ticket:%d\n",id,ticket);
ticket--;
}
else break;
}
}
int main()
{
pthread_t id1,id2,id3,id4;
char *ip1 = "thread 1";
char *ip2 = "thread 2";
char* ip3 = "thread 3";
char* ip4 = "thread 4";
pthread_create(&id1,nullptr,run,ip1);
pthread_create(&id2,nullptr,run,ip2);
pthread_create(&id3,nullptr,run,ip3);
pthread_create(&id4,nullptr,run,ip4);
pthread_join(id1,nullptr);
pthread_join(id2,nullptr);
pthread_join(id3,nullptr);
pthread_join(id4,nullptr);
return 0;
}
上面这段代码之所以出现负数是因为:
1.if语句判断条件为真以后,代码可以并发的切换到其他线程
2.usleep这个模拟漫长业务的过程,在这个漫长的业务过程中,可能有很多个线程会进入该代码段
3.--ticket操作本身就不是一个原子操作(我前面的文章讲过原子库感兴趣的可以看看)
对ticket的操作并不是原子的,因为它对应着三条汇编指令
1.load:将共享变量ticket从内存加载到寄存器中
2.update:更新寄存器里面的值,执行-1操作
3.store:将新值,从寄存器写回共享变量ticket的内存地址
要解决上面的问题,需要做到三点:
1.代码必须要有互斥行为:当代码进入临界区执行时,不允许其他线程进入改临界区。
2.如果多个线程同时要求执行临界区的代码,并且临界区没有线程在执行,那么只能允许一个线程进入该临界区
3.如果线程不在临界区执行,那么该线程不能阻止其他线程进入临界区。
要做到这三点,本质上就是需要一把锁。linux上提供的这把锁叫互斥量。
互斥量的接口
初识互斥量(有两种方法)
法一:静态分配
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER
法二:动态分配
int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict
attr);
参数:
mutex:要初始化的互斥量
attr:NULL
销毁互斥量:
销毁互斥量需要注意的事件:
1.使用静态分配的互斥量不需要销毁
2.不要销毁一个已经加锁的互斥量
3.已经销毁的互斥量,要确保后面不会有线程再尝试加锁
int pthread_mutex_destroy(pthread_mutex_t *mutex);
互斥量的加锁和解锁
int pthread_mutex_lock(pthread_mutex_t *mutex);
int pthread_mutex_unlock(pthread_mutex_t *mutex);
返回值:成功返回0,失败返回错误号
调用pthread_mutex_lock时,可能会遇到以下情况:
1.互斥量处于未锁状态,该函数会将互斥量锁定,同时返回成功
2.发起函数调用时,其他线程已经锁定互斥量,或者存在其他线程同时申请互斥量,但没有竞争到互斥量,那么pthread_mutex_lock调用会陷入阻塞(执行流被挂起),等待互斥量解锁
//改进后的代码
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>
#include <sched.h>
int ticket = 100;
pthread_mutex_t mutex;
void *route(void *arg)
{
char *id = (char *)arg;
while (1)
{
pthread_mutex_lock(&mutex);
if (ticket > 0)
{
usleep(1000);
printf("%s sells ticket:%d\n", id, ticket);
ticket--;
pthread_mutex_unlock(&mutex);
// sched_yield(); 放弃CPU
}
else
{
pthread_mutex_unlock(&mutex);
break;
}
}
}
int main(void)
{
pthread_t t1, t2, t3, t4;
pthread_mutex_init(&mutex, NULL);
char *ip1 = "thread 1";
char *ip2 = "thread 2";
char *ip3 = "thread 3";
char *ip4 = "thread 4";
pthread_create(&t1, nullptr, route, ip1);
pthread_create(&t2, nullptr, route, ip2);
pthread_create(&t3, nullptr, route, ip3);
pthread_create(&t4, nullptr, route, ip4);
pthread_join(t1, nullptr);
pthread_join(t2, nullptr);
pthread_join(t3, nullptr);
pthread_join(t4, nullptr);
pthread_mutex_destroy(&mutex);
}
互斥量实现原理探究
经过上面的例子,大家已经意识到单纯的 i++ 或者 ++i 都不是原子的,有可能会有数据一致性问题
为了实现互斥锁操作,大多数体系结构都提供了swap或exchange指令,该指令的作用是把寄存器和内存单元的数据相交换,由于只有一条指令,保证了原子性,即使是多处理器平台,访问内存的 总线周期也有先后,一个处理器上的交换指令执行时另一个处理器的交换指令只能等待总线周期。 现在我们把lock和unlock的伪代码改一下
2.3 可重入vs线程安全
概念
线程安全:多个线程并发同一段代码时,不会出现不同的结果。常见的对全局变量或者静态变量进行操作,并且没有锁保护的情况下,不会出现问题
重入:同一个函数被不同的执行流调用,当前一个流程还没有执行完,就有其他的线程再次进入,我们称为重入。一个函数在重入的情况下,运行结果不会出现任何不同或者任何问题,则该函数称为可重入函数,否则就是不可重入函数。
常见的线程不安全的情况
不保护共享变量的函数
函数状态随着被调用,状态发生变化的函数
返回指向静态变量指针的函数
调用线程不安全函数的函数
常见的线程安全的情况
每个线程对全局变量或者静态变量只有读取的权限,而没有写入的权限,一般来说这些线程是安全的
类或者接口对于线程来说都是原子操作
3.常见锁概念
3.1 死锁
3.2 linux线程同步
int pthread_cond_init(pthread_cond_t *restrict cond,const pthread_condattr_t *restrict
attr);
参数:
cond:要初始化的条件变量
attr:NULL
销毁条件变量
int pthread_cond_destroy(pthread_cond_t *cond)
等待条件满足
int pthread_cond_wait(pthread_cond_t *restrict cond,pthread_mutex_t *restrict mutex);
参数:
cond:要在这个条件变量上等待
mutex:互斥量
唤醒等待
int pthread_cond_broadcast(pthread_cond_t *cond);
int pthread_cond_signal(pthread_cond_t *cond);
代码示例:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>
pthread_cond_t cond;
pthread_mutex_t mutex;
void *r1(void *arg)
{
while (1)
{
pthread_cond_wait(&cond, &mutex);
printf("活动\n");
}
}
void *r2(void *arg)
{
while (1)
{
pthread_cond_signal(&cond);
sleep(1);
}
}
int main(void)
{
pthread_t t1, t2;
pthread_cond_init(&cond, NULL);
pthread_mutex_init(&mutex, NULL);
pthread_create(&t1, NULL, r1, NULL);
pthread_create(&t2, NULL, r2, NULL);
pthread_join(t1, NULL);
pthread_join(t2, NULL);
pthread_mutex_destroy(&mutex);
pthread_cond_destroy(&cond);
}
为什么pthread_cond_wait需要互斥量
条件等待是线程间同步的一种手段,如果有一个线程,条件不满足,一直等待下去但不会满足,所以必须要有一个线程通过某些操作,改变共享变量,使原先不满足的条件变的满足,而且友好的通知等待在条件变量上的线程
条件不会无缘无故的突然变得满足了,必然会牵扯到共享数据的变化。所以一定要用互斥锁来保护,没有互斥锁就无法安全的获取和修改共享数据
按照上面的说法,我们设计出如下的代码:先上锁,发现条件不满足,解锁,然后等待在条件变量上不就
行了,如下代码
// 错误的设计
pthread_mutex_lock(&mutex);
while (condition_is_false) {
pthread_mutex_unlock(&mutex);
//解锁之后,等待之前,条件可能已经满足,信号已经发出,但是该信号可能被错过
pthread_cond_wait(&cond);
pthread_mutex_lock(&mutex);
}
pthread_mutex_unlock(&mutex);
pthread_mutex_lock(&mutex);
while (条件为假)
pthread_cond_wait(cond, mutex);
修改条件
pthread_mutex_unlock(&mutex);
pthread_mutex_lock(&mutex);
设置条件为真
pthread_cond_signal(cond);
pthread_mutex_unlock(&mutex);