14.2 共享内存
共享内存是3个IPC机制中的第二个。它允许两个不相关的进程访问同一个逻辑内存。共享内存是在两个正在运行的进程之间传递数据的一种非常有效的方式。虽然X/Open标准并没有对它做出要求,但大多数共享内存的具体实现,都把由不同进程之间共享的内存安排为同一段物理内存。
共享内存是由IPC为进程创建的一个特殊的地址范围,它将出现在该进程的地址空间中。其他进程可以将同一段共享内存连接到它们自己的地址空间中。所有进程都可以访问共享内存中的地址,就好像它们是由malloc分配的一样。如果某个进程向共享内存写入了数据,所做的改动将立刻被可以访问同一段共享内存的任何其他进程看到。
共享内存为在多个进程之间共享和传递数据提供了一种有效的方式。由于它并未提供同步机制,所以我们通常需要用其他的机制来同步对共享内存的访问。我们一般是用共享内存来提供对大块内存区域的有效访问,同时通过传递小消息来同步对该内存的访问。
在第一个进程结束对共享内存的写操作之前,并无自动的机制可以阻止第二个进程开始对它进行读取。对共享内存访问的同步控制必须由程序员来负责。图14-2显示了共享内存是如何工作的。
图 14-2
图中的箭头显示了每个进程的逻辑地址空间到可用物理内存的映射关系。实际情况要比图中显示的更加复杂,因为可用内存实际上由物理内存和已交换到磁盘上的内存页面混合组成。
共享内存使用的函数类似于信号量的函数,它们的定义如下:
与信号量的情况一样,头文件sys/types.h和sys/ipc.h通常被shm.h自动包含进程序。
14.2.1 shmget函数
我们用shmget函数来创建共享内存:
与信号量一样,程序需要提供一个参数key,它有效地为共享内存段命名,shmget函数返回一个共享内存标识符,该标识符将用于后续的共享内存函数。有一个特殊的键值IPC_PRIVATE,它用于创建一个只属于创建进程的共享内存。通常你不会用到这个值,而且你可能会发现在一些Linux系统中,私有的共享内存其实并不是真正的私有。
第二个参数size以字节为单位指定需要共享的内存容量。
第三个参数shmflg包含9个比特的权限标志,它们的作用与创建文件时使用的mode标志一样。由IPC_CREAT定义的一个特殊比特必须和权限标志按位或才能创建一个新的共享内存段。设置IPC_CREAT标志的同时,给shmget函数传递一个已有共享内存段的键并不是一个错误,如果无需用到IPC_CREAT标志,该标志就会被悄悄地忽略掉。
权限标志对共享内存非常有用,因为它们允许一个进程创建的共享内存可以被共享内存的创建者所拥有的进程写入,同时其他用户创建的进程只能读取该共享内存。我们可以利用这个功能来提供一种有效的对数据进行只读访问的方法,通过将数据放入共享内存并设置它的权限,就可以避免数据被其他用户修改。
如果共享内存创建成功,shmget返回一个非负整数,即共享内存标识符;如果失败,就返回-1。
14.2.2 shmat函数
第一次创建共享内存段时,它不能被任何进程访问。要想启用对该共享内存的访问,必须将其连接到一个进程的地址空间中。这项工作由shmat函数来完成,它的定义如下所示:
第一个参数shm_id是由shmget返回的共享内存标识符。
第二个参数shm_addr指定的是共享内存连接到当前进程中的地址位置。它通常是一个空指针,表示让系统来选择共享内存出现的地址。
第三个参数shmflg是一组位标志。它的两个可能取值是SHM_RND(这个标志与shm_addr联合使用,用来控制共享内存连接的地址)和SHM_RDONLY(它使得连接的内存只读)。我们很少需要控制共享内存连接的地址,通常都是让系统来选择一个地址,否则就会使应用程序对硬件的依赖性过高。
如果shmat调用成功,它返回一个指向共享内存第一个字节的指针;如果失败,它就返回-1。
共享内存的读写权限由它的属主(共享内存的创建者)、它的访问权限和当前进程的属主决定。共享内存的访问权限类似于文件的访问权限。
这个规则的一个例外是,当shmflg & SHM_RDONLY为true时的情况。此时即使该共享内存的访问权限允许写操作,它都不能被写入。
14.2.3 shmdt
shmdt函数的作用是将共享内存从当前进程中分离。它的参数是shmat返回的地址指针。成功时它返回0,失败时返回-1。注意,将共享内存分离并未删除它,只是使得该共享内存对当前进程不再可用。
14.2.4 shmctl
与复杂的信号量控制函数相比,共享内存的控制函数(非常感谢)要稍微简单一些。它的定义如下所示:
shmid_ds结构至少包含以下成员:
第一个参数shm_id是shmget返回的共享内存标识符。
第二个参数command是要采取的动作,它可以取3个值,如表14-2所示。
第三个参数buf是一个指针,它指向包含共享内存模式和访问权限的结构。
成功时返回0,失败时返回-1。X/Open规范没有定义当你试图删除一个正处于连接状态的共享内存段时将会发生的情况。通常这个已经被删除的处于连接状态的共享内存段还能继续使用,直到它从最后一个进程中分离为止。但因为这个行为并未在规范中定义,所以最好不要依赖它。
实 验 共享内存
介绍完共享内存函数后,我们可以编写一些代码来使用它们。在这个实验中,我们将编写一对程序shm1.c和shm2.c。第一个程序(消费者)将创建一个共享内存段,然后把写到它里面的数据都显示出来。第二个程序(生产者)将连接一个已有的共享内存段,并允许我们向其中输入数据。
(1)我们首先创建一个公共的头文件,来定义我们希望分发的共享内存。我们将其命名为shm_com.h:
这里定义的结构在消费者和生产者程序中都会用到。当有数据写入这个结构时,我们用该结构中的一个整型标志written_by_you来通知消费者。需要传输的文本长度2K是由我们随意决定的。
(2)第一个程序shm1.c是消费者程序。在头文件之后,通过设置了IPC_CREAT标志位的shmget调用来创建共享内存段(其长度就是我们的共享内存结构的长度):
(3)现在,让程序可以访问这个共享内存:
(4)程序的下一部分将shared_memory分配给shared_stuff,然后它输出written_by_you中的文本。循环将一直执行到在written_by_you中找到end字符串为止。sleep调用强迫消费者程序在临界区域多待一会儿,让生产者程序等待:
(5)最后,共享内存被分离,然后被删除:
(6)第二个程序shm2.c是生产者程序,我们通过它向消费者程序输入数据。它与shm1.c很相似,程序代码如下所示:
运行这些程序时,我们将看到如下所示的样本输出:
实验解析
第一个程序shm1创建共享内存段,然后将它连接到自己的地址空间中。我们在共享内存的开始处使用了一个结构shared_use_st。该结构中有个标志written_by_you,当共享内存中有数据写入时,就设置这个标志。这个标志被设置时,程序就从共享内存中读取文本,将它打印出来,然后清除这个标志表示已经读完数据。我们用一个特殊字符串end来退出循环。接下来,程序分离共享内存段并删除它。
第二个程序shm2使用相同的键1234来取得并连接同一个共享内存段。然后它提示用户输入一些文本。如果标志written_by_you被设置,shm2就知道客户进程还未读完上一次的数据,因此就继续等待。当其他进程清除了这个标志后,shm2写入新数据并设置该标志。它还使用字符串end来终止并分离共享内存段。
注意,我们只能提供自己的、非常简陋的同步标志written_by_you,它包括一个非常缺乏效率的忙等待(不停地循环)。这可以使得我们的示例比较简单,但在实际编程中,我们应该使用信号量或通过传递消息(使用管道或IPC消息,后者我们在下一节就会谈到)、生成信号(在第11章介绍的)的方法来提供应用程序读、写部分之间的一种更有效率的同步机制。