9.2.3 NetlinkManager模块分析

在Vold代码中,使用NM模块的流程是:

调用Instance创建一个NM对象。

调用setBroadcaster设置CL对象。

调用start启动NM。

接下来,按这三个步骤来分析NM模块。

1.创建NM

Vold调用Instance函数创建了一个NM对象。看到Instance这个函数,读者应能想到,这里可能是采用了单例模式。来看是否如此,代码如下所示。


[—>NetlinkManager.cpp]

NetlinkManager*NetlinkManager:Instance(){

if(!sInstance)

sInstance=new NetlinkManager();//果然是单例模式。

return sInstance;

}


NM的创建真是非常简单。再看第二个被调用的函数setBroadcaster。

2.setBroadcaster分析

setBroadcaster就更简单了,它的实现在NetlinkManager类的声明中,如下所示:


[—>NetlinkManager.h]

void setBroadcaster(SocketListener*sl){mBroadcaster=sl;}


setBroadcaster参数中的那个sl其实际类型为CommandListener。需要说明的是,虽然NM设置了CL对象,但Vold的NM并没有通过CL发送消息和接收命令,所以在图9-1中,NM模块和CL模块并没有连接线,这一点务必注意。

下面看最后一个函数start。

3.start分析

前面说过,NM模块将使用Netlink和Kernel进行IPC通信,那么它是怎么做到的呢?来看代码,如下所示:


[—>NetlinkManager.cpp]

int NetlinkManager:start(){

//PF_NETLINK使用的socket地址结构是sockaddr_nl,而不是一般的sockaddr_in。

struct sockaddr_nl nladdr;

int sz=64*1024;

memset(&nladdr,0,sizeof(nladdr));

nladdr.nl_family=AF_NETLINK;

nladdr.nl_pid=getpid();//设置自己的进程pid。

nladdr.nl_groups=0xffffffff;

/*

创建PF_NETLINK地址簇的socket,目前只支持SOCK_DGRAM类型,第三个参数。

NETLINK_KOBJECT_UEVENT表示要接收内核的Uevent事件。

*/

if((mSock=socket(PF_NETLINK,

SOCK_DGRAM,NETLINK_KOBJECT_UEVENT))<0){

……

return-1;

}

//设置Socket接收缓冲区大小。

if(setsockopt(mSock,SOL_SOCKET,SO_RCVBUFFORCE,&sz,sizeof(sz))<0){

……

return-1;

}

//必须对该socket执行bind操作。

if(bind(mSock,(struct sockaddr*)&nladdr,sizeof(nladdr))<0){

……

return-1;

}

//创建一个NetlinkHandler对象,并把创建好的Socket句柄传给它。

mHandler=new NetlinkHandler(mSock);

//调用NetlinkHandler对象的start。

if(mHandler->start()){

SLOGE("Unable to start NetlinkHandler:%s",strerror(errno));

return-1;

}

return 0;

}


从代码上看,NM的start函数分为两个步骤:

创建地址簇为PF_NETLINK类型的socket并做一些设置,这样NM就能和Kernel通信了。关于Netlink的使用技巧网上有很多资料,读者可在Linux系统上通过man netlink命令来查询相关信息。

创建NetlinkHandler对象,并调用它的start。看来,后续工作都是由NetlinkHandler完成的。

根据上文的分析可看出,NetlinkHandler才是真正的主角,下面就来分析它。为了书写方便,我们将NetlinkHandler简称为NLH。

4.NetlinkHandler分析

(1)创建NLH

在代码结构简单的Vold程序中,NetlinkHandler有一个相对不简单的派生关系,如图9-2所示:

直接看代码,来认识这个NLH:


[—>NetlinkHandler.cpp]

NetlinkHandler:NetlinkHandler(int listenerSocket):

NetlinkListener(listenerSocket){

//调用基类NetlinkListener的构造函数。注意传入的参数是和Kernel通信的socket。//句柄。注意,文件描述符和句柄表示的是同一个东西,这里不再区分二者。

}


9.2.3 NetlinkManager模块分析 - 图1

图 9-2 NLH的派生关系图

再看基类NetlinkListener的构造函数,如下所示:


[—>NetlinkListener.cpp]

NetlinkListener:NetlinkListener(int socket):

SocketListener(socket,false){

//调用基类SocketListener的构造函数,第二个参数为false。

}


基类SocketListener的构造函数是:


[—>SocketListener.cpp]

SocketListener:SocketListener(int socketFd,bool listen){

mListen=listen;//这个参数是false。

mSocketName=NULL;

mSock=socketFd;//保存和Kernel通信的socket描述符。

//初始化一个mutex,看来会有多个线程存在。

pthread_mutex_init(&mClientsLock,NULL);

/*

SocketClientCollection的声明如下,它是一个列表容器。

typedef android:List<SocketClient*>SocketClientCollection

其中,SocketClient代表和Socket服务端通信的客户端。

*/

mClients=new SocketClientCollection();

}


NLH的创建分析完了。此过程中没有什么新鲜内容。下面看它的start函数。

注意 本章内容会大量涉及Socket,所以读者应先了解与Socket有关的知识,如果需要深入研究,建议阅读《Unix Networking Programming Volume I》一书。

(2)start分析

在分析前面的代码时,曾看到NetlinkHandler会创建一个同步互斥对象,这表明NLH会在多线程环境中使用,那么这个线程会在哪里创建呢?来看start的代码,如下所示:


[—>NetlinkHandler.cpp]

int NetlinkHandler:start(){

return this->startListener();//startListener由SocketListener实现。

}

[—>SocketListener.cpp]

int SocketListener:startListener(){

if(!mSocketName&&mSock==-1){

errno=EINVAL;

return-1;

}else if(mSocketName){

if((mSock=android_get_control_socket(mSocketName))<0){

return-1;

}

}

/*

还记得构造NLH时的参数吗?mListen为false,这表明NLH不是监听(listen)端。这里为了代码和操作的统一,用mSock做参数构造了一个SocketClient对象,并加入到mClients列表中了,但这个SocketClient并不是真实客户端的代表。

*/

if(mListen&&listen(mSock,4)<0){

……

return-1;

}else if(!mListen)//以mSock为参数构造SocketClient对象,并加入到对应的列表中。

mClients->push_back(new SocketClient(mSock));

/*

pipe系统调用将创建一个匿名管道,mCtrlPipe是一个int类型的二元数组。

其中mCtrlPipe[0]用于从管道读数据,mCtrlPipe[1]用于往管道写数据。

*/

if(pipe(mCtrlPipe)){

……

return-1;

}

//创建一个工作线程,线程函数是threadStart。

if(pthread_create(&mThread,NULL,SocketListener:threadStart,this)){

……

return-1;

}

return 0;

}


如果熟悉Socket编程,理解上面的代码就非常容易了。下面来看NLH的工作线程。

(3)工作线程分析

工作线程的线程函数threadStart的代码如下所示:


[—>SocketListener.cpp]

voidSocketListener:threadStart(voidobj){

SocketListenerme=reinterpret_cast<SocketListener>(obj);

me->runListener();//调用runListener。

pthread_exit(NULL);

return NULL;

}

//直接分析runListener。

void SocketListener:runListener(){

while(1){

SocketClientCollection:iterator it;

fd_set read_fds;

int rc=0;

int max=0;

FD_ZERO(&read_fds);

if(mListen){//mListen为false,所以不走这个if分支。

max=mSock;

FD_SET(mSock,&read_fds);

}

/*

计算max,为什么要有这个操作?这是由select函数决定的,它的第一个参数的取值。

必须为它所监视的文件描述符集合中最大的文件描述符加1。

*/

FD_SET(mCtrlPipe[0],&read_fds);

if(mCtrlPipe[0]>max)

max=mCtrlPipe[0];

//还是计算fd值最大的那个。

pthread_mutex_lock(&mClientsLock);

for(it=mClients->begin();it!=mClients->end();++it){

FD_SET((*it)->getSocket(),&read_fds);

if((*it)->getSocket()>max)

max=(*it)->getSocket();

}

pthread_mutex_unlock(&mClientsLock);

/*

注意select函数的第一个参数,为max+1。读者可以通过man select来查询select的用法。注意,在Windows平台上的select对第一个参数没有要求。

*/

if((rc=select(max+1,&read_fds,NULL,NULL,NULL))<0){

sleep(1);

continue;

}else if(!rc)

continue;

//如果管道可读的话,表示需要退出工作线程。

if(FD_ISSET(mCtrlPipe[0],&read_fds))

break;

if(mListen&&FD_ISSET(mSock,&read_fds)){

//如果是listen端的话,mSock可读表示有客户端connect上。

struct sockaddr addr;

socklen_t alen=sizeof(addr);

int c;

//调用accept接受客户端的连接,返回用于和客户端通信的Socket描述符。

if((c=accept(mSock,&addr,&alen))<0){

SLOGE("accept failed(%s)",strerror(errno));

sleep(1);

continue;

}

pthread_mutex_lock(&mClientsLock);

//根据返回的客户端Socket描述符构造一个SocketClient对象,并加入到对应的list中。

mClients->push_back(new SocketClient(c));

pthread_mutex_unlock(&mClientsLock);

}

do{

pthread_mutex_lock(&mClientsLock);

for(it=mClients->begin();it!=mClients->end();++it){

int fd=(*it)->getSocket();

if(FD_ISSET(fd,&read_fds)){

pthread_mutex_unlock(&mClientsLock);

/*

有数据通过Socket发送过来,所以调用onDataAvailable进行处理。

如果在onDataAvailable返回false,则表示需要关闭该连接。

*/

if(!onDataAvailable(*it)){

close(fd);

pthread_mutex_lock(&mClientsLock);

delete*it;

it=mClients->erase(it);

pthread_mutex_unlock(&mClientsLock);

}

FD_CLR(fd,&read_fds);

continue;

}

}

pthread_mutex_unlock(&mClientsLock);

}while(0);

}

}


从代码中可看到:

工作线程退出的条件是匿名管道可读,但在一般情况下它不需要退出,所以可以忽略此项内容。

不论是服务端还是客户端,收到数据后都会调用onDataAvailable进行处理。

下面就来看NLH的数据处理。

(4)数据处理

根据前面的分析可知,收到数据后首先会调用onDataAvailable函数进行处理,这个函数由NLH的基类NetlinkListener实现。代码如下所示:

[—>NetlinkListener]

bool NetlinkListener::onDataAvailable(SocketClient*cli)

{

int socket=cli->getSocket();

int count;

/*

调用recev接收数据,如果接收错误,则返回false,这样这个socket在上面的工作线程中就会被close。

*/

if((count=recv(socket,mBuffer,sizeof(mBuffer),0))<0){

SLOGE("recv failed(%s)",strerror(errno));

return false;

}

//new一个NetlinkEvent,并调用decode来解析接收到的Uevent数据。

NetlinkEvent*evt=new NetlinkEvent();

if(!evt->decode(mBuffer,count)){

goto out;

}

//调用onEvent,并传递NetlinkEvent对象。

onEvent(evt);

out:

delete evt;

return true;

}

decode函数就是将收到的Uevent信息填充到一个NetlinkEvent对象中,例如Action是什么,SUBSYSTEM是什么等,以后处理Uevent时就不用再解析字符串了来。

来看onEvent函数,此函数是由NLH自己实现的,代码如下所示:


[—>NetlinkHandler.cpp]

void NetlinkHandler:onEvent(NetlinkEvent*evt){

VolumeManager*vm=VolumeManager:Instance();

const char*subsys=evt->getSubsystem();

if(!subsys){

return;

}

if(!strcmp(subsys,“block”)){

vm->handleBlockEvent(evt);//调用VM的handleBlockEvent。

}else if(!strcmp(subsys,"switch")){

vm->handleSwitchEvent(evt);//调用VM的handleSwitchEvent。

}else if(!strcmp(subsys,"battery")){

//这两个事件和外部存储系统没有关系,所以不处理。

}else if(!strcmp(subsys,"power_supply")){

}

}


NLH的工作已介绍完,下面总结一下NM模块的工作。

5.关于NM模块的总结

NM模块的功能就是从Kernel接收Uevent消息,然后转换成一个NetlinkEvent对象,最后会调用VM的处理函数来处理这个NetlinkEvent对象。