基本概念
LiteIPC是OpenHarmony LiteOS-A内核提供的一种新型IPC(Inter-Process Communication,即进程间通信)机制,为轻量级进程间通信组件,为面向服务的系统服务框架提供进程间通信能力,分为内核实现和用户态实现两部分,其中内核实现完成进程间消息收发、IPC内存管理、超时通知和死亡通知等功能;用户态提供序列化和反序列化能力,并完成IPC回调消息和死亡消息的分发。
我们主要讲解内核态实现部分,本想一篇说完,但发现它远比想象中的复杂和重要,所以分两篇说,通讯内容和通讯机制。通讯的内容就是消息,围绕着消息展开的结构体多达10几个,捋不清它们之间的关系肯定是搞不懂通讯的机制,所以咱们得先搞清楚关系再说流程。下图是笔者读完LiteIPC模块后绘制的消息封装图,可以说LiteIPC是内核涉及结构体最多的模块,请消化理解,本篇将围绕它展开。
系列篇多次提过,内核的每个模块都至少围绕着一个重要结构体展开,抓住了它顺瓜摸藤就能把细节抹的清清楚楚,于LiteIPC,这个结构体就是IpcMsg 。
运行机制
typedef struct {//IPC 消息结构体
MsgType type; /**< cmd type, decide the data structure below | 命令类型,决定下面的数据结构*/
SvcIdentity target; /**< serviceHandle or targetTaskId, depending on type | 因命令类型不同而异*/
UINT32 code; /**< service function code | 服务功能代码*/
UINT32 flag;///< 标签
#if (USE_TIMESTAMP == 1)
UINT64 timestamp;///< 时间戳,用于验证
#endif
UINT32 dataSz; /**< size of data | 消息内容大小*/
VOID *data;///< 消息的内容,真正要传递的消息,这个数据内容是指spObjNum个数据的内容,定位就靠offsets
UINT32 spObjNum;///< 对象数量, 例如 spObjNum = 3时,offsets = [0,35,79],代表从data中读取 0 - 35给第一个对象,依次类推
VOID *offsets;///< 偏移量,注意这里有多少个spObjNum就会有多少个偏移量,详见 CopyDataFromUser 来理解
UINT32 processID; /**< filled by kernel, processId of sender/reciever | 由内核提供,发送/接收消息的进程ID*/
UINT32 taskID; /**< filled by kernel, taskId of sender/reciever | 由内核提供,发送/接收消息的任务ID*/
#ifdef LOSCFG_SECURITY_CAPABILITY
UINT32 userID;///< 用户ID
UINT32 gid;///< 组ID
#endif
} IpcMsg; 解读
- 第一个type,通讯的本质就是你来我往,异常当然也要考虑
typedef enum {
MT_REQUEST,///< 请求
MT_REPLY,///< 回复
MT_FAILED_REPLY,///< 回复失败
MT_DEATH_NOTIFY,///< 通知死亡
MT_NUM
} MsgType;
- 第二个target,LiteIPC中有两个主要概念,一个是ServiceManager,另一个是Service。整个系统只能有一个ServiceManager,而Service可以有多个。ServiceManager有两个主要功能:一是负责Service的注册和注销,二是负责管理Service的访问权限(只有有权限的任务Task可以向对应的Service发送IPC消息)。首先将需要接收IPC消息的任务通过ServiceManager注册成为一个Service,然后通过ServiceManager为该Service任务配置访问权限,即指定哪些任务可以向该Service任务发送IPC消息。LiteIPC的核心思想就是在内核态为每个Service任务维护一个IPC消息队列,该消息队列通过LiteIPC设备文件向上层用户态程序分别提供代表收取IPC消息的读操作和代表发送IPC消息的写操作。
/// SVC(service)服务身份证
typedef struct {
UINT32 handle; //service 服务ID, 范围[0,最大任务ID]
UINT32 token;//由应用层带入
UINT32 cookie;//由应用层带入
} SvcIdentity;
- code,timestamp由应用层设定,用于确保回复正确有效,详见CheckRecievedMsg
- dataSz,data,spObjNum,offsets这四个需连在一起理解,是重中之重。其实消息又分成三种类型(对象)
typedef enum {
OBJ_FD,///< 文件句柄
OBJ_PTR,///< 指针
OBJ_SVC///< 服务,用于设置权限
} ObjType;
typedef union {
UINT32 fd; ///< 文件描述符
BuffPtr ptr;///< 缓存的开始地址,即:指针,消息从用户空间来时,要将内容拷贝到内核空间
SvcIdentity svc;///< 服务,用于设置访问权限
} ObjContent;
typedef struct { // IpcMsg->data 包含三种子消息,也要将它们读到内核空间
ObjType type; ///< 类型
ObjContent content;///< 内容
} SpecialObj; 这三种对象都打包在data中,总长度是dataSz,spObjNum表示个数,offsets是个整型数组,标记了对应第几个对象在data中的位置,这样就很容易从data读到对象的数据。 UINT32 fd类型对象通讯的实现是通过两个进程间共享同一个fd来实现通讯,具体实现函数为HandleFd。/// 按句柄方式处理, 参数 processID 往往不是当前进程
LITE_OS_SEC_TEXT STATIC UINT32 HandleFd(UINT32 processID, SpecialObj *obj, BOOL isRollback)
{
int ret;
if (isRollback == FALSE) { // 不回滚
ret = CopyFdToProc(obj->content.fd, processID);//目的是将两个不同进程fd都指向同一个系统fd,共享FD的感觉
if (ret < 0) {//返回 processID 的 新 fd
return ret;
}
obj->content.fd = ret; // 记录 processID 的新FD, 可用于回滚
} else {// 回滚时关闭进程FD
ret = CloseProcFd(obj->content.fd, processID);
if (ret < 0) {
return ret;
}
} SvcIdentity svc用于设置进程<->任务之间彼此访问权限,具体实现函数为HandleSvc。/// 按服务的方式处理,此处推断 Svc 应该是 service 的简写 @note_thinking
LITE_OS_SEC_TEXT STATIC UINT32 HandleSvc(UINT32 dstTid, const SpecialObj *obj, BOOL isRollback)
{
UINT32 taskID = 0;
if (isRollback == FALSE) {
if (IsTaskAlive(obj->content.svc.handle) == FALSE) {
PRINT_ERR("Liteipc HandleSvc wrong svctid\n");
return -EINVAL;
}
if (HasServiceAccess(obj->content.svc.handle) == FALSE) {
PRINT_ERR("Liteipc %s, %d\n", __FUNCTION__, __LINE__);
return -EACCES;
}
if (GetTid(obj->content.svc.handle, &taskID) == 0) {//获取参数消息服务ID所属任务
if (taskID == OS_PCB_FROM_PID(OS_TCB_FROM_TID(taskID)->processID)->ipcInfo->ipcTaskID) {//如果任务ID一样,即任务ID为ServiceManager
AddServiceAccess(dstTid, obj->content.svc.handle);
}
}
}
return LOS_OK;
} BuffPtr ptr 是通过指针传值,具体实现函数为HandlePtr,对应结构体为BuffPtr。typedef struct {
UINT32 buffSz; ///< 大小
VOID *buff;///< 内容 内核需要将内容从用户空间拷贝到内核空间的动作
} BuffPtr;
/// 按指针方式处理
LITE_OS_SEC_TEXT STATIC UINT32 HandlePtr(UINT32 processID, SpecialObj *obj, BOOL isRollback)
{
VOID *buf = NULL;
UINT32 ret;
if ((obj->content.ptr.buff == NULL) || (obj->content.ptr.buffSz == 0)) {
return -EINVAL;
}
if (isRollback == FALSE) {
if (LOS_IsUserAddress((vaddr_t)(UINTPTR)(obj->content.ptr.buff)) == FALSE) { // 判断是否为用户空间地址
PRINT_ERR("Liteipc Bad ptr address\n"); //不在用户空间时
return -EINVAL;
}
buf = LiteIpcNodeAlloc(processID, obj->content.ptr.buffSz);//在内核空间分配内存接受来自用户空间的数据
if (buf == NULL) {
PRINT_ERR("Liteipc DealPtr alloc mem failed\n");
return -EINVAL;
}
ret = copy_from_user(buf, obj->content.ptr.buff, obj->content.ptr.buffSz);//从用户空间拷贝数据到内核空间
if (ret != LOS_OK) {
LiteIpcNodeFree(processID, buf);
return ret;
}//这里要说明下 obj->content.ptr.buff的变化,虽然都是用户空间的地址,但第二次已经意义变了,虽然数据一样,但指向的是申请经过拷贝后的内核空间
obj->content.ptr.buff = (VOID *)GetIpcUserAddr(processID, (INTPTR)buf);//获取进程 processID的用户空间地址,如此用户空间操作buf其实操作的是内核空间
EnableIpcNodeFreeByUser(processID, (VOID *)buf);//创建一个IPC节点,挂到可使用链表上,供读取
} else {
(VOID)LiteIpcNodeFree(processID, (VOID *)GetIpcKernelAddr(processID, (INTPTR)obj->content.ptr.buff));//在内核空间释放IPC节点
}
return LOS_OK;
}
- processID和taskID则由内核填充,应用层是感知不到进程和任务的,暴露给它是服务ID,SvcIdentity.handle,上层使用时只需向服务发送/读取消息,而服务是由内核创建,绑定在任务和进程上。所以只要有服务ID就能查询到对应的进程和任务ID。
- userID和gid涉及用户和组安全模块,请查看系列相关篇。
进程和任务
再说两个结构体 ProcIpcInfo,IpcTaskInfo LiteIPC实现的是进程间的通讯,所以在进程控制块中肯定有它的位置存在,即:ProcIpcInfo。
typedef struct {
IpcPool pool;///< ipc内存池,IPC操作所有涉及内核空间分配的内存均有此池提供
UINT32 ipcTaskID;///< 指定能ServiceManager的任务ID
LOS_DL_LIST ipcUsedNodelist;///< 已使用节点链表,上面挂 IpcUsedNode 节点, 申请IpcUsedNode的内存来自内核堆空间
UINT32 access[LOSCFG_BASE_CORE_TSK_LIMIT];///< 允许进程通过IPC访问哪些任务
} ProcIpcInfo; 而进程只是管家,真正让内核忙飞的是任务,在任务控制块中也应有LiteIPC一席之地,即:IpcTaskInfo。
typedef struct {
LOS_DL_LIST msgListHead;///< 上面挂的是一个个的 ipc节点 上面挂 IpcListNode,申请IpcListNode的内存来自进程IPC内存池
BOOL accessMap[LOSCFG_BASE_CORE_TSK_LIMIT]; ///< 此处是不是应该用 LOSCFG_BASE_CORE_PROCESS_LIMIT ? @note_thinking
///< 任务是否可以给其他进程发送IPC消息
} IpcTaskInfo; 两个结构体不复杂,把发送/回复的消息挂到对应的链表上,并提供进程<->任务间彼此访问权限功能access,accessMap,由谁来设置权限呢 ? 上面已经说过了是 HandleSvc。
IPC内存池
还有最后一个结构体IpcPool,
typedef struct {//用户空间和内核空间的消息传递通过偏移量计算
VOID *uvaddr;///< 用户空间地址,由kvaddr映射而来的地址,这两个地址的关系一定要搞清楚,否则无法理解IPC的核心思想
VOID *kvaddr;///< 内核空间地址,IPC申请的是内核空间,但是会通过 DoIpcMmap 将这个地址映射到用户空间
UINT32 poolSize; ///< ipc池大小
} IpcPool; 它是LiteIPC实现通讯机制的基础,是内核设计很巧妙的地方,实现了在用户态读取内核态数据的功能。请想想它是如何做到的 ?
百万注源码 | 处处扣细节
- 百万汉字注解内核目的是要看清楚其毛细血管,细胞结构,等于在拿放大镜看内核。内核并不神秘,带着问题去源码中找答案是很容易上瘾的,你会发现很多文章对一些问题的解读是错误的,或者说不深刻难以自圆其说,你会慢慢形成自己新的解读,而新的解读又会碰到新的问题,如此层层递进,滚滚向前,拿着放大镜根本不愿意放手。
|