从 WebAssembly 角度改进 WASI-NN | WASI-NN 系列文章2

Shun

在上一篇文章中，我们展示了如何使用 OpenVINO 构建一个道路分割的机器学习推理任务。在这个过程中，我们观察到两个有趣且值得进一步完善的工作：

在示例中使用到了 wasi-nn crate，其为 WASI-NN 提案提供了 Rust 接口实现，从而大大降低了使用 Rust 语言构建基于 WebAssembly 技术的机器学习任务的流程复杂度。不过，wasi-nn crate 提供的接口是 unsafe 的，更适合作为底层API 用于构建更高层的库。因此，我们可以基于 wasi-nn crate 创建一个提供 safe 接口的库。
在对输入图片进行预处理的时候，我们使用到了 opencv crate 。但是，因为 opencv crate 无法编译为 wasm 模块，所以就不得不将图片预处理模块独立出来，单独作为一个项目来实现。

对于上述两个观察，我们尝试做了初步的尝试：

借鉴 Rust 和 WebAssembly 社区开发者的一些尝试，我们对 wasi-nn crate 中定义的unsafe 接口进行了抽象和安全封装，构建了 wasmedge-nn crate 原型。本文的后续部分将演示如何使用 wasmedge-nn crate 替换 wasi-nn crate，重新构建上一篇文章中所使用的道路分割 Wasm 推理模块。
Rust 社区中著名的图像处理库之一 image crate 提供了我们所需的图片预处理的基本能力；此外，由于其是 Rust 原生实现，所以基于这个库来构建我们需要的图像处理库是可以编译为 wasm 模块的。

下面，我们继续使用道路分割示例，具体演示一下我们的改进方案。
wasmedge-nn crate 的安全接口
在上一篇文章中，我们已经使用了 wasi-nn crate 中定义的五个主要的接口，他们分别对应 WASI-NN 提案中的接口。我们对照着看一下改进后的接口。下图中，蓝色框图中是我们要使用的 wasmedge-nn crate 的 nn 模块中定义的接口，绿色框图为相对应的 wasi-nn crate 中定义的接口，箭头显示了它们之间的映射关系。关于 wasmedge-nn crate 的设计细节，感兴趣的同学可以先行阅读源码，后续我们会在另外一篇文章进行讨论，所以这里就不进行过多的阐述了。

基于wasmedge-nn构建wasm推理模块
接下来，我们就通过代码来展示如何使用 wasmedge-nn 提供的接口和相关数据结构，重新实现 wasm 推理模块。
下面的示例代码是使用 wasmedge-nn crate 提供的安全接口重新构建的 wasm 推理模块。通过代码中的注释，可以很容易地发现：接口的调用顺序与使用 wasi-nn 接口的调用顺序保持一致；而最明显的不同之处在于，因为 wasmedge-nn 中定义的安全接口，所以示例代码中不再有 unsafe 字样出现。正如在上一篇文章中所阐述，示例代码中所展示的接口调用顺序可以看作一个模板：如果更换一个模型来完成一个新的推理任务，下面的代码几乎不需要任何改动。感兴趣的同学可以尝试使用其它的模型来试试。下面示例的完整代码可以在这里找到。

use std::env;
use wasmedge_nn::{
  cv::image_to_bytes,
  nn::{ctx::WasiNnCtx, Dtype, ExecutionTarget, GraphEncoding, Tensor},
};
fn main() -> Result<(), Box<dyn std::error::Error>> {
  let args: Vec<String> = env::args().collect();
  let model_xml_name: &str = &args[1];
  let model_bin_name: &str = &args[2];
  let image_name: &str = &args[3];
  // 加载图片，并转换为字节序列
  println!("Load image file and convert it into tensor ...");
  let bytes = image_to_bytes(image_name.to_string(), 512, 896, Dtype::F32)?;
  
  // 创建 Tensor 实例，包括数据、维度、类型等信息
  let tensor = Tensor {
    dimensions: &[1, 3, 512, 896],
    r#type: Dtype::F32.into(),
    data: bytes.as_slice(),
  };
  
  // 创建 WASI-NN Context 实例
  let mut ctx = WasiNnCtx::new()?;
  // 加载模型文件及其它推理过程需要的配置信息
  println!("Load model files ...");
  let graph_id = ctx.load(
    model_xml_name,
    model_bin_name,
    GraphEncoding::Openvino,
    ExecutionTarget::CPU,
  )?;
  // 初始化执行环境
  println!("initialize the execution context ...");
  let exec_context_id = ctx.init_execution_context(graph_id)?;
  // 为执行环境提供输入
  println!("Set input tensor ...");
  ctx.set_input(exec_context_id, 0, tensor)?;
  // 执行推理计算
  println!("Do inference ...");
  ctx.compute(exec_context_id)?;
  // 获取推理计算的结果
  println!("Extract result ...");
  let mut out_buffer = vec![0u8; 1 * 4 * 512 * 896 * 4];
  ctx.get_output(exec_context_id, 0, out_buffer.as_mut_slice())?;
  // 导出计算结果到指定的二进制文件
  println!("Dump result ...");
  dump(
    "wasinn-openvino-inference-output-1x4x512x896xf32.tensor",
    out_buffer.as_slice(),
  )?;
  Ok(())
}

这里需要说明的是，最后导出的 .tensor 二进制文件用于后续可视化推理结果数据。由于示例代码是通过命令行来执行，在某些环境下（比如Docker）无法直接通过 API 调用展示推理结果，所以这里就只是导出推理结果。对于其他类型的推理任务，比如使用分类模型，在不需要可视化显示的情况下，就可以考虑直接打印分类结果，而无需导出到文件。作为参考，这里我们提供一段Python代码（引用自WasmEdge-WASINN-examples/openvino-road-segmentation-adas)，通过读取导出的 .tensor 文件，可视化推理结果数据。

import matplotlib.pyplot as plt
import numpy as np
# 读取保存推理结果的二进制文件，并将其转换为原始维度
data = np.fromfile("wasinn-openvino-inference-output-1x4x512x896xf32.tensor", dtype=np.float32)
print(f"data size: {data.size}")
resized_data = np.resize(data, (1,4,512,896))
print(f"resized_data: {resized_data.shape}, dtype: {resized_data.dtype}")
# 准备用于可视化的数据
segmentation_mask = np.argmax(resized_data, axis=1)
print(f"segmentation_mask shape: {segmentation_mask.shape}, dtype: {segmentation_mask.dtype}")
# 绘制并显示
plt.imshow(segmentation_mask[0])

基于 image crate 的图像预处理函数
除了提供安全的接口用于执行推理任务，通过 cv 模块，wasmedge-nn crate 提供了基本的图像预处理函数 image_to_bytes。这个函数的实现借鉴了 image2tensor 开源项目的设计，主要用于将输入图片转换为满足推理任务要求的字节序列，在后续步骤中进一步构建 Tensor 变量作为推理模块接口函数的输入。由于当前的后端仅支持 OpenVINO，图像处理的需求还比较简单，所以这个 cv 模块仅仅包含了这一个图像预处理函数。

use image::{self, io::Reader, DynamicImage};
// 将图片文件转换为特定尺寸，并转换为指定类型的字节序列
pub fn image_to_bytes(
  path: impl AsRef<Path>,
  nheight: u32,
  nwidth: u32,
  dtype: Dtype,
) -> CvResult<Vec<u8>> {
  // 读取图片
  let pixels = Reader::open(path.as_ref())?.decode()?;
  // 转换为特定的尺寸
  let dyn_img: DynamicImage = pixels.resize_exact(nwidth, nheight, image::imageops::Triangle);
  // 转换为BGR格式
  let bgr_img = dyn_img.to_bgr8();
  
  // 转换为指定类型的字节序列
  let raw_u8_arr: &[u8] = &bgr_img.as_raw()[..];
  let u8_arr = match dtype {
    Dtype::F32 => {
      // Create an array to hold the f32 value of those pixels
      let bytes_required = raw_u8_arr.len() * 4;
      let mut u8_arr: Vec<u8> = vec![0; bytes_required];
      for i in 0..raw_u8_arr.len() {
        // Read the number as a f32 and break it into u8 bytes
        let u8_f32: f32 = raw_u8_arr[i] as f32;
        let u8_bytes = u8_f32.to_ne_bytes();
        for j in 0..4 {
          u8_arr[(i * 4) + j] = u8_bytes[j];
        }
      }
      u8_arr
    }
    Dtype::U8 => raw_u8_arr.to_vec(),
  };
  Ok(u8_arr)
}

有了安全的 wasmedge-nn crate, 与支持将 OpenCV 编译成 Wasm 的图像处理库，使用 Rust 与 WebAssembly 进行 AI 推理就变得非常简单。接下来只需按照第一篇文章的说明运行 OpenVINO 模型就可以了。
总结
wasi-nn crate 为 Rust 开发者提供了基础性的底层接口，在使用 WasmEdge Runtime 内建的WASI-NN 支持的场景下，大大降低了接口调用的复杂性；在此基础之上，通过提供安全封装的接口，wasmedge-nn crate 进一步完善了推理任务的用户接口定义；同时，通过进一步的抽象，将面向推理任务的前端接口与面向推理引擎的后端接口进行了解耦，从而实现前、后端之间的松耦合。
此外，通过 cv 模块提供的、基于 image crate 的图像预处理函数，允许图像预处理模块和推理计算模块编译在同一个 Wasm模块中，从而实现从原始图像到推理任务的输入张量、再到推理计算、最后到计算结果导出的流水线化。
关于 wasmedge-nn crate 的细节，我们会在下一篇文章中进行详细阐述。感兴趣的同学也可以前往 wasmedge-nn GitHub repo 进一步了解。我们也欢迎对 WasmEdge + AI感兴趣的开发者和研究员反馈你们的意见和建议；同时，也欢迎将你们的实践经验和故事分享到我们的 WasmEdge-WASINN-examples 开源项目。谢谢！

[PHP] 从 WebAssembly 角度改进 WASI-NN | WASI-NN 系列文章2

相关帖子

基于java构造方法Vector修改元素源码分析

【安全研究】利用MS-SAMR协议修改用户密码

在 OpenHarmony 开发板上运行 WasmEdge（WebAssembly Runtime）

PHP程序员玩转Linux系列备份还原MySQL

PHP程序员玩转Linux系列自动备份与SVN

PHP程序员玩转Linux系列 CentOS安装使用教程

聊聊Netty那些事儿之从内核角度看IO模型

CPU是海王？聊聊主/子线程和同/异步的关系

很多人问1GB是多少兆流量啊我告诉你

HMS Core分析服务助您掌握用户分层密码，实现整体收益提升

Shun LV3