在一些视频聊天软件中，我们可以看到很多人的背景特别漂亮，甚至我们怀疑他们是否真的来到了某个地方。本期我们将介绍Mediapipe人像分割(RVM人像分割)。

MediaPipe自拍分割分割场景中的突出角色。它可以在智能手机和笔记本电脑上实时运行。

模型

在这个解决方案中，MediaPipe提供了两种模型：通用模型和景观模型。这两款车型都是基于美孚ETV 3号，并已修改，以提高效率。通用模型在256x256x3 (HWC)张量上运行，并输出代表分区掩码的256x256x1张量。景观模型类似于一般模型，但运行在144x256x3 (HWC)张量上。它的FLOP比一般型号少，所以运行速度更快。请注意，在将输入图像输入到ML模型之前，媒体管道自分割会自动将输入图像的大小调整到所需的张量维度。

代码实现

导入cv2

将mediapipe作为mp导入

将numpy作为np导入

MP _ drawing=MP . solutions . drawing _ utils

mp _自拍_分段=mp.solutions .自拍_分段

#图片字符抠图：

IMAGE_FILES=[]

BG_COLOR=(0，255，0) #其他照片也可以作为背景色，要求与原照片大小相同。

#bg_image=cv2.imread('6.jpg ')

MASK_COLOR=(255，255，255) # mask图片颜色

文件='1.jpg '

带mp _自拍_分段。自拍分割(模型选择=0)为自拍分割：

image=cv2.imread(文件)

image_height，image_width，_=image.shape

#图片在处理前需要转换到RGB色彩空间。

image=cv2.cvtColor(image，cv2。颜色_BGR2RGB)

结果=自拍_分割.过程(图像)

#在背景图像上绘制分割图

#为了改善边界周围的分割，我们可以考虑在结果中进行双边滤波。

条件=NP . stack((results . segmentation _ mask)，* 3，axis=-1) 0.1

#生成纯色图像和白色蒙版图。

#fg_image=np.zeros(image.shape，dtype=np.uint8)

#fg_image[:]=MASK_COLOR

fg_image=cv2.cvtColor(image，cv2。COLOR_RGB2BGR)

bg_image=np.zeros(image.shape，dtype=np.uint8)

bg_image[:]=BG_COLOR

output_image=np.where(条件，fg_image，bg_image)

cv2.imshow('output_image '，output_image)

cv2.waitKey(0)

# cv2.imwrite ('selfie0.png '，output _ image)首先加载所需的第三方库。

BG_COLOR是纯色背景的RGB值。

MASK_COLOR是人像抠图的蒙版值，一般设置为纯白。

模型选择=0模型选择，可选参数(0，1)

然后可以使用cv2.imread函数加载需要分段的图片，将色彩空间转换为RGB模式。预处理后的图片可以直接输入自拍_分割。处理(图像)功能来分割人像。

对于边缘分割，NP。stack((结果。segmentation _ mask，)* 3，axis=-1) 0.1如果最终参数更小，包含更多边，可以自己尝试。

Fg_image图片我们需要将图片绘制再次转换到BGR空间，使用np.where函数将人像区域与背景图片融合，最终呈现出抠图后的效果。

当然，有时候我们需要一个背景图来代替它。这里我们修改原始代码。

导入cv2

将mediapipe作为mp导入

将numpy作为np导入

mp_drawing=mp.sol

utions.drawing_utils mp_selfie_segmentation = mp.solutions.selfie_segmentation # 图片人物抠图: IMAGE_FILES = [] #BG_COLOR = (0, 255, 0) # 背景颜色也可以使用其他的照片，要求与原照片尺寸一致 bg_image = cv2.imread('6.jpg') MASK_COLOR = (255, 255, 255) # mask图片颜色 file = '1.jpg' with mp_selfie_segmentation.SelfieSegmentation(model_selection=0) as selfie_segmentation: image = cv2.imread(file) image_height, image_width, _ = image.shape # 在处理之前需要转换图片到RGB颜色空间 image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) results = selfie_segmentation.process(image) # 在背景图像上绘制分割图 #为了改善边界周围的分割，可以考虑在 results.segmentation_mask进行双边过滤 condition = np.stack((results.segmentation_mask,) * 3, axis=-1) > 0.1 #生成纯色图像,白色的mask图纸 #fg_image = np.zeros(image.shape, dtype=np.uint8) #fg_image[:] = MASK_COLOR fg_image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR) #bg_image = np.zeros(image.shape, dtype=np.uint8) #bg_image[:] = BG_COLOR output_image = np.where(condition, fg_image, bg_image) cv2.imshow('output_image',output_image) cv2.waitKey(0) cv2.imwrite('selfie00.png', output_image)

运行代码的效果

实时视频分割

import cv2 import mediapipe as mp import numpy as np mp_drawing = mp.solutions.drawing_utils mp_selfie_segmentation = mp.solutions.selfie_segmentation BG_COLOR = (192, 192, 192) # gray cap = cv2.VideoCapture(0) cv2.waitKey(2000) bg_image = cv2.imread('6.jpg') with mp_selfie_segmentation.SelfieSegmentation(model_selection=1) as selfie_segmentation: while cap.isOpened(): success, image = cap.read() print(image.shape()) if not success: print("Ignoring empty camera frame.") continue image = cv2.cvtColor(cv2.flip(image, 1), cv2.COLOR_BGR2RGB) image.flags.writeable = False results = selfie_segmentation.process(image) image.flags.writeable = True image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR) condition = np.stack((results.segmentation_mask,) * 3, axis=-1) > 0.1 if bg_image is None: bg_image = np.zeros(image.shape, dtype=np.uint8) bg_image[:] = BG_COLOR output_image = np.where(condition, image, bg_image) cv2.imshow('MediaPipe Selfie Segmentation', output_image) if cv2.waitKey(5) & 0xFF == 27: break cap.release()

视频实时分割的代码结构跟图片分割类似，主要需要注意的是打开摄像头后，会自动有一个cap的图纸尺寸，这里我们读取的背景图片尺寸需要与摄像头的尺寸一致

首先我们打开摄像头，并加载一张背景图片，从摄像头中获取视频帧图片，对图片进行翻转与颜色空间的转换操作后，使用selfie_segmentation.process(image)函数进行人像的分割，最后实时显示分割后的效果，当然也可把视频保存下来

视频加载中...

mediapipe系列文章：

颠覆2D对象检测模型，MediaPipe 3D对象检测还原真实的对象特征

MediaPipe Face Detection可运行在移动设备上的亚毫秒级人脸检测

MediaPipe虹膜检测：实时虹膜跟踪和深度估计

利用深度学习进行Web浏览器视频电话会议中的背景更换

利用机器学习，进行人体33个2D姿态检测与评估

利用机器学习，进行人手的21个3D手关节坐标检测

利用机器学习进行人脸468点的3D坐标检测，并生成3D模型

MediaPipe 集成人脸识别，人体姿态评估，人手检测模型

AI视频人像分割(人像拍摄比例)

模型

代码实现

实时视频分割