当前位置：首页 > news >正文

人脸检测+调整分辨率+调整帧率

news 2025/7/8 19:25:21

初始检测：只在视频的前几秒内进行一次人脸检测，以确定主持人的大致位置。
计算裁剪框：基于检测到的主持人位置，计算一个以主持人面部为中心的固定裁剪框。
视频裁剪：使用计算出的裁剪框对整个视频进行裁剪，将视频分辨率调整为512x512。帧率调整：将视频帧率调整至25fps。
音频保留：确保裁剪和帧率调整后的视频音频与原视频同步。

以下是优化后的代码：

import cv2
import numpy as np
import face_recognition
from moviepy.editor import VideoFileClip, AudioFileClip
from tqdm import tqdmdef find_host_face_location(video_path):""" 在视频的前几秒内检测并返回主持人面部的大致位置 """cap = cv2.VideoCapture(video_path)found_face = Falsewhile cap.isOpened():ret, frame = cap.read()if not ret:break# 缩小帧尺寸以加快处理速度small_frame = cv2.resize(frame, (0, 0), fx=0.25, fy=0.25)rgb_small_frame = small_frame[:, :, ::-1]# 检测人脸face_locations = face_recognition.face_locations(rgb_small_frame)if face_locations:# 取第一张脸的位置，假设主持人位于视频画面的中心位置附近host_face_location = face_locations[0]# 将位置放大回原始大小host_face_location = (host_face_location[0]*4, host_face_location[1]*4, host_face_location[2]*4, host_face_location[3]*4)found_face = Truebreak# 如果已经处理了前10秒的视频，且没有找到人脸，则退出循环if cap.get(cv2.CAP_PROP_POS_MSEC) > 10000:breakcap.release()return host_face_location if found_face else Nonedef calculate_cropping_box(face_location, frame_shape):""" 根据主持人面部位置计算裁剪框 """top, right, bottom, left = face_locationcenter_x, center_y = (left + right) // 2, (top + bottom) // 2half_width, half_height = 256, 256left_cropped = max(center_x - half_width, 0)top_cropped = max(center_y - half_height, 0)right_cropped = min(center_x + half_width, frame_shape[1])bottom_cropped = min(center_y + half_height, frame_shape[0])return (top_cropped, right_cropped, bottom_cropped, left_cropped)def process_video(input_path, output_path):""" 处理视频，裁剪并调整帧率 """# 检测主持人面部位置host_face_location = find_host_face_location(input_path)if host_face_location is None:print(f"No face detected in video {input_path}")return# 读取视频，获取视频的宽度和高度clip = VideoFileClip(input_path)frame_shape = clip.size[::-1]  # 电影剪辑的尺寸是(width, height)，我们需要(height, width)# 计算裁剪框cropping_box = calculate_cropping_box(host_face_location, frame_shape)# 裁剪视频cropped_clip = clip.crop(x1=cropping_box[3], y1=cropping_box[0], x2=cropping_box[1], y2=cropping_box[2])cropped_clip = cropped_clip.resize((512, 512))# 调整帧率cropped_clip = cropped_clip.set_fps(25)# 保存最终视频cropped_clip.write_videofile(output_path, codec='libx264', audio_codec='aac')# 清理资源cropped_clip.close()if __name__ == "__main__":for i in tqdm(range(1, 75), desc="Processing videos"):input_path = f"data/{i}/{i}.mp4"output_path = f"data/{i}/{i}_fc1.mp4"process_video(input_path, output_path)

代码解释

find_host_face_location 函数：这个函数负责在视频的前几秒内查找主持人面部的大致位置。我们假设主持人在视频开始时就已经出现在画面中，并且通常位于画面的中心位置附近。
calculate_cropping_box 函数：根据主持人面部的位置计算出一个裁剪框，使得裁剪后的视频以主持人面部为中心。
process_video 函数：此函数执行视频的裁剪和帧率调整。首先，我们使用find_host_face_location函数找到主持人面部的位置。接着，使用calculate_cropping_box函数计算裁剪框。然后，我们使用moviepy库来裁剪视频、调整尺寸和帧率，并保存最终的视频。