在线时间 480 小时 最后登录 2026-6-1 注册时间 2023-7-11 听众数 4 收听数 0 能力 0 分 体力 7823 点 威望 0 点 阅读权限 255 积分 2934 相册 0 日志 0 记录 0 帖子 1174 主题 1189 精华 0 分享 0 好友 1
该用户从未签到
背景
6 h" O. U' L j9 I6 }( D3 j 由于我要做一个深度学习方向的计算机视觉项目,需要一些数据集来进行训练,我便想尝试捕获视频中的图片用来标注。
7 x* J! N' W h9 j0 i% s
5 M) L6 H8 G {8 E X c0 v$ [# Q 注意事项
0 A% C) S3 S# }5 t j! t7 |) P 如果视频中的场景单一,那么使用该视频获取的数据集训练出的模型面对其他场景的泛化能力就会受到限制。为了提高数据集的多样性,可以采用多种不同场景的视频,并且在获取数据时采用大间隔捕获的方式。采用大间隔捕获数据的方法可以捕获到的图片同质化降低,从而进一步增加数据集的多样性。import os3 j( h. }1 ^! S: e' A, g0 C3 i) w
import sys\" b7 y4 s) n& f7 X
from concurrent.futures import ThreadPoolExecutor
! A7 S: z9 M h3 x9 R9 d+ } import cv28 E2 P0 Q7 ^: P3 ?: `
1 L- t* d/ Z8 j/ V2 o( g
def output_img(video_path,img_dir):
7 @; f* i ]# _5 L G' |: h' m # 由视频逐帧输出图片/ A* O& H. w1 H9 i
# video_path: 视频文件路径% H! d; A) R; V5 e
# img_dir: 图片保存目录路径,路径不支持中文* Z* M. g: K) T/ ]
os.makedirs(img_dir,exist_ok=True). u( M! d( x) _0 i
# img_dir:表示要创建的目录路径。 K k1 ]( y- A% a/ y
# exist_ok=True:表示如果目录已经存在时不抛出异常。如果将 exist_ok 设置为 True,那么如果目录已经存在,os.makedirs() 函数也不会报错;如果设置为 False,则会抛出一个 FileExistsError 异常。$ |: A# z: Q1 G1 N/ P9 r\" \
cv = cv2.VideoCapture(video_path)
: q& _* i' Z5 H4 ? frame_count = 0
9 {' L\" N* _) A # 计数器 s/ C7 O$ @7 u- q+ C1 N& l/ `
n = 0
6 ]6 k* ?) o9 _' W8 L! a # 命名计数器
7 Q\" A\" p6 D1 E5 H3 W while True:: u\" H' l7 @. u7 R9 Y- ^* P
ret,frame = cv.read()2 U- X9 a. p7 ^8 L3 F\" \
if not ret:
/ K7 B+ M9 j. ?4 b, L* k2 j break
\" |+ U) |0 `) }8 }/ z* P( ?: E8 j frame_count += 1$ I\" m5 ^/ C* |# P6 n5 i& ?
if frame_count % 30 ==0:) k) q. v% X Y$ M+ h) H
# 每隔三十帧获取一次图片! ?+ h& _( O2 N! x+ h8 o9 S
n += 1
. F& B/ d9 V ]4 x* X# ` M img_name = "0000000{0}.jpg".format(n)& G4 a: O- `# Z q0 E\" r3 ~$ J
img_file_path = os.path.join(img_dir,img_name)
& d. y8 ?' m$ H+ M h. U6 N- A if not os.path.exists(img_file_path):* P+ `4 p\" f( u- a e) n) X8 j& y. ]& e
sys.stdout.write("创建文件:"+ img_file_path + "\n")7 J+ f0 A9 Y! @- [1 L; U
# 标准输出流,将指定文本输出到控制台或其他输出设备中
3 c% Y* s: b8 W9 p9 K n' M cv2.imwrite(img_file_path,frame,[cv2.IMWRITE_JPEG_QUALITY,100])
; f' {, U\" B7 G. A& m # 将图像帧保存为jepg格式的图像,质量最高为100
% M% h5 u. G' R. C! p\" U) v: a else:* E7 W6 {* l% k. i
sys.stderr.write("跳过:" + img_file_path + "\n")
2 U+ r5 {+ d' D ret,frame = cv.read()
9 e) e% x' V4 v6 C' I& N6 Z! l
, @6 [! }# v% I2 O1 F$ g def run(video_dir,img_dir):
8 L2 G; @5 |6 c' j pool = ThreadPoolExecutor()
' U$ {4 s! j% }\" j5 m # 创建一个线程池对象,实例化ThreadPoolExecutor类,将任务提交给线程池,线程池会自动调度线程来执行这些任务; R5 v' }% o8 o* w }5 v
for file in os.listdir(video_dir):0 F\" i, _7 r0 t\" _# {
if file[-4:] == ".mp4":! Q\" |' T7 U1 l* Z
video_file_path = os.path.join(video_dir,file). [3 p% s8 Q( B3 C
img_dir_name = os.path.join(img_dir,file[:-4])6 L# _2 d# m% }# L ?) Q
os.makedirs(img_dir_name,exist_ok=True)6 k3 h$ X: n9 r\" L
pool.submit(output_img,*(video_file_path,img_dir_name))5 D8 Q1 x+ z) y1 L/ b
#* 和 ** 是用于解包参数的操作符。在这种情况下,*(video_file_path, img_dir_name)
5 K6 N b1 I# a/ L, s9 R # 的作用是将元组 (video_file_path, img_dir_name) 中的元素解包并作为单独的参数传递给函数。, w3 F ^, g/ m1 Z
5 P5 f3 L( W' M
if __name__ == '__main__':5 T& t1 Z5 D7 |$ k$ v& R8 Z% t
run(r"E:\video",r"E:\image")' I9 H7 C4 A' f9 S\" n' l
复制代码
! u8 ]' d3 v! K4 m" N6 N! t
zan