0)背景概述

大家应该都遇到网上看到一个很不错的教程视频或者论坛的直播回放,苦于想要老师的ppt,但老师不提供或者没有获取的渠道的情况,本文介绍一个方法可以直接基于有的视频课程,快速的抓取里面的ppt内容自动截图,转换为pdf文件可以用来日常做课程笔记或者转换成ppt文件为自己所用的问题。

1)准备物料

  • 软件「Gleamoe Peanut 2023」:课程扣pdf使用,下载地址:Gleamoe Peanut 2023 软件手册 ,目前只支持window系统
  • 软件「UPDF」:图片pdf转OCR可检索使用,下载地址:https://www.updf.cn/ ,需要vip会员

2)视频导出PDF文件

准备要转pdf讲义文件的视频、安装Gleamoe Peanut 2023

准备好的视频.mp4
转换工具

 

配置导出pdf参数(详情见GP2023软件手册)

手动定位:选择ppt的图框位置

选择好后,手动定位部分就会显示坐标及图片大小

设置导出名称:与视频名字一致即可

导出并检查PDF文件

点击预览输出,等待幻灯片提取

导出成功,确认幻灯片内容正常(主要内容没有遮挡,没有缺失)

处理进度

2)PDF文件进行OCR识别

用UPDF打开导出文件,点击OCR功能

配置OCR参数

选择页面图像下的文本文档语言选择简体中文和英语

执行OCR并确认文本可检索

通过UPDF打开OCR生成的PDF文件,使用检索功能查看识别效果,确认可用,文件备用。