随着短视频的流行,大家对于信息获取的渠道越来越依赖视频和图片,有些内容是适合视频和图片化,而有些则不是,但是因为注意力焦点转移的问题。人们在短视频中花了太多的时间,实际上获取和沉淀下来,可供二次创作的信息越来越少,换言之——信息水化严重。那么如何从这些视频、图片中提取干货呢?

处理图片里的文字,首先想到 OCR 对吗?利用图像识别可以获取图片中的文字,大家并不陌生,也有很多浏览器插件可以实现 OCR。一般情况下,对图片 OCR 需要下载特殊的程序、或者依赖外部网络来远端识别。缺陷就是操作繁琐,如果是网络 OCR 速度则受网络影响很大,速度、精度都不佳。随着近年来,苹果在硬件和软件方面的突飞猛进,在 macOS 上有了更快速、可靠、免费的工具——点击图片复制文字。 比方说

iPhone 相册自带的从图片中获取文字

你可以通过选中对应位置来对单独的文字做处理,复制、翻译。

而支持相册里复制文字功能背后的技术,第三方 app 也可以使用,所以 LightNote 就是利用苹果设备内置的算力来提供这项功能——高效和准确。

适用场景

视频大部分时候是为了提供即时的享受,但有些视频里藏着重要的信息,你不想错过。举个例子,《报告老板》的片头都要大段的文字来表述本集的内容,为其定性、定调,不乏一些有趣的段子。如果你想了解完整的内容,可以在合适的时候暂停、人肉誊写或者截屏后,寻找单独的 app 或者网络服务做 OCR 来实现——冗长繁琐。 LightNote 提供了一键截屏 + OCR 功能,并且可将此截图和结果用笔记的形式保存起来,供日后检索、再创作。

依赖视频学习课程、新技能的人群。他们在视频中接收更生动活泼的知识关注,在快乐学习的时候,还是会需要把视频中的信息,保存为文字消化、吸收成为自己的知识。比如你想把下面这个历史题目作为背诵内容的素材。

历史试卷

抑或只是科普、视频讲解、赏析内容创作者、二创作者,你需要的是对别人作品的描述,添加有举例和引用,这时候截图 + 关键内容提取就显的很重要;

提取 WWDC 专题里的关键代码

上图是一个代码学习网站,用了这个工具,我们可以快速将图中的代码 copy 出来,贴到编辑器里修改、测试、运行。

我们以一个市场营销人士做前期调研为例。假设我们想去微信投放广告,除了你找到商务索要报价排期的信息外,你正好在网站上看到微信视频广告报价的报告,很详细。你想知道你的竞争对手的营销安排。第一时间,你想用浏览器的关键字搜索功能来定位对手信息,可惜信息都在截图里,你可能需要人肉对图片做逐行扫描来定位——低效、容易错过。

使用 LightNote 插件 ,你在图片上右键,在弹出菜单里选中“Search texts in images”(如果是浏览器语言是中文则是:搜索图片中的文字)。

选中图片,右键

稍等一下片刻,你将看到图片和解析后的文本,这时候你就可用浏览器自己的搜索功能来定位你要找的内容。

解析结果

插件功能介绍。插件弹出的带遮照的浮层,顶部是工具栏,默认按照中文识别,你可以切换主语言。右上角的 checkbox,可以关闭或者显示在图片上对应位置的识别结果,方便你确认是否识别正确。 右侧显示识别结果,支持手动去掉图片上的干扰信息。 右下角上保存到笔记里,后续的使用和 LightNote 收集信息的使用上一模一样(如果不熟悉,可以参考我在少数派前一篇文章)。

除了支持从图片中获取信息,保存外。特别的支持从视频中,截取当前播放时内容,生成截图,并且输出识别结果。识别视频中文字,需要在页面空白处,点击右键唤起菜单(相比识别图片,是在图片上开启右键菜单)。

目前只支持 HTML5 的 video 播放器,不支持 flash 播放器的视频。另外有些视频网站的播放器部分和外面的界面上单独两层(如在 iframe 里,而且是跨域的)此时无法获取的视频内容,比方说在线之家。而大部分主流的视频网站都是 OK。下面说我测试的情况;

网站是否可以截取备注
B 站可以使用了自定义的  video 标签,特殊处理
Youtube可以 
Netfl可以,但又不完全可以可以截图,不过全是黑屏,不晓得用了什么黑科技
Twitch 可以 
A 站可以 
优酷可以 
斗鱼可以 
芒果TV可以 
腾讯视频可以 
iQiyi可以 
央视网可以 
中国蓝TV可以 
欧乐影院可以 
在线之家不可以iframe,而且跨域

对于大部分用户需求都可以满足,如果你遇到“无法定位到视频”的错误,可以把链接分享给我。

适用人群

  • 跟着视频学习特定知识的人群。包括课外知识、素质教育的内容,如数学公式、英语单词和句子,其实最适合的还是学习写代码的场景,有了这个工具,你可以快速提取其中的代码片段,修改运行测试。
  • 从别人的视频中获取素材、观点的人群。一些评述类的内容创作者,比方说对着一些影视作品做二次创作的人,有了个这个工具,可以快速提取截图,补充到自己的文章里。
  • 另外就是一些业余人士。希望在视频中提取关键信息,单独再创作的人士。配合 lightnote 的保存,将这些截图保存到 Notion 里形成自己的素材库。

PS:提前为 LightNote 绑定好 Notion,并配置合适的 Database 视图,充分发挥 Notion 强大的配置能力,将使你的素材库空前强大。

链接

注意:视频 OCR 需要 LightNote app 和 插件都升级到 1.4.0 版本,使用此功能需要下载 LightNote App 和浏览器插件

  • LightNote app,下载地址 https://apps.apple.com/cn/app/id1546030973
  • Chrome 插件,下载地址 https://chrome.google.com/webstore/detail/lightnote-for-chrome/ppimkcpjclcggcendejddodfbpjakogc?hl=zh-Cn
  • Firefox 插件,https://addons.mozilla.org/en-US/firefox/addon/lightnote-for-firefox/