利益相关声明:作者与文中产品有直接的利益相关(开发者、自家产品等)

几天前开源了一个常驻菜单栏的截图工具 capcap,双击 截图、标注、长截、美化、上传图床。看到大家非常喜欢,也提了不少实用建议,这个周末趁热打铁新增和优化了很多功能,这篇就聊聊新增和打磨过的功能。

写在前面

capcap 是我自己每天在用的工具,所以更新基本是"用着用着发现哪儿别扭,就顺手改掉"。

就这么一个周末,攒下来的改动不少,挑几个我自己最常用、也最有体感的来讲。不讲版本号,只讲它现在能干什么、比以前顺手在哪。

OCR:截图里的字,现在可以直接抠出来,还能顺手翻译

这是周末做出来的最大一块新功能,也是我自己用得最爽的一个。

以前看到一张图里有想要的文字——一段报错、一条命令、一张外文截图——只能对着屏幕手敲。现在 capcap 直接内置了 OCR 文字识别:截完图,框一下,图里的文字就被识别出来,一键复制走。

更进一步,它还接了 AI 翻译。识别出来的文字可以直接翻译,看英文文档、读外文界面、对照报错信息的时候特别顺手。

翻译走的是 BYOK(Bring Your Own Key) 的方式——用你自己的 API Key,模型和服务商自己选。不绑定任何一家、不经过我的服务器,你的额度你做主。配置填完点保存,capcap 会当场帮你测一次连通性,能不能用、Key 对不对,立刻就知道,不用等到真要翻译时才发现配错了。

长截图:现在是自动滚动截图

长截图一直都有,但以前得自己在选区里用触控板一点点往下滚,滚快了拼接容易花、滚慢了又费手。

现在改成了自动滚动:框好区域,剩下的交给它——capcap 自己匀速往下滚、实时往下拼,你只要盯着预览,觉得差不多了就回车停止。自动滚动期间手动滚轮会被锁住,免得你一不小心碰到触控板把节奏打乱;什么时候算完事,界面上也有明确提示。

还加了一个 fit-to-screen 裁切模式:长图拼出来往往很长,需要裁掉头尾的多余部分。裁切时有一个跟着光标走的放大镜,边缘对齐能对到像素级。

更新这件事,App 自己就办了

以前要升级,得走 Home brew,检查更新你得去 GitHub 下个包、拖进应用程序、覆盖安装——一套流程下来挺劝退的。

现在这一整套都收进了 App 里:

  • capcap 会自己检查有没有新版本;
  • 有更新可以直接下载并安装,不用离开 App;
  • 整个过程有一个进度提示,检查、下载、安装走到哪一步都看得见;
  • 如果某个版本你暂时不想升,可以跳过它,不会反复来烦你。对你来说,升级基本就是点一下的事了。

剪贴板里的图,按一下快捷键就能改

之前已经支持"在 Finder 里选中一张图、按截图快捷键直接载入编辑器"。这次把这个思路又往前推了一步——剪贴板里的图也行

不管这张图是从网页拷的、从聊天窗口复制的,还是别处来的,只要它在剪贴板里,按一下编辑快捷键,capcap 就把它接进编辑器。加箭头、打码、写字、美化,改完再 ⌘V 出去。

也就是说,capcap 现在不只是"截图工具",它也是一个随叫随到的图片标注台——手上有图就能改,不一定非得现截。

图床又多了两家,支持了 S3 和 R2

之前图床支持腾讯云 COS、七牛云 Kodo、阿里云 OSS 三家国内对象存储。

这次补上了两家在海外/开发者圈用得很多的:

  • Amazon S3
  • Cloudflare R2

R2 尤其值得一提——免出口流量费,拿来做图床很合适。配置方式和原来几家一致:填好信息点保存,capcap 当场测一次连通性,状态直接显示在卡片上,配没配对一眼就看出来。

还有些不显眼、但让人安心的小改动

📋 关于页
设置里多了一个"关于"页,版本信息、开源信息都在这儿,想确认自己用的是哪个版本、想跳去仓库看看,都方便。

🐞 错误日志查看器
关于页里还能展开一个错误日志面板。万一 capcap 哪天抽风了,崩溃记录直接能看到——不用去翻系统目录,反馈问题的时候也能直接把日志贴给我。

🧹 各种顺手的小修
比如美化模式下尺寸标签会被渐变边框挡住、Finder 选图过期了没法干净退出之类的别扭点,也都一并收拾掉了。这些单拎出来不值一提,但凑在一起,就是"用着越来越顺"的那种感觉。

最后

capcap 还是那几个原则:纯 AppKit、零依赖、零订阅、零遥测、MIT 开源

新功能不少,但交互核心没变——双击 ,截图、标注、出图,一步到位。OCR、翻译、自动更新这些,都是在不打扰这条主线的前提下顺手加的。

GitHub:realskyrin/capcap,免费开源,欢迎来提 issue、提需求。这工具能更新到今天,一半是我自己用出来的,一半是大家催出来的。

1
0