从只是显示美学评分手动到自动裁切：我是如何设计裁切大师APP 的？

利益相关声明：作者与文中产品有直接的利益相关（开发者、自家产品等）

一切要从“电影感相机”APP开始说起。

这源于我偶然发现的一个开源模型，这个模型很酷，能给照片打一个美学分数。

我觉得这很有意思，因此，我突发奇想，能不能把这个模型和我心爱的哈苏XPAN相机结合起来？于是，“电影感相机”就诞生了。

这个APP很简单，就是拍照的时候，它会实时给照片的美感打分，0到10分，低于4.5分的，基本上就 pass 了，因此，这个APP只能保存评分在4.5以上的照片，你想想，每次按下快门，都带着一点小刺激，是不是挺有意思？

但是，这个APP虽然受到了一些朋友的喜欢，但它也花了我超级长的时间，因此，当它终于成功上架的时候，我真的觉得非常有成就感。

你知道吗，这可是我的第一个完全用AI写的APP！那时候，还没有现在这么先进的AI编程工具，我只能手动地把代码贴到GPT里面，然后再复制下来，然后再扔到 Xcode里面跑。

那时候的GPT3.5，上下文窗口也特别短，大概只有8000个TOKEN左右，因此，那段时间我开发得非常痛苦。

可能 GPT 自己也很痛苦，反正我是他的监工。

但是，我并没有因此放弃，因此，后来我就想做一个更轻量级的APP，我还是想用那个美学评分模型。

我想到，可以让用户直接导入图片，然后在裁切的时候，实时看到美学评分的变化，这样就能判断当前的裁切是不是让照片更好看了。

但是，当时的技术限制还是挺大的，因此，我不得不把两个不太相关的模块拼凑在一起，一个是开源的裁切框架，里面有很多我并不熟悉的代码，修改起来非常痛苦，另一个是我之前想做的多步骤返回和前进功能，这个实现起来代码量也很大，也很困难。最终还是放弃了。

但是，最终我还是把裁切和评分这两个模块硬生生地缝合到了一起，因此，就有了你现在看到的裁切大师APP的雏形。

这个APP，很明显带着我早期技术性思维的印记，我先有了某个技术，然后围绕它来打造一个产品。

但是，故事并没有就此结束，这些事情发生在2023年，也就是AI编程刚刚兴起的时候，我记得“电影感相机”一开始是用GPT3.5写的，那个时候的GPT，还基本写不出完整的iOS代码。但是，后来出现了GPT4，因此，我就可以更放心地进行开发了，代码的错误也少了很多。

按理来说，作为一个轻量级APP，开发的初始范围到这里就应该结束了。但是，很显然，到了2025年，我的这个APP又进行了一波大的更新，因此，最主要的功能，还是我之前一直想做的自动裁切。

其实当时也有很多朋友问我，能不能做自动裁切的功能？

但是，当时我的开发能力有限，因此，我一直没能实现。你知道吗，我的开发能力很大程度上受限于AI的编程能力，除了早些年学过一些数据可视化分析的开发代码之外，我对SwiftUI这些东西基本上是一窍不通的。

但是，最近这段时间疯狂的开发，我已经能够基本看懂这些代码了，虽然很多比较复杂的还是不大懂，基本上都是一知半解吧。再加上 Cursor，我感觉我能一个打十个。

现在很多人都在讨论，AI真的会抢走产品经理、程序员的饭碗吗？

我觉得，其实还好吧。

其实早在2023年10月份的时候，我就用GPT3.5和GPT4开发出了一个版本的“裁切大师”，那个版本，其实完整度已经不错了。

但是，很明显，对比现在我们使用的GPT4O、Cursor这些以及 Claude 3.5 Sonnet开发出来的版本，肯定是现在的功能更完备，更吸引人，因此，我们再来推演一下。

其实现在很多产品的成熟度和趣味性都比较差，但是，特别是独立开发者，他们的脑海中往往有一个非常完整、非常有趣的产品构想，因此，借助这些AI工具，我们可以越来越简单、更可行地把脑海中那个更完美的产品释放出来。

因此，其实我觉得这是AI跟人类共生的一个漫长的试验，还是非常有趣的。

我并不觉得AI会让我们都失业，相反，我会觉得真正有想法、有执行力的人，会很好地利用这一次的变革，把我们脑海中有趣的东西做出来。

并且最好的是可以得到对应的收入。

因此，后来我有了 Cursor 后，一下子我就想起了我们可以给“裁切大师”进行迭代，因此，这次我们用了一种比较巧妙的方式对APP进行了迭代。

它的原理是这样的：

首先，我们读取一张照片完整的样子，给它进行美学评分，然后，我们设定不同的照片裁剪比例，比如16:9，有我最喜欢的65:24，就是那种超宽的宽荧幕视角，还有一些比如1:1之类的，然后，我们也有一个缩放比例，就是说你的照片最大放大多少，还有一个步级，也就是说每一次放大它会放大10%还是20%，因此，这样子我们就构成了你一张照片可以潜在裁切出多少种组合。比方说，我原来的照片是16:9的，那么当我裁切成1:1的时候，假如我没有放大来进行裁切，那么它就是从左到右进行移动来进行不断的裁切，在每一次裁切，它都会给出一个美学评分，然后再根据你拿到的美学评分最高的照片进行保存。

然后，同时，我当时还做了一个小小的一个动作，不过可能很多人都没注意到，就是我现在的界面是分上下两个窗口，上半部分呢，就是实时保留、维持住最高得分的照片，下面呢，就是你正在裁剪的那个框框，这个动画看起来还是挺有意思的。

然后呢，当我们在上面预览的时候，我们可以双击这个照片，它就可以快速保存我们下面正在展示的这个画面，可能即便AI觉得这个画面不是特别好看，你也可以保存。

我自己在用这个APP的时候发现，很多时候你觉得自己拍的很强的照片，AI它并不会给你很高的评分，我觉得有一种可能是这个模型它进行了极大的压缩，所以它读取的分辨率其实并不是特别高。

我发现很多时候你裁切的画面都会太小了，我发现它对纯色的画面背景特别喜欢，但是，就像一个用户反馈的那样，他拍的是环境人像，但是AI会把人给裁切掉。

不好意思，还是有点搞笑。

因此，后来我就觉得可以针对每一个比例的组合，单独至少留一张照片给用户。这样子的话，并不会说裁完一轮之后，很多个比例，只留下一张APP觉得最好看的照片，而是会留下一堆APP觉得比较好看的照片。

也就是说，每一个缩放比例和长短比例结合的这个组合，都至少会有一张照片给用户进行选。

因此，用户就可以比较简单方便地一次性批量地为不同的平台，不同的需求来生成不一样的裁剪比例的好看照片。

这就是我开发“裁切大师”的大概过程。

未来，它还会变得更好。