一切要从“电影感相机”APP开始说起。
这源于我偶然发现的一个开源模型,这个模型很酷,能给照片打一个美学分数。
我觉得这很有意思,因此,我突发奇想,能不能把这个模型和我心爱的哈苏XPAN相机结合起来?于是,“电影感相机”就诞生了。
这个APP很简单,就是拍照的时候,它会实时给照片的美感打分,0到10分,低于4.5分的,基本上就 pass 了,因此,这个APP只能保存评分在4.5以上的照片,你想想,每次按下快门,都带着一点小刺激,是不是挺有意思?
但是,这个APP虽然受到了一些朋友的喜欢,但它也花了我超级长的时间,因此,当它终于成功上架的时候,我真的觉得非常有成就感。
你知道吗,这可是我的第一个完全用AI写的APP!那时候,还没有现在这么先进的AI编程工具,我只能手动地把代码贴到GPT里面,然后再复制下来,然后再扔到 Xcode里面跑。
那时候的GPT3.5,上下文窗口也特别短,大概只有8000个TOKEN左右,因此,那段时间我开发得非常痛苦。
可能 GPT 自己也很痛苦,反正我是他的监工。
但是,我并没有因此放弃,因此,后来我就想做一个更轻量级的APP,我还是想用那个美学评分模型。
我想到,可以让用户直接导入图片,然后在裁切的时候,实时看到美学评分的变化,这样就能判断当前的裁切是不是让照片更好看了。
但是,当时的技术限制还是挺大的,因此,我不得不把两个不太相关的模块拼凑在一起,一个是开源的裁切框架,里面有很多我并不熟悉的代码,修改起来非常痛苦,另一个是我之前想做的多步骤返回和前进功能,这个实现起来代码量也很大,也很困难。最终还是放弃了。
但是,最终我还是把裁切和评分这两个模块硬生生地缝合到了一起,因此,就有了你现在看到的裁切大师APP的雏形。
这个APP,很明显带着我早期技术性思维的印记,我先有了某个技术,然后围绕它来打造一个产品。
但是,故事并没有就此结束,这些事情发生在2023年,也就是AI编程刚刚兴起的时候,我记得“电影感相机”一开始是用GPT3.5写的,那个时候的GPT,还基本写不出完整的iOS代码。但是,后来出现了GPT4,因此,我就可以更放心地进行开发了,代码的错误也少了很多。
按理来说,作为一个轻量级APP,开发的初始范围到这里就应该结束了。但是,很显然,到了2025年,我的这个APP又进行了一波大的更新,因此,最主要的功能,还是我之前一直想做的自动裁切。
其实当时也有很多朋友问我,能不能做自动裁切的功能?
但是,当时我的开发能力有限,因此,我一直没能实现。你知道吗,我的开发能力很大程度上受限于AI的编程能力,除了早些年学过一些数据可视化分析的开发代码之外,我对SwiftUI这些东西基本上是一窍不通的。
但是,最近这段时间疯狂的开发,我已经能够基本看懂这些代码了,虽然很多比较复杂的还是不大懂,基本上都是一知半解吧。再加上 Cursor,我感觉我能一个打十个。
现在很多人都在讨论,AI真的会抢走产品经理、程序员的饭碗吗?
我觉得,其实还好吧。
其实早在2023年10月份的时候,我就用GPT3.5和GPT4开发出了一个版本的“裁切大师”,那个版本,其实完整度已经不错了。
但是,很明显,对比现在我们使用的GPT4O、Cursor这些以及 Claude 3.5 Sonnet开发出来的版本,肯定是现在的功能更完备,更吸引人,因此,我们再来推演一下。
其实现在很多产品的成熟度和趣味性都比较差,但是,特别是独立开发者,他们的脑海中往往有一个非常完整、非常有趣的产品构想,因此,借助这些AI工具,我们可以越来越简单、更可行地把脑海中那个更完美的产品释放出来。
因此,其实我觉得这是AI跟人类共生的一个漫长的试验,还是非常有趣的。
我并不觉得AI会让我们都失业,相反,我会觉得真正有想法、有执行力的人,会很好地利用这一次的变革,把我们脑海中有趣的东西做出来。
并且最好的是可以得到对应的收入。
因此,后来我有了 Cursor 后,一下子我就想起了我们可以给“裁切大师”进行迭代,因此,这次我们用了一种比较巧妙的方式对APP进行了迭代。

它的原理是这样的:
首先,我们读取一张照片完整的样子,给它进行美学评分,然后,我们设定不同的照片裁剪比例,比如16:9,有我最喜欢的65:24,就是那种超宽的宽荧幕视角,还有一些比如1:1之类的,然后,我们也有一个缩放比例,就是说你的照片最大放大多少,还有一个步级,也就是说每一次放大它会放大10%还是20%,因此,这样子我们就构成了你一张照片可以潜在裁切出多少种组合。比方说,我原来的照片是16:9的,那么当我裁切成1:1的时候,假如我没有放大来进行裁切,那么它就是从左到右进行移动来进行不断的裁切,在每一次裁切,它都会给出一个美学评分,然后再根据你拿到的美学评分最高的照片进行保存。
然后,同时,我当时还做了一个小小的一个动作,不过可能很多人都没注意到,就是我现在的界面是分上下两个窗口,上半部分呢,就是实时保留、维持住最高得分的照片,下面呢,就是你正在裁剪的那个框框,这个动画看起来还是挺有意思的。
然后呢,当我们在上面预览的时候,我们可以双击这个照片,它就可以快速保存我们下面正在展示的这个画面,可能即便AI觉得这个画面不是特别好看,你也可以保存。
我自己在用这个APP的时候发现,很多时候你觉得自己拍的很强的照片,AI它并不会给你很高的评分,我觉得有一种可能是这个模型它进行了极大的压缩,所以它读取的分辨率其实并不是特别高。
我发现很多时候你裁切的画面都会太小了,我发现它对纯色的画面背景特别喜欢,但是,就像一个用户反馈的那样,他拍的是环境人像,但是AI会把人给裁切掉。
不好意思,还是有点搞笑。
因此,后来我就觉得可以针对每一个比例的组合,单独至少留一张照片给用户。这样子的话,并不会说裁完一轮之后,很多个比例,只留下一张APP觉得最好看的照片,而是会留下一堆APP觉得比较好看的照片。
也就是说,每一个缩放比例和长短比例结合的这个组合,都至少会有一张照片给用户进行选。
因此,用户就可以比较简单方便地一次性批量地为不同的平台,不同的需求来生成不一样的裁剪比例的好看照片。
这就是我开发“裁切大师”的大概过程。
未来,它还会变得更好。
