年初整理分享：收藏夹分析术（下）

续上片收藏夹清灰术《年终整理分享：收藏夹清灰术，方案与工具（上）》，清理完收藏夹灰尘，下一步就是真正地整理收藏夹了。

01 🥗

整理收藏夹的目的，我希望能达成两个目标：

于是，有了下面的行动。

首先，将数据输出成 .csv 格式，为了能在本地快速应用和查看。

但就这么看清理好的数据，emmm，有什么用？（盯了老半天完全没概念，是打开方式不对？）

那根据层级结构，输出成树形图呢？将书签数据转换成 .json 格式（更方便解析），用 D3 渲染出来看看。

emmm，也不对！

数据是有了，用表格呈现。密密麻麻的一行一行来文字，无法在脑海里形成清晰的脉络。而树形图呈现，得到的是收藏夹的层级结构结果，我的脑子盯着得不到任何反馈，还是一脑子浆糊，也没有意义。

似乎僵住了，单纯是这样没法形成清晰的概念，没法辅助我复盘和决策的。我希望的是有更直观，更短的反馈方式，来让我对这堆数据有清晰的概念。

（在上一篇有朋友提出，哪怕还剩下九百多个，有什么用呢？这也是我在思考的。）

想起我一直使用的笔记系统，《卡片盒笔记法》。映射出来，其实收藏夹书签也是我的笔记的一种笔记形式，只是没有我的总结，但它们是自己可以表达内容的。

怎么做呢？

我认为重点是建立关联，进行视觉转化（这个我擅长！），然后交给我的眼睛和大脑。

步骤：数据挖掘 -> 数据可视化 -> 主观分析

建立关联，我打算用每个标签里面的内在分类，来建立标签之间的联系。

数据已经整理好了，每个书签可以提取出分类信息的。我可以从标题、链接地址、还有书签的目录路径，推断出它的分类标签。

例如一个书签书签，他的信息有：

我会给他打上『前端、技术、性能、优化』这样的标签。

不过目前剩下的还有一千多个书签，我当然不可能一个个标签这么打（~~又想偷懒~~）。

每条书签的分类标签建立，其实是也是文本工作，可以交给大语言模型来处理。这可以帮助我批量快速的处理所有数据~（是否靠谱我们后面再看看）

现在挺多的文本处理模型可以使用，做这件事情的时候，刚好 Google 的 Gemini 发布，就尝尝鲜吧~ 利用 Gemini Pro 的接口，将每个书签的标题、URL、目录信息告诉 Gemini，然后它返回标签建议。效果如下：

第四行是 Gemini 的分类标签结果，看起来还行，输入的字面上没有的字也能出现在标签上，能用了~

写个程序，让程序自动与 Gemini 交流，逐个为我的书签建立标签。¹

如此，每个书签，就能根据标签进行关联，产生联系。达到连点成线，连线成面的效果了！

我可以由很多维度来解读这份信息。

首先，可以从书签的数量上统计：

已经能看到一些东西了，再加上时间的维度呢？

总体上看，我这几年关注的是编程、前端、技术的领域……

2023 年收藏架里产生了 125 个标签分类，关注的领域是人工智能、地理信息，以及自动驾驶领域……

2022 年收藏架里产生了 109 个标签分类，关注地理信息、数据可视化，渲染领域，这些信息更多在知乎上找到……

确实是这样，我的行动不会骗我，可以看到我的专注点迁移。因为工作原因，2023 年从地理信息、数据可视化的技术领域，转移到了自动驾驶、人工智能领域……（巴拉巴拉，省略年终总结部分）

这些数据是基石，是养料。形成这些数据，不是目的，而是利用这些信息，给我提供更多维度，更多线索，发现自己，发现历史。我的行为，我的历史，不会骗我自己。

例如：原来，去年到今年，我关注的变化，我关注的技术领域，已经默默发生了变化，这警醒我一些事情，是被动还是主动，是否有违初心…… 最终复盘，我的行动，我的决策，哪些是做的好的，哪些是可以改进的，哪些需要在接下来继续做，哪些需要在 2024 停止做……

后续思考：
- 目前只是浏览器的收藏夹数据，我是否还能加入更多数据，进行更全面的分析呢？例如笔记的、例如本地文件的？

当然，也可以借助其他工具，来快速出这些标签有哪些书签（我这里使用了 Obsidian 来进行可视化交互），可以发现每个书签的双链关系，利用一片叶子作为线索，拉出一片森林。

这一篇是大概的思路，希望这次分享能帮到大家~