续上片收藏夹清灰术《年终整理分享:收藏夹清灰术,方案与工具(上)》,清理完收藏夹灰尘,下一步就是真正地整理收藏夹了。
01 🥗
整理收藏夹的目的,我希望能达成两个目标:
- 将过时的,无用的书签清理掉。(已完成)
- 复盘,挖掘,希望能知道自己收藏了什么,反思自己,分析自己。
于是,有了下面的行动。
首先,将数据输出成 .csv
格式,为了能在本地快速应用和查看。
但就这么看清理好的数据,emmm,有什么用? (盯了老半天完全没概念,是打开方式不对?)
那根据层级结构,输出成树形图呢?将书签数据转换成 .json
格式(更方便解析),用 D3 渲染出来看看。
emmm,也不对!
数据是有了,用表格呈现。密密麻麻的一行一行来文字,无法在脑海里形成清晰的脉络。而树形图呈现,得到的是收藏夹的层级结构结果,我的脑子盯着得不到任何反馈,还是一脑子浆糊,也没有意义。
似乎僵住了,单纯是这样没法形成清晰的概念,没法辅助我复盘和决策的。我希望的是有更直观,更短的反馈方式,来让我对这堆数据有清晰的概念。
(在上一篇有朋友提出,哪怕还剩下九百多个,有什么用呢? 这也是我在思考的。)
02 🍲
想起我一直使用的笔记系统,《卡片盒笔记法》。映射出来,其实收藏夹书签也是我的笔记的一种笔记形式,只是没有我的总结,但它们是自己可以表达内容的。
怎么做呢?
我认为重点是建立关联,进行视觉转化(这个我擅长!),然后交给我的眼睛和大脑。
步骤:数据挖掘 -> 数据可视化 -> 主观分析
02.1 数据挖掘
建立关联,我打算用每个标签里面的内在分类,来建立标签之间的联系。
数据已经整理好了,每个书签可以提取出分类信息的。我可以从标题、链接地址、还有书签的目录路径,推断出它的分类标签。
例如一个书签书签,他的信息有:
- 标题:『轻松实现 Web 性能优化 - 掘金』
- URL:『**juejin.im/post/5bf8ef7d51882**』
- 目录:『书签栏/Article/FrontDev』
我会给他打上『前端、技术、性能、优化』这样的标签。
不过目前剩下的还有一千多个书签,我当然不可能一个个标签这么打(又想偷懒)。
每条书签的分类标签建立,其实是也是文本工作,可以交给大语言模型来处理。这可以帮助我批量快速的处理所有数据~(是否靠谱我们后面再看看)
现在挺多的文本处理模型可以使用,做这件事情的时候,刚好 Google 的 Gemini 发布,就尝尝鲜吧~ 利用 Gemini Pro 的接口,将每个书签的标题、URL、目录信息告诉 Gemini,然后它返回标签建议。效果如下:
第四行是 Gemini 的分类标签结果,看起来还行,输入的字面上没有的字也能出现在标签上,能用了~
写个程序,让程序自动与 Gemini 交流,逐个为我的书签建立标签。1
如此,每个书签,就能根据标签进行关联,产生联系。达到连点成线,连线成面的效果了!
02.2 数据可视化
我可以由很多维度来解读这份信息。
首先,可以从书签的数量上统计:
已经能看到一些东西了,再加上时间的维度呢?
02.3 主观分析
总体上看,我这几年关注的是编程、前端、技术的领域……
2023 年收藏架里产生了 125 个标签分类,关注的领域是人工智能、地理信息,以及自动驾驶领域……
2022 年收藏架里产生了 109 个标签分类,关注地理信息、数据可视化,渲染领域,这些信息更多在知乎上找到……
确实是这样,我的行动不会骗我,可以看到我的专注点迁移。因为工作原因,2023 年从地理信息、数据可视化的技术领域,转移到了自动驾驶、人工智能领域……(巴拉巴拉,省略年终总结部分)
03 🥣
这些数据是基石,是养料。形成这些数据,不是目的,而是利用这些信息,给我提供更多维度,更多线索,发现自己,发现历史。我的行为,我的历史,不会骗我自己。
例如:原来,去年到今年,我关注的变化,我关注的技术领域,已经默默发生了变化,这警醒我一些事情,是被动还是主动,是否有违初心…… 最终复盘,我的行动,我的决策,哪些是做的好的,哪些是可以改进的,哪些需要在接下来继续做,哪些需要在 2024 停止做……
04 🍰
后续思考:
- 目前只是浏览器的收藏夹数据,我是否还能加入更多数据,进行更全面的分析呢?例如笔记的、例如本地文件的?
当然,也可以借助其他工具,来快速出这些标签有哪些书签(我这里使用了 Obsidian 来进行可视化交互),可以发现每个书签的双链关系,利用一片叶子作为线索,拉出一片森林。
这一篇是大概的思路,希望这次分享能帮到大家~
参考
- 《How to Take Smart Notes》(《卡片笔记写作法》)