Pi Store
更多

具透 Plus | 企图变聪明的 Chrome 与小广告止不住的 Windows

07 月 05 日

Chrome 内置 Gemini Nano 模型上线,Windows 11 的广告更多了,以及其他近期值得你关注的软件更新细节。


欢迎阅读「具透 Plus」,这是我们为会员中的软件爱好者准备的栏目。

如名称所表明,本栏目延续了首页人气栏目「具透」的关注方向,但更加深入,关注那些隐藏在更新日志字里行间、并未被广泛报道的功能和安全更新,并解释相关背景和用法。此外,本栏目将特别重视来源考证的严谨,只引述最接近官方的第一手依据,避免道听途说和以讹传讹,也方便读者按图索骥、自行探索。

总之,如果你曾经对着系统密密麻麻的更新日志感到一头雾水,或者听说了一些似是而非的新功能却不知如何找到,本栏目或许能为你解决一些困惑。

收录范围方面,本栏目主要关注 Windows、macOS 等桌面系统,Android、iOS 等移动系统,Chromium、Firefox 和 Safari 等主流浏览器,以及一些重要应用软件。我们将根据反馈情况来动态调整这个范围,也欢迎就此提供反馈。


Chrome 内置 Gemini Nano 模型上线

@PlatyHsu: Chrome 内置 AI 模型是今年 Google I/O 上揭晓的 AI 相关新功能之一。从 Chrome 127(6 月 12 日进入测试通道)起,这个功能已经可以使用了。目前,用于支撑这个功能的模型是谷歌 Gemini 系列中最小的 Nano 版本,这也是 Android 内置 AI 选用的模型。

Chrome 内置 AI 架构(来源:谷歌)

根据官方说明,启用 Chrome 内置 AI 的步骤如下:

  1. 确保安装了 Chrome 127 或以上版本(目前尚未发布正式版,因此需安装 Dev 或 Canary 通道版本),并确保有 22GB 以上空余硬盘空间;
  2. 打开 about:flags 页面,调整以下选项,并重启 Chrome——
    • optimization-guide-on-device-model 设置为 Enabled BypassPerfRequirement;
    • prompt-api-for-gemini-nano 设置为 Enabled;
  3. 在任意页面打开 DevTools(即在页面空白处点击右键,选择「检查元素」),然后切换到 Console 选项卡,输入以下语句并回车执行:await window.ai.createTextSession();。这是为了触发模型下载,目前返回错误是正常的。
  4. 打开 about:components 页面,此时应当能看到一项 Optimization Guide On Device Model,其右侧版本号不为空(否则可以点击下面 Check for update 按钮手动刷新)。这个组件首次使用时需要下载一个大约 1.28GB 的模型文件,当其状态显示为 Up-to-date 时即为下载完成。
  5. 此时回到 DevTools,在控制台中执行 await window.ai.canCreateTextSession(); 如返回 readily 即说明启用成功。

(其中,第 3 步是很多现有文章没有提到的,我在启用过程中也卡在这步比较久,提醒遇到类似问题的读者注意。)

需要指出,目前 Chrome 只是开放了一套 Prompt API 供网页或插件使用,但没有提供任何基于 Gemini Nano 的内置功能。一份不太完整的 Prompt API 文档可以在 Chrome 团队的 GitHub 找到,简言之——

  • Chrome 现在提供一个 ai 接口用于执行端侧模型请求。网页和插件可以使用 canCreateTextSession() 来检查浏览器是否支持该功能。
  • 与模型的交互是在会话(session)中完成的。为此,首先要用 createTextSession() 方法创建一个会话,在此过程中可以选填的参数包括 systemPrompt(系统提示词,字符串)、initialPrompts(现有提示词,数组)、temperaturetopK(两个控制模型「自由发挥」的常见参数)。
  • 要从模型获得输出,通过会话的 prompt() 方法发送提示词,或者用 promptStreaming() 方法获得流式输出(「打字机」效果)。
  • 已创建的会话可以用 clone() 方法复制,以及用 destroy() 方法删除。

(你也可以查阅 AI 模块的代码或者在控制台输入 ai 来了解其支持的方法。)

例如,要从当前网页获取文章正文,并通过 Gemini Nano 总结,可以在控制台运行以下代码:

const article = document.querySelector("article").innerText;

const session = await ai.createTextSession({
  systemPrompt: "Summarize the article provided by the user, maintaining the original language of the article. The summary should capture key points and main ideas, using bullet points for clarity and conciseness. Ensure the summary is no longer than 5-7 bullet points, covering the introduction, key arguments, and conclusion."
});

const result = await session.prompt(article);
console.log(result);

我用了少数派最近一篇大约六千字的文章做测试。在一台 MacBook Air (M2, 2022) 上运行代码大约花费了 15 秒;在此期间,Chrome 的 CPU 占用率从 1.1% 提高到 4.6%,内存占用增加了大约 1.1GB,应该说是比较轻量的,对大多数当代电脑配置压力不大。

不过,限于 Gemini Nano 模型的能力(也可能是我使用姿势不对?),获得的效果有点一言难尽,并且还出现了幻觉。

如果你不想自己写代码,也有一些现成项目可以用对话式界面来和内置 AI 交互,例如 Lightning Joyce 的 chromeai.co。我因为不是很死心,又挑了几个这两天问过 GPT 的问题来问 Gemini Nano。结果……请大家自己判断。

同学醒醒

但这个效果倒也不完全出乎意料。根据谷歌此前提供的 Gemini 模型信息,Nano 有 1.8B 和 3.25B 参数两种版本,均采用 4-bit 量化。从下载尺寸看,Chrome 中用的应该是 1.8B 版本。至于实际性能,由于谷歌并未提供 Gemini Nano 的 API,没有太多可供参考的测试成绩,唯一有一定可比性的通用测试是 MMLU (5-shot),谷歌公布的成绩是 45.9。与其他几个热门轻量模型对比,Phi-3 Mini (3.8B) 的成绩是 68.8,Mistral 7B 是 60.1,Llama 3 8B 是 68.4(来自各自官方数据)。

诚然,这个对比不太公平,但考虑到 7B 尺寸的模型在很多电脑上也能跑得起来,在线模型也越来越便宜,对于其实没那么看重本地运行隐私性的日常用户而言,Gemini Nano 的竞争力确实不太高(君不见当初有多少人哭着喊着想要在隐私地狱 Bing 开通 GPT-4),唯一有优势的可能就是 32K 的上下文窗口了。不过 Chrome 内置 AI 据谷歌说法是一个通用框架,理论上可以接入更多模型,这就有待后续观察了。

Windows 11 的广告更多了

@克莱德:下次遇到「什么系统广告最多」这个话题,讨论的时候别忘了带上 Windows 11。

在早前的首页文章中我们有提到,部分 Windows 11 的广告是关不掉的,比如设置页面中的 Copilot 推广。或许微软也知道系统设置是块「风水宝地」,在近期推送给稳定通道的 KB5039302 更新中,已登录微软账号且「主动在设备上玩游戏」的用户还将看到 Xbox Game Pass 的广告……大概长这个样子:

这还没完——最近采用新设计的 Windows 11 天气应用也已经开始推送了,新设计谈不上惊艳,倒是让原本嵌入在信息流里的广告卡片更加直观了。一般而言,你能在当前天气状态和详细信息两个区域找到两个固定的广告位——体验与部分国产 Android 定制系统看齐。

略有不同的是微软良心尚存(一点),因为关掉这个广告的方法还是有的,并且有点幽默:将天气的窗口调小一点,广告卡片就会自动隐藏。你看,微软也是知道小设备屏幕显示区域「寸土寸金」这个道理的嘛。

说完坏消息说点好消息。微软调整了任务栏最右侧「显示桌面」按钮的显示逻辑。此前因为 Copilot 按钮的出现,这个按钮在部分地区被挤出了 Windows 的任务栏,引来了诸多老用户的不满。要知道这个按钮早年可是能够实现鼠标悬停即可透视的效果(Windows Aero Peek),它在 Windows 11 中本就挨了一刀,现在硬要「蒸发」掉更可以说是「违背祖训」。

会员专属文章,欢迎加入少数派会员。
优质内容
权益周边
会员社群
power+
评论区
精彩评论0
成为少数派会员方可评论,立即加入 。若已是少数派会员,点击登录
还没有评论,来发表第一个评论吧
精彩评论
还没有评论,来发表第一个评论吧
成为少数派会员方可评论,立即加入 。若已是少数派会员,点击登录
会员新功能
内容侧边栏
点击这里拉开侧边栏,即可查看会员内容列表,快速切换内容。