上周,备受业界关注的《通用数据保护条例》(GDPR,传送门)正式在欧盟地区开始实施,这一新条例取代了之前的数据保护指令(DPD)。GDPR 对各大企业公司在用户个人数据的保护上提出了更加严格的要求,其中关于数据主体的权利部分,条例明确规定数据的可迁移性:数据主体有权接收关于他们的个人数据。
尤其在今年上半年,Facebook 隐私丑闻事件引起不少人对于个人数据安全性的担忧,存放在互联网厂商里的数据有没有得到安全保障?
针对数据的可迁移性,几家互联网巨头已经陆续为自家产品服务推出类似个人数据打包下载的功能,这篇分享文希望帮助大家整理有哪些互联网公司提供了用户数据下载入口,有哪些途径去下载?我们能够下载到个人数据又包括了哪些信息?
想了解《通用数据保护条例》,可以阅读这篇文章:《关于 GDPR 你需要了解的一切》。
苹果
本周,苹果推出了一个全新的数据和隐私 网站,可以让用户更方便地下载或者删除保存在服务器上的 Apple ID 个人数据。同时用户还可以修改苹果收集的个人信息,或者关闭、甚至删除自己的账户。 经过网上查询相关信息,这一备份和下载数据的服务目前仅面向欧盟、冰岛、列支敦士登、挪威和瑞士的苹果账户开放使用,预计要到今年年底前才会开放全球用户使用。据网上公开信息显示,苹果上线的主要功能是获取你的数据备份,包括了用户个人信息,比如购买和应用的下载历史、存储在苹果服务的数据。
需要注意的是,用户提出下载信息的申请后,需要等待 7 天的时间,苹果官方确认申请来自用户本身后,会向用户发出通知,用户通过 Apple ID 的账户页面下载对应的存档文件。
经过测试,目前苹果中国官网的数据和隐私页面中,提供了填写表格申请的方式来获得个人的数据备份。具体操作:
打开 网站,首先使用 Apple ID 登录,登录成功后,网页提示可以通过两种方式管理用户的数据,分别是更正数据、删除帐户。其中「删除您的帐户」选项中,会有下载个人数据功能。
点击「获取您的数据拷贝」后通过提交工单的形式来请求访问自己的数据。最后提交后只需等待苹果官方反馈的信息即可。这种通过工单形式获取数据的方式虽然效率比较低,但也在一定程度保护了用户数据不被随便下载的风险。
作为 Google 产品服务的「轻度」用户,使用 Google Takeout tool 网站来下载各个产品的数据。Google Takeout tool 详细地列出了用户曾经使用过的 Google 服务产品,并且通过简单的开关按钮自定义需要下载哪些产品的数据到本地。
另外,我们还可以针对不同的产品调整下载的数据类型,以 Chrome 浏览器为例,可以选择下载包括浏览器的自动填充 Autofill 记录的数据、书签、历史记录、扩展、搜索引擎设置以及浏览器本身的设置选项等内容。
选择好哪些产品需要下载数据后,点击「下一步」将出现自定义归档文件格式的页面,用户可指定下载文件的类型、大小(上限)、提供方式(电邮或者存在至网盘空间)。
确认之后,下载服务会在后台准备数据(时间大概只有几秒钟时间)。完成数据准备工作后,如果之前选择了通过邮箱的方式提供归档文件,那么邮箱会收到可下载归档文件的通知,我们也可以在 下载页面 中直接查看并下载对应的归档文件。需要注意的是,这份压缩的个人数据文件仅在 Google Takeout Tool 线上保留一个星期的时间,逾期后会无效。
如果仅下载我个人使用的 Chrome 数据,解压后的文件大小约 2MB,其中历史记录的 JSON 文件大小超过了 1MB,下载到本地的文件包括了 index.html 网页文件和 Chrome 文件夹。如果用浏览器打开 index 文件,网页内容是对下载到本地各个文件类型做出说明。
单独打开 Chrome 文件夹,里面包括了以 JSON 格式保存的 Autofill、历史记录、扩展、搜索引擎设置、浏览器本身的设置信息,以及以 html 格式保存的书签记录、csv 格式保存的字典文件。在以后 Chrome 浏览器的数据恢复过程中,上面的文件就起到很好的作用。
如果需要下载全部产品的数据存档,需要等待较长的文件准备时间,而且得到的文件大小会比较大(比如我选择下载全部产品的数据,得到的压缩文件大小为 159MB)。
微软
打开微软官方的 隐私仪表板 Privacy Dashboard,登录账号后将看到关于各类微软产品的隐私设置选项。依次选择「下载你的数据 - 创建新存档」后,将跳转至设置下载数据类型的页面,网站会根据你存档的数据大小,等待几分钟才能获得存档文件。
目前,微软提供的存档数据包括了浏览历史记录、语音交互、搜索历史记录、电影/电视和音乐历史记录、位置活动、应用和服务使用量共六种类型。
解压下载得到的存档数据,比如搜索历史记录以 JSON 文件提供数据,里面记录了用户曾经与微软帐户关联的必应或者 Cortana 的搜索历史记录,我自己的下载记录显示了曾经在 1 月 12 日搜索了关键词「火绒」,并且打开了火绒安全的官网。
如果选择下载全部数据,我得到的文件大小不足 200KB,蛮有意思的是,会在语音交互的记录文件里,找到我曾经使用 Cortana for Android 应用下达的语音指令,InkingTypingAndSpeechUtterance.json
文件则记录语音指令的时间、方式和转换的文字记录。所以,建议大家在下载完个人存档文件后,通过隐私仪表板的 活动历史记录 页面,选择删除一些较为敏感的隐私数据。
Twitter 作为国外重要的社交平台之一,虽然大部分时候并不会出现「此内容已被删除」这类被消失的情况,但是我们依然需要重视保存自己的推文信息。
打开 Twitter 的设置和隐私 页面,在账号内容中找到「请求你的存档」的入口,点击按钮后将弹出「我们已收到你的请求」,并且提示:当你的存档准备好下载时,我们将把下载地址通过邮件发送给你。登录注册 Twitter 时的邮箱,将看到官方发来推文存档准备就绪的提示邮件。
解压下载的压缩文件,文件夹里包含了 index 网页文件、README 文本文件、tweets.csv 文件,其他还有 CSS、data、img、js、lib 文件夹。使用浏览器打开上面的 index.html 网页,我们将看到左右边栏布局的页面,右边栏目以年份、月份划分了 tweets 存档数据,点开其中的月份会在左边栏目看到曾经发过的推文记录(包括头像图标、图像数据)。
其中 tweets.csv 文件里完整记录了发推记录,包括发表的时间、方式(Web、移动设备)、推文内容、是否有被转推的记录、用户 id 的有用信息,稍微不足的是下载的存档文件并没有图片文件,如果需要查看仍然需要联网打开图片。
依次打开「 Instagram 隐私与安全 - 请求下载」,将跳转至「获取你在 Instagram 分享内容的副本」的页面,Instagram 的备份数据发送到用户指定的电子邮箱,所以需要确认要发送的邮箱地址无误后,点击「继续」,输入 Instagram 密码后再点击「请求下载」,剩下的工作就是等待官方发来的邮件,根据提示从数据收集到发送这一过程可能需要 48 小时。
在测试过程中,只需等待 2 - 3 分钟的时间即可收到 Instagram 发来的下载邮件,下载链接只有 4 天的有效期。Instagram 提供的备份数据包括了 photos、profile 文件夹(包括发表的照片、头像),以及 comments、connetions、contacts 等多个 json 文件,完整记录了在 Instagram 产生的活动数据。
结语 | 对个人数据应该有更透明的权利
之前我派的另一篇关于账户注销删除的文章《为了响应工信部要求,我们整理了这些网络账户注销指南》获得了不少人的关注和反馈,很多用户更期待互联网厂商开放对个人数据的自主权利,比如换绑号码、删除账户,或者是正如这篇分享文提到的,有更加便捷的数据下载备份途径。
随着 GPDR 在欧盟地区逐步实施,我们看到了国外厂商纷纷更新自身的服务条款和用户协议,在数据透明度上做出可见的努力。 最后,我也希望国内互联网厂商们能够持更开放、更透明的做法,提供更多数据下载备份的途径和工具,将用户数据交回给用户。