Matrix 首页推荐

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。

文章代表作者个人观点,少数派仅对标题和排版略作修改。

写在前面

由于工作需要,我开始研究搜索引擎优化(也就是 Search Engine Optimization),其实这个课题本来分为两部分——SEO 和 SEM(Search Engine Marketing)。一般来说,SEM 特指以付费广告的形式进行网站引流的工作,也就是通过 Google Ads 做付费的引流,不是本文讨论的范畴。本文讨论主要通过技术手段和内容优化达到在 Google 搜索引擎自然排名提升的效果,当然也有可能会有付费工具,但本质思路不是通过直接买流量获得转化。

虽然本文是中文内容,但讨论的主题是基于 Google 的搜索引擎优化,当然很多内容也适应 Bing 搜索,百度应该也是可以吧。在重度使用 Google 和 Bing 搜索的近一年中,确实感受到了不同搜索引擎的特点,现在偶尔使用百度搜索还是很不适应,广告太多,而且具有欺骗性,自然排名质量也不高,经常搜到来自知乎和搜狐的低质量内容。Google 和 Bing 相对好一些——广告标注清晰,界面简洁易用,搜索结果质量都不错,问答知识类内容结果都有深度和专业性,能够解决用户的问题。

本文是相对初级地介绍 Google 搜索引擎的逻辑和提高搜索结果的方法,具有一定实操性,可以帮助你解决一些困惑。由于一些原因,本文有些外网链接可能打不开,作者表示抱歉。

前提:你的网站是否被 Google 索引

Google 是否抓取你的站点

如果你新建了一个站点——无论通过 Shopify 还是 WordPress 等等——Google 收录站点需要一些时间,Google 文档没有给出具体的时间长度,只是说明了没有被抓取的原因,我们可以根据这些原因分析问题出在哪里。

部分内容截图

检验方法

在 Google 搜索中直接搜索 site:xxx.com,如果没有任何结果,说明尚未收录。举个例子:在Google搜索框中输入 site:liangxile.icu

这样就是网站并没有被 Google Bot 抓取到,需要手动在 Google search console 里添加网站信息,这样才会更容易被抓取从而在搜索的时候有可能现在显示在 SERP(维基百科)(search engine result page)Google 的搜索结果页。

而如果搜索结果可以显示网站链接那就说明抓取成功,可以进行 SEO 优化。当然也可以在 Google 搜索中测试几个与站点相关的关键词,看看网站的排名如何,不过绝大多数网站在建站之初是很难在前 30 页中找到的,除非你的站点确实做了 SEO 优化并上传了和优质的内容,或者你搜索的关键词是相对唯一确定的,否则像「衣服」这种很广泛的关键词会导致你的网站排名在 50 页开外,注意是「页」还不是「条」。

添加站点地图到 GSC(维基百科)(Google search console)

确保站点 SSL 证书

由于这几年人们越来越在意网站的安全性,所以起初的 HTTP 协议已不能保证我们点击链接的安全性,所以就有了 HTTPS。简单讲,就是有 HTTPS 的网站更安全,地址栏也会有个锁子的图标。而在点击没有 HTTPS 的网站时大多数主流的 浏览器 都会有安全提示,Google 也明确建议所有网站都使用 HTTPS,所以在 GSC 提交站点地图之前,确保网站已安装 SSL 证书。

添加站点地图到 GSC

首先,如果你的网站是 WordPress、Wix 或者 Blogger 等 CMS 内容管理平台,可以不用单独在 GSC 添加站点地图,平台会自动添加。

Google 对于站点地图的说明

其次,如果你是 Shopify 商店的付费用户,那么 Shopify 会为你自动生成站点地图,你只需要将站点地图添加到 GSC 的站点地图一栏就行。

最后,其它更复杂的添加方式可以参考 Google 关于 创建和提交站点地图 的教程。

阻止抓取隐私内容

网站如果有隐私内容,可以通过 robot.txt 来阻止 Google 的抓取,点击这里 可以查看使用方法。

帮助 Google(和用户)了解网站内容

检查网站的内容

通过在 GSC 的网站检查一栏对你站点的每一个页面进行检查,确保 Google 看到的页面和用看到的页面是一样或者没有太大偏差的,也就保证我们针对网站的优化是可以被直接反馈的。当然,网站检查的前提是已在 GSC 添加站点并验证域名。

我们可以根据检查结果对我们的网站进行优化。

确保网站中的网页标题简单准确

网站的标题的字符数并不是越多越好,不意味着你在标题里埋的关键词都会是你的排名更靠前。标题不光是要写给搜索引擎看的,用户也需要能明白标题的含义。

我们通过这样一个方法来佐证我们标题字符数量:在 Google 中搜索与你当下页面内容最核心的关键词,排除带有「ads」标志的广告,看一下前两页的自然搜索排名中每个结果标题的字符数量取个平均值,那么我们要做的是取平均值的 110% 长度,并避免最核心的关键词出现在后 20% 的长度而被折叠。这是我正在使用的方法,推荐给你。

当然,各平台的第一方建议也是值得参考的,比如 Shopify 在搜索引擎优化的标题建议字符数是 70 个。

要避免的做法

  1. 选择与网页内容无关的标题
  2. 为网站的所有页面或大量页面使用同一个标题
  3. 使用对用户来说不实用的冗长标题。
  4. 在 title 标记中填充不需要的关键字。

Meta Description——网站的摘要

Meta Description 是显示在搜索结果的页的网站链接摘要,他可以帮助解释这条链接的主要内容,会促进链接的点击率。可以肯定的是 Meta Description 不会直接帮助我们在 Google 搜索排名中获得更靠前的位置,因为早在 2009 年 Google 在确定网页排名时不会考虑 keywords 元标记,但是更有吸引力的 Meta Description 会提高我们链接的点击转化率,也就是说 Meta Description 是写给用户看的。

字符数量

同样,我们可以采用 110% 平均法则,并将最核心关键词放在前 80% 避免折叠。另外 Shopify 这里给出的字符数建议是 320 个,仅供参考。

一项关于 Meta Description 研究 显示,160 个字符左右是比较合适的,这个研究统计了 15 家公司在 Google 搜索结果页的 Meta Description,基本都少于 160 字符。

如何快速写摘要

  1. 把 keywords 埋在自然语言中,保持语句通顺
  2. 确保向用户传递价值
  3. 加入 Call-to-action 的字样,比如「了解更多」
  4. 不要偏离网页主题
  5. 每个网页采用独立的 Meta Description,不要重复。

要避免的做法

  1. 编写与网页内容无关的 description 元标记。
  2. 使用「这是一个网页」或「与棒球卡相关的网页」等通用说明。
  3. 仅使用关键字填写说明。
  4. 将整个文档复制并粘贴到 description 元标记中。
  5. 为网站所有网页或大量网页使用同一个 description 元标记。
  6. 在标题标记中放置对定义网页结构无用的文字。
  7. 在更适合使用 <em> 和 <strong> 等其他标记的地方使用标题标记。
  8. 毫无规律地使用不同长度的标题标记。
  9. 在网页上过度使用标题标记。
  10. 标题过长。
  11. 仅出于为文字添加样式(而非为了呈现结构)的目的使用标题标记。

添加结构化数据标记

HTML 代码标记

以合理的机构化数据标注可以帮助我们的网页在搜索结果页得到更好的显示——

可以标注的 功能库

Article、book、面包屑导航、轮播界面、course、dataset、employeraggregaterating、event、事实核查、FAQ、居家活动、how、图片许可、jobposting、职业培训、本地商家、logo、数学求解器、movie、估算工资、播客、练习题、product、问答、recipe、评价摘要、站点链接搜索框、软件应用、speakable、订阅和付费内容、video。

——总共 31 种类型。而对于电商来说,book、FAQ、product 和评价摘要非常实用,可以帮助商家更好的在搜索页展示商品信息,还是很值得做的。

一些案例

结构化数据标记工具助手

使用 GSC 标记助手可以在不使用代码的情况下,对数据进行标注,对于没有前端代码背景的人来说非常友好。

Google 富媒体搜索结果测试

标记完成后为了确保标记正确,我们可以借助 Google富媒体搜索结果 来测试标记是否达到目的。

要避免的做法

  1. 使用无效标记。
  2. 在对标记实现还没有把握的情况下更改网站的源代码。
  3. 添加用户看不到的标记数据。
  4. 制作虚假评价或添加无关标记。

组织网站层次结构

清晰的网站导航

Google 建议我们要为网站建立层次清晰的导航,这样来到网站的用户才不会迷失,也会减少网站的跳失率。

使用面包屑导航

在网站的页面使用面包屑导航,这样无论用户在哪个页面都会快速地找到自己所在的位置,并将面包屑导航放在比较显眼的位置,方便用户发现。

XML 站点地图文件

上文提到的站点地图文件也会起到组织网站层次的作用,并及时确保搜索引擎能够发现网站上新增网页和更新后的网页。

要避免的做法

  1. 创建复杂的导航链接网页,例如将网站上的所有页面都相互链接。
  2. 过度拆分内容(以至于从首页前往目标内容过程中需要点击 20 次)。
  3. 创建完全以图片或动画为基础的导航。
  4. 导航需要使用以脚本或插件为基础的事件处理功能。
  5. 任由导航页内容过期、链接损坏。
  6. 创建一个只是简单罗列页面而不加以整理(例如按主题)的导航页。
  7. 允许搜索引擎将您的 404 网页编入索引(确保网络服务器配置为:当请求访问不存在的网页时,返回 404 HTTP 状态代码;如果是使用 JavaScript 的网站,则包含 noindex 标记)。
  8. 通过 robots.txt 文件阻止抓取 404 网页。
  9. 仅提供模糊的消息,例如「未找到」、「404」或根本没有 404 页面。
  10. 404 页面使用的设计与网站其他部分的设计不一致。
  11. 使用含有不必要的参数和会话 ID 的冗长网址。
  12. 选择使用通用网页名称,例如 page1.html。
  13. 使用过多的关键字,例如 baseball-cards-baseball-cards-baseballcards.html。
  14. 具有深层嵌套的子目录,例如 .../dir1/dir2/dir3/dir4/dir5/dir6/page.html
  15. 使用与其内容无关的目录名称。
  16. 让子网域和根目录的网页访问相同内容,例如 domain.com/page.htmlsub.domain.com/page.html

优化内容

Google EAT 原则

首先,需要说明一下的是,在现在基于 web 的网站是拥有者需要生产一些内容来进行导流的,很少有新建的网站有自带很大的流量,除非是由来已久的品牌。这样一来,如果社交平台无法从社交网络为网站带来流量的话,基本上就得靠优化搜索引擎排名来争取更多流量了。当然付费广告也是一种途径,不过不在本文的探讨范围内。

确定了通过在网站生产优质内容达到导流的目的之后,我们就要看看什么样的东西才称得上是好内容。Google 对好内容有三个原则:Expertise 专业性、Authority 权威性、Trustworthiness 可信度

Expertise 专业性

Google 之所以会在众多网站生产的内容当中选择把你的链接排在靠前的位置,是因为你的内容具有专业性,能给用户带来价值,这个有可能是一个产品指导说明,也有可能是一个问题的解决流程,总之就是在你所讨论的话题下,你写的内容对用户有价值,能帮助到他。

Authority 权威性

在一个话题之下,大概率有很多人或者组织都想生产自己的内容,那么 Google 考虑选谁呢?Google 还要做的一个分析是在众多内容中有哪些内容中会参考更权威的网站引用。如果有两篇文章写得话题都是如何做好 Google SEO,那么那个文章中频繁引用来自维基百科、Google SEO 官方指导文档、以及权威数据机构的链接那么他显然好于一篇没有外连接引用,或者引用不知名网站的参考资料,这就是权威性的逻辑。

当然,你的文章中如果只是大量复制权威网站的链接也是不行的,需要语义通顺适合人类理解,Google 的爬虫还是很智能的,小花招是很容易被识别的,乖乖做好内容。不过有个建议:在完成内容生产后,可以检查内容当中有没有哪些东西是可以链接到像维基百科这样的权威网站的,这是一个加分项。

Trustworthiness 可信度

内容生产也必须符合可信度原则,参考的数据和文献必须真实可靠,这样用户才会给你的网站一个好的反馈,比如重复访问。

要避免的做法

  1. 编写的文章马虎草率,有许多拼写和语法错误。
  2. 文笔欠佳。
  3. 在图片和视频中嵌入文本:用户可能想复制和粘贴这些文本,但搜索引擎无法读取该文本。
  4. 将大量不同主题的文字堆砌到网页上,不分隔段落、子标题或布局。
  5. 稍加改动(甚至复制)现有内容几乎不能为用户带来额外价值。
  6. 网站上到处是重复或近似重复的内容。
  7. 插入大量针对搜索引擎的不必要关键字,这些关键字让用户感到厌烦或对他们毫无意义。
  8. 含有「试图访问此网页时的常见拼写错误」等对用户几乎没有价值的文本。
  9. 以欺骗手法对用户隐藏文字,但对搜索引擎显示这类文字。
  10. 提供不足以阐明网页用途的内容。
  11. 在您的网页上投放会分散用户注意力的广告。
  12. 使用宽泛的定位文字,如「网页」、「文章」或「点击此处」。
  13. 使用与主题或链接到的网页的内容无关的文字。
  14. 在多数情况下将网页的网址用作定位文字。虽然这样做在某些情况下也合情合理,如宣传或引用新网站的地址。
  15. 撰写很长的定位文字,如一个长句或一小段文字。
  16. 使用 CSS 或文本样式,让链接看起来像常规文本。
  17. 仅仅为了搜索引擎而使用冗长或关键字泛滥的定位文字。
  18. 创建不利于用户在网站中导航的不必要链接。

建议的做法

  1. 保证内容准确和及时更新(SEO 2021→SEO2022)
  2. 引导更多的评论并回复它们
  3. 积极展示 about、team、contributors(在内容最后添加为本文做出贡献的其他人或者组织等)
  4. 留下联系方式(留下你的联系方式让用户可以找到你,产生联系)
  5. 社交分享(内容上线后积极在社交网站分享内容,并完成传播)
  6. 邮件给订阅者发送更新(为你的网站订阅用户发送内容更新,做到不打扰用户的前提下)
  7. 注意文章的实用性,对用户的指导意义。
  8. 通过段落划分,合理组织文章结构(文章摘要、H1、H2、H3、H4)
  9. 不要分散用户浏览的注意力-尽量减少广告
  10. 如果可以在文章中提供视频、播客、PDF 下载等丰富形式的资源
  11. 提供 FAQ 板块为用户解答常见的问题,当然如果有在线问答也是好的
  12. 在内容长度上,尽量生产长篇深度的文章,英文词汇超过 3000 个可以作为一个参考标准
  13. 视频和图片上传时注意文件名称,与页面主题相关的名称会有好处,并积极添加alt标签,更利于爬虫爬取

内外部链接

内部链接

提供尽可能多的内部链接,比如电商网站可以相互链接相关的产品,以及网站中的博客文章等。

外部链接

如上所说,提供尽可能多的权威的有价值链接。这里引入一个概念-负链接。负链接指你想在文章中引用的链接但是这个链接来自竞争对手,你并不想给他导流。你可以在代码内添加 rel=no follow 字段,具体操作方法可以参考 漫游器元标记

优化图片

建议的做法

  1. 使用 HTML <img> 或 <picture> 元素。
  2. 为图片提供说明性文件名和 alt 属性说明。
  3. 使用图片作为链接时提供替代文字
  4. 添加 图片站点地图,提高图片出现在 Google 图片搜索中出现的几率。
  5. 使用标准图片格式。

要避免的做法

  1. 使用 CSS 显示您希望我们编入索引的图片。
  2. 在可能的情况下均使用 image1.jpgpic.gif1.jpg 等宽泛的文件名。如果您的网站有数千张图片,您可能希望自动为图片命名。
  3. 文件名非常长。
  4. 替代文本中充斥着关键字,或复制粘贴整个句子来作为替代文本。
  5. 撰写会被认为是垃圾内容的超长替代文本。
  6. 网站导航仅使用图片链接。

优化移动端

响应式设计

移动端的重要性如今越来越高,并会继续增加,人们更愿意使用手机访问网站,而且很多用户在触及网站的来源很多也和社交媒体有关,所以设计一个响应式的网站兼顾 PC 端的体验是很有必要的。注意这里说的是移动端为主,并在上述所有优化时把移动端效果作为重要参考因素,不只是看看 PC 端的效果。

移动端测试

利用 Google的移动端设备适合性测试 检验我们网站在移动设备上的表现,并根据建议优化不足的地方。还可以通过 Google search console的「移动设备易用性报告」修正会对您的网站在移动设备上的易用性造成影响的问题。

要注意的问题

  1. 如果您动态提供内容或拥有单独的移动网站,当网页采用适合移动设备的格式时(或当网页拥有所用格式适合移动设备的对等网页时),请告知 Google。这有助于 Google 在搜索结果中准确地向移动设备搜索用户提供内容。
  2. 如果您使用自适应设计,请使用 meta name="viewport" 标记告诉浏览器如何调整内容。如果您使用的是动态提供内容功能,请使用 Vary HTTP 标头,根据用户代理指示您所做的更改。如果您使用单独的网址,则可以通过向网页添加包含 rel="canonical" 和 rel="alternate" 元素的 <link> 标记,指明两个网址之间的关系。
  3. 确保资源可供抓取。屏蔽网页资源会致使 Google 无法了解您网站的全貌。当您的 robots.txt 文件阻止了对您的某些或所有网页资源的访问时,通常会发生这种情况。如果 Googlebot 无法访问某个网页的资源(如 CSS、JavaScript 或图片),那么我们可能无法检测出该网页是专门为了在移动设备浏览器中正常显示和运行而构建的。也就是说,我们可能无法检测到该网页是适合在移动设备上浏览的网页,因而不能以适当的方式向移动搜索用户提供该网页。
  4. 避免出现会阻碍移动设备访问者访问网页的常见错误,比如存在无法播放的视频。
  5. 如果移动版网页无法提供令人满意的搜索体验,那么在移动搜索结果中的排名便会下降,或是在移动搜索结果中显示时伴有警告。这类情况包括但不限于,移动设备上会妨碍用户体验的全页插页式广告。
  6. 在所有设备上提供所有功能。移动用户希望网站在移动设备上提供和在其他设备上一样的功能(如发布评论和结帐)及内容。除了文字内容,确保所有重要图片和视频都已经嵌入移动版本,并且用户能通过移动设备访问。对于搜索引擎,在所有版本的网页上提供所有结构化数据和其他元数据(例如标题、说明、link 元素和其他元标记)。
  7. 确保移动网站上也包含桌面网站上所有的结构化数据、图片、视频和元数据。
  8. 测试并优化移动端 page speed
  9. 使用 schema.org 结构化数据
  10. 基于地理位置的优化

推广网站

社交媒体分享

要避免的做法

  1. 事无巨细地推广所创建的每一个新内容;应该推广精彩、有趣的内容。
  2. 对网站采用链接方案,在这些服务中人为地置顶您的内容。
  3. 将链接请求不加挑选地发给与您的主题相关的所有网站。
  4. 从另一个网站购买链接,以提升 PageRank。

分析搜索效果和用户行为

分析搜索效果——Google search console

  1. 了解 Googlebot 无法抓取网站的哪些部分
  2. 测试及提交站点地图
  3. 分析或生成 robots.txt 文件
  4. 移除 Googlebot 已经抓取的网址
  5. 指定首选网域
  6. 找出 title 和 description 元标记中的问题
  7. 了解用来转向网站的热门搜索
  8. 了解 Googlebot 看到的网页外观如何
  9. 接收质量指南违反通知,并请求重新审核网站

分析网站上的用户行为

  1. 洞悉用户如何找到您的网站以及在您的网站上有何行为
  2. 发现您网站上最受欢迎的内容
  3. 衡量对网站所做的优化带来的影响,例如,更改 title 和 description 元标记是否提高了搜索引擎带来的流量?

要注意的问题

  1. 浏量来源
  2. 网站页面加载时间
  3. 跳出率
  4. 设计发爬虫机制

语音搜索

要注意的问题

  1. 了解用户的类型和基于设备的浏览行为
  2. 关注对话中的关键词(Conversational Keywords)更多的缩写词、网络流行词等可作为参考。
  3. 创建基于角色的内容(Persona-Based Content)
  4. 提供有框架标记的上下文(Schema Markup)
  5. FAQs Page(Who、What、Where、When、Why、How)提供更多的问答内容,解决用户的困扰。
  6. Mobile-First 语音的输入端基本都在移动端,优化移动端的必要性
  7. Local-如果可以尽可能提供本地服务

SEO 自动化

自动化在 SEO 领域并不算冷门的话题,在需要处理大量数据的时候自动化确实给我们节省很多的时间。关于 SEO 的自动化,我们可以做的有以下几个方面:

  1. 网站监控,我们对网站的内容做了优化之后都需要看看更改之后的浏览数据是否得到了提升,这个时候就需要监控用户浏览时间,跳出率等等帮助我们做决策、
  2. 排名跟踪,如果我们网站有很多个网页都出现在搜索结果页的排名中,那么定期查看排名的变化情况就很有必要了。
  3. 反向链接分析,当我们网站被很多其他网页频繁引用时,分析反向链接就变成了一个大量的工作,通过自动化的分析可帮助我们省去很多时间。
  4. 自动化监控竞争对手,通过自动化监控竞争对手的网站可以帮助我们快速看到对手的变化和策略,从而应对自如。

拓展链接

> 下载少数派 客户端 、关注 少数派公众号 ,了解更妙的数字生活 🍃

> 想申请成为少数派作者?冲!