搜索引擎无法读取和人类一样可以网页,所以我们结合结构和线索,以什么我们的内容的手段。这有助于提供将查询与有用结果相匹配的搜索引擎优化的相关性元素。
了解用于捕获此含义的技术有助于提供关于我们内容相关内容的更好信号,并最终帮助其在搜索结果中排名更高。这篇文章探讨了一系列 页面上的技术,这些技术不仅可以互为基础,而且可以通过复杂的方式进行组合。
尽管Google并未透露其算法的确切细节,但多年来,我们已经从访谈,研究论文,美国专利申请以及数百家搜索营销商的观察中收集了证据,以便能够探索这些过程。
如您所读,请记住,这些只是 Google确定页面相关性的一些方式,它们不是绝对法律!自己尝试始终是最好的策略。
我们将从简单开始,然后移至更高级的。
1.关键字用法
最初有关键字。整个页面。
其概念是这样的:如果您的页面专注于某个主题,搜索引擎将在重要区域中发现关键字。这些位置包括标题标签,标题,图像的alt属性以及整个文本。SEO通过在这些区域放置关键字来帮助其页面排名。
即使在今天,我们还是从关键字开始,它仍然是页面优化的最基本形式。
大多数页面SEO工具仍然依靠关键字放置来为页面评分,尽管它仍然是一个不错的起点,但研究表明其影响力已经下降。
虽然确保您的页面至少包含要排名的关键字很重要,但是关键字的位置本身不太可能对页面的排名潜力产生很大影响。
2.TF-IDF
这不是关键字密度,而是术语频率-反向文档频率(TF-IDF)。
谷歌研究人员 最近将 TF-IDF 描述为“长期用于索引网页”,并且TF-IDF的变体似乎是Google多项著名专利的组成部分。
TF-IDF不会衡量关键字出现的频率,而是通过将关键字出现的频率与从较大的文档集中收集的期望进行比较来提供重要性的衡量 。
如果在Google的Ngram查看器中将短语“ basket”与“ basketball player”进行比较 ,我们会发现“ basketball player”更为罕见,而“ basket”则更为常见。基于此频率,我们可以得出结论:“篮球运动员” 在包含该词的页面上很重要,而“篮球”的阈值仍然高得多。
出于SEO的目的,当我们以较高的排名衡量TF-IDF的相关性时,其效果仅比个别关键字的使用情况要好。换句话说,仅靠本身产生较高的TF-IDF分数通常不足以期望SEO大大提高。相反,我们应该将TF-IDF视为其他更高级的页面概念的重要组成部分。
3.同义词和近义变体
每天有超过60亿次搜索,Google拥有大量信息来确定搜索者 在搜索框中键入查询时的实际含义。Google自己的研究表明,同义词实际上在多达70%的搜索中起作用。
为了解决这个问题,搜索引擎拥有数十亿个短语的同义词和近似变体的庞大语料库 ,这使它们即使在搜索者使用与您的文字不同的单词时也可以将内容与查询匹配。一个示例是查询dog pics ,其含义与以下内容相同:
• Dog Photos • Pictures of Dogs • Dog Pictures • Canine Photos • Dog Photographs
另一方面,查询 Dog Motion Picture完全意味着其他含义,对于搜索引擎来说,要知道两者之间的区别非常重要。
从SEO角度来看,这意味着使用自然语言和变体来创建内容 ,而不是一遍又一遍地使用相同的严格关键字。
当同一关键字词组可以涉及多个概念时, 使用主要主题的变体还可以添加更深层的语义,并帮助解决歧义消除问题 。植物和工厂一起可能指的是制造工厂,而植物和灌木则指植被。
如今,Google的 Hummingbird算法还使用共现来识别同义词以进行查询替换。
4.页面细分
在页面上放置单词的位置通常与单词本身一样重要。
每个网页由不同的部分组成-页眉,页脚,侧边栏等。搜索引擎一直致力于确定给定页面的最重要部分。微软和谷歌都拥有多项专利,这些建议表明HTML相关部分中的内容具有更大的重要性。
位于主体文本中的内容可能比放在侧边栏或其他位置的文本更重要。重复放置在样板位置中的文本可能会带来折扣甚至更多的风险。
随着我们转向通常会隐藏页面部分的移动设备,页面细分变得越来越重要 。搜索引擎希望为用户提供页面中可见且重要的部分,因此这些区域中的文本值得重点关注。
为了更进一步, HTML5提供了其他语义元素,例如<article>,<aside>和<nav>,它们可以清楚地定义网页的各个部分。
5.语义距离和术语关系
在谈论页面优化时, 语义距离是指文本中不同单词和短语之间的关系。这不同于词组之间的物理距离,而是着眼于术语在句子,段落和其他HTML元素内的连接方式。
当两个短语不在同一句子中时,搜索引擎如何知道“拉布拉多”与“犬种”相关?
搜索引擎通过测量不同HTML元素内不同单词和短语之间的距离来解决此问题 。这些概念在语义上越接近,这些概念可能越紧密相关。位于同一段落中的短语在语义上比由几个文本块分隔的短语更接近。
此外,HTML元素可以缩短概念之间的语义距离,将它们拉近。例如, 列表项可以被认为彼此等距,并且“ 文档的标题可以被认为与文档中的每隔一个术语接近 ”。
模式标记提供了一种以显式定义术语之间的关系的方式来语义化文本部分的方法。
模式提供的最大优势是它不会为搜索引擎带来任何猜测。关系是明确定义的。挑战在于,它要求网站管理员使用特殊的标记。到目前为止,研究表明采用率较低。此处列出的其余概念可以在包含文本的任何页面上使用。
6.共现和基于短语的索引
到目前为止,我们已经讨论了各个关键字及其之间的关系。搜索引擎还采用基于完整短语为页面编制索引的方法 ,并根据这些短语的相关性对页面进行排名。
我们将此过程称为基于短语的索引编制。
此过程最有趣的不是Google如何确定网页的重要短语,而是Google如何根据这些短语的相关性使用这些短语对网页进行 排名。
使用共现的概念 ,搜索引擎知道某些短语倾向于预测其他短语。如果您的主要主题是“约翰·奥利弗(John Oliver)”,则该短语通常与“晚间喜剧演员”,“每日表演”和“ HBO”等其他短语同时出现。与不包含相关术语的页面相比,包含这些相关术语的页面与“ John Oliver”有关的可能性更高。
将带有相关的共同出现短语的页面添加到此 传入链接中,即可为页面提供强大的上下文信号。
7.实体显着性
展望未来,搜索引擎正在探索使用实体之间的关系(而不仅仅是关键字)来确定主题相关性的方法。
一种作为发表在Google研究论文上的技术描述了通过实体显着性分配关联性。
实体显着性超越了传统的关键字技术(如TF-IDF),可以利用实体之间的已知关系在文档中查找相关术语 。实体是文档中唯一且定义明确的任何内容。
实体与页面上其他实体的关系越强,该实体变得越重要。
在上图中,一篇文章包含主题钢铁侠,托尼·史塔克,科幻小说。短语“ Marvel Comics”与所有这些术语都有很强的实体关系。即使它只出现一次,在文档中也可能很重要。
另一方面,即使短语“ Cinerama”多次出现(因为在那部电影中放映),该短语的实体关系也较弱,并且可能不那么重要。
更好的页面优化的实用技巧
当我们从关键字放置过渡到主题定位的更高级实践时,实际上很容易将这些概念整合到我们的内容中。尽管我们大多数人没有可用的方法来计算语义关系和实体出现,但是在设计优化内容时我们可以采取许多简单的步骤:
- 关键字研究是您的基础。即使单个关键字本身不再足以构成您内容的基础,但一切都始于良好的关键字研究。您想知道您定位的是什么术语,围绕这些关键字的相对竞争以及这些术语的受欢迎程度。最终,您的目标是将您的内容与人们在搜索框中输入并说出的关键词相联系。
- 研究关键词和主题。抵制研究单个关键字,而转向探索关键字主题。检查与每个关键字相关的次要关键字。人们谈论您的主题时,用什么词来形容它?您的学科有什么特性?使用这些辅助关键字短语,以围绕中心主题构建内容。
- 制作内容时,请回答尽可能多的问题。好的内容可以回答问题,而语义相关的内容可以反映这一点。任何搜索查询的最高排名意味着搜索引擎认为您的内容最能回答问题。在围绕主题和主题构建内容时,通过回答问题并提供比竞争对手更好的用户体验,确保您应获得最高排名。
- 使用自然语言和变体。在关键字研究过程中,找出搜索者引用您主题的其他常用方式,并在适当时将其包括在您的内容中将很有帮助。语义关键词研究通常在此过程中无价。
- 将您的重要内容放在最重要的部分。避免使用页脚和侧栏来获取重要内容。不要试图用精美的CSS或JavaScript技巧来欺骗搜索引擎。您最重要的内容应该放在读者最容易看到和访问的地方。
- 适当地组织您的内容。标头,段落,列表和表格均提供内容的结构,以便搜索引擎了解您的主题定位。清晰的网页包含类似于优质大学论文的结构。运用适当的介绍,结论,按段落组织的主题,拼写和语法,并正确引用您的资料来源。
- 归根结底,我们不需要超级计算机就能使我们的内容更好或更易于理解。如果我们像人类一样为人类写作,那么我们的内容将在为搜索引擎进行优化方面大有帮助。