SEO中的实体：它们是什么以及它们为何重要？

日期：2024-12-07 作者：20hay 移动：http://3jjewl.riyuangf.com/mobile/quote/6698.html

SEO中的实体：它们是什么以及它们为何重要？是什么 SEO中的实体：它们是什么以及它们为何重要？

对于 SEO 专业人员应该如何理解，更重要的是如何利用 SEO 中的“实体”，存在很多困惑。

我明白这是从哪里来的，尤其是传统的SEO方法是围绕单词和短语进行的。

事实上，第一波 SEO 专业人士（比如我）成长过程中使用的大多数算法都没有搜索中的“实体”概念。SEO 原理——从内容编写到链接中的锚文本到 SERP 跟踪——过去（并且很大程度上仍然是）关键字驱动，许多人仍然发现很难理解发生了什么变化。

但在过去的十年中，所有搜索都在朝着将世界理解为一串单词和一系列相互关联的实体的方向发展。

与 SEO 中的实体合作是面向未来的搜索策略的基础。

它们对于生成式 AI和 ChatGPT 的未来也很重要。

这篇文章讲的是为什么。它涵盖：

什么是实体？
什么是知识图谱？
搜索中实体的简史：Freebase、Wikidata 和实体。
实体如何工作以及如何使用它们进行排名。
Google 中的实体示例。
如何针对实体进行优化。
使用架构来帮助定义实体。

SEO 经常将实体与关键字混淆。

实体（在搜索术语中）是数据库中的一条记录。实体通常具有特定的记录标识。

在 Google 中，这可能是：

“MREID=/m/23456”或“KGMID=/g/121y50m4”。

它当然不是一个“单词”或“短语”。我认为关键词的混淆源于两个根本原因：

首先，SEO 专业人员在 2010 年之前就学习了关键字和短语方面的技巧。许多人仍然这样做。
第二个是每个实体都带有一个标签——通常是关键字或描述符。

因此，虽然“埃菲尔铁塔”对于我们人类来说似乎是一个完全可识别的“实体”，但谷歌将其视为“KGMID=/m/02j81”，并且并不关心你是否称其为“埃菲尔铁塔”或“托雷”埃菲尔铁塔”或“????????”（阿塞拜疆语“埃菲尔铁塔”的意思）。它知道您可能指的是其知识图中的底层实体。

这涉及到下一点：

“知识图”、“知识图”和“知识面板”之间存在微妙但重要的区别。

知识图是包含实体的半结构化数据库。
知识图谱通常是谷歌知识图谱的名称，尽管还存在数千个其他知识图谱。维基数据（本身就是一个知识图谱）尝试交叉引用来自不同信誉良好的数据源的标识符。
知识面板是 Google 知识图谱结果的具体表示。它是桌面搜索中通常显示在结果 (SERP) 右侧的窗格，提供有关人物、地点、事件或其他实体的更多详细信息。

元网络

2005 年，Metaweb开始构建一个数据库，当时称为Freebase，它将其描述为“开放、共享的世界知识数据库”。

我将其描述为半结构化百科全书。

它为每个“实体”（或文章，扩展隐喻）提供了自己唯一的 ID 号 - 从那里开始，系统尝试通过文章与系统中其他 ID 号的关系来连接文章，而不是传统的文字文章。

大约获得了 5000 万美元的资本资助，5 年后，该项目被出售给了谷歌。

虽然没有构建任何商业产品，但为 Google 的 10 年转型奠定了基础，从基于关键字的搜索引擎到基于实体的搜索引擎。

2016 年，即收购后大约六年后，谷歌正式关闭了 Freebase，因为它将这些想法迁移并开发成了自己的“知识图谱”（这些数据库的现代术语）。

当时，值得注意的是，谷歌公开表示它已将其大部分实体数据与维基数据同步，并且展望未来，维基数据（支撑维基百科中使用的数据）是谷歌知识图谱交互的一种方式与外界。

核心算法中的实体

实体主要用于消除想法的歧义，而不是对具有相同想法的页面进行排名。

这并不是说巧妙地使用实体不能帮助您的网站内容更有效地排名。它可以。但当谷歌试图为用户搜索提供结果时，它首先的目标是获得准确的答案。

不一定是最值得的。

因此，Google 花费了大量时间将文本段落转换为底层实体。在为站点建立索引和分析用户查询时都会发生这种情况。

例如，如果我输入“埃菲尔铁塔下面的餐厅名称”，谷歌就知道搜索者不是在寻找“名称”或“埃菲尔铁塔”。

他们正在寻找餐馆。不是任何餐厅，而是位于特定位置的餐厅。此搜索中的两个相关实体是“Champ de Mars, 5 Av.”上下文中的“餐厅”。阿纳托尔·弗朗斯，巴黎”（埃菲尔铁塔的地址）。

这有助于谷歌决定如何混合其各种搜索结果——图像、地图、谷歌业务、广告和有机网页等等。

最重要的是，对于 SEO 专业人士来说，如果希望 Google 认识到该页面与此搜索查询相关，（例如）儒勒·凡尔纳餐厅的网站谈论其埃菲尔铁塔的壮丽景色非常重要。

这可能很棘手，因为儒勒·凡尔纳餐厅位于埃菲尔铁塔内。

语言不可知论

实体非常适合搜索引擎，因为它们与语言无关。此外，这个想法意味着一个实体可以通过多种媒体来描述。

图像是描述埃菲尔铁塔的明显方式，因为它是如此具有标志性。它也可能是演讲文件或塔的官方页面。

这些都代表实体的有效标签，在某些情况下，代表其他知识图中的有效标识符。

实体之间的连接

实体之间的相互作用使 SEO 专业人士能够制定连贯的策略来开发相关的有机流量。

当然，埃菲尔铁塔最“权威”的页面很可能是官方页面或维基百科。除非您确实是埃菲尔铁塔的 SEO 专家，否则您几乎无法挑战这一事实。

然而，实体之间的相互作用允许您编写能够排名的内容。我们已经提到了“餐厅”和“埃菲尔铁塔”——但是“地铁”和“埃菲尔铁塔”，或者“折扣”和“埃菲尔铁塔”呢？

一旦两个实体开始发挥作用，相关搜索结果的数量就会急剧下降。当您进入“乘坐地铁旅行时埃菲尔铁塔门票打折”时，您将成为专注于地铁门票、埃菲尔铁塔门票和折扣之间并置的一小部分页面之一。

输入这句话的人少了很多，但转化率会高得多。

它也可能对您来说是一个更有利可图的概念！（这个例子是为了说明原理。我不知道这样的折扣是否存在。但应该有。）

通过首先将搜索短语的所有竞争页面分解为显示底层实体及其对主查询的相对重要性的表，可以扩展此概念以创建异常强大的页面。

然后，这可以作为作者的内容计划来构建比任何其他竞争作品更权威的新内容。

因此，尽管搜索引擎可能声称实体不是排名因素，但该策略触及了“如果你写出好的内容，它们就会来”这一理念的核心。

图像搜索中的实体

搜索 [滑板上的狗] 的屏幕截图，Google，2023 年 8 月

实体对于优化图像也非常有帮助。

谷歌非常努力地利用机器学习来分析图像。通常情况下，谷歌知道大多数照片中的主要图像。

因此，以[滑板上的狗]作为搜索词……确保您的内容完全支持图像可以帮助您的内容在用户搜索时更加可见。

Google Discover 中的实体

对于 SEO 专业人士来说，最被低估的流量来源之一是Google Discover。

即使用户没有主动寻找某些内容，Google 也会为用户提供有趣的页面供稿。

这种情况会发生在 Android 手机上，也会发生在 iPhone 上的 Google 应用程序中。虽然新闻严重影响此提要，但非新闻网站可以从“发现”获得流量。

如何？嗯——我相信实体发挥着重要作用！

Google Search Console 的屏幕截图，2023 年 8 月

如果您在 Google Search Console 中没有看到“发现”选项卡，请不要灰心。但当您这样做时，这可能是一个值得欢迎的迹象，表明您的至少一个网页与实体足够一致，以至于至少一个人的兴趣与您的内容足够重叠，足以将该页面放在专门针对该用户的提要中。

在上面的示例中，即使“发现”结果并未在用户搜索的确切时间显示，但仍有4.2% 的点击率。

这是因为谷歌可以通过映射实体将许多用户的兴趣和习惯与互联网上的内容结合起来。

当发生强相关性时，谷歌可以为用户提供一个页面。

来自 Google 员工的一些研究

2014 年，发表了一篇论文，我发现该论文非常有助于证明 Google（或者至少是其研究人员）热衷于区分使用关键字来理解主题与使用实体的想法。

在本文中，Dunietz 和 Gillick 指出了 NLP 系统如何转向基于实体的处理。他们强调了如何在大型数据集上使用二进制“显着性”系统来定义文档（网页）中的实体。

“二元评分系统”表明，谷歌可能会决定某个文档是或不是关于任何给定实体的。

后来的线索表明，谷歌现在用从 0 到 1 的滑动尺度来衡量“显着性”（例如，其 NLP API 中给出的评分）。

即便如此，我发现这篇论文确实有助于了解谷歌的研究认为“实体”应该出现在页面上的哪些位置以“算”为显着。

我建议阅读这篇论文进行认真的研究，但他们列出了如何将“显着性分类为对《纽约时报》文章的研究”。

具体来说，他们引用了：

第一地点

这是第一次出现提及实体的第一句话。

建议在网页的早期提及该实体可能会增加该实体在文章中被视为“突出”的机会。

人数

这基本上是实体第一次提及的“头”词出现的次数。

文章中没有具体定义“中心词”，但我认为它是指连接到最简单形式的单词。

提及

这不仅指实体的文字/标签，还指其他因素，例如实体（他/她/它）的推荐

标题

实体出现在标题中的位置。

头莱克斯

被描述为“第一次提到的小写头词”。

实体中心性

该论文还讨论了使用PageRank的变体- 他们将网页切换为 Freebase 文章！

他们分享的例子是一场参议院辩论，涉及联邦应急管理局、共和党、奥巴马（总统）和一名共和党参议员。

在对这些实体及其在知识图中彼此的接近度应用类似 PageRank 的迭代算法之后，他们能够更改文档中这些实体的重要性的权重。

不特定于 Google，在这里，算法将为NLP 或命名实体提取程序 (NEEP) 在文本页面上找到的每个实体（或者就此而言，在文本页面中识别的所有实体）创建所有上述变量的值。一个图像）。

然后对每个变量应用权重来给出分数。在讨论的论文中，该分数变为 1 或 0（显着或不显着），但 0-1 的值更有可能。

谷歌永远不会分享这些权重的细节，但该论文还表明，权重只有在“阅读”数亿个页面后才能确定。

这是大型语言学习模型的本质。

但对于想要围绕两个或多个实体对内容进行排名的 SEO 专业人员来说，这里有一些重要提示。回到“埃菲尔铁塔附近的餐厅”这个例子：

为每个实体确定一个“死”术语。我可能会选择“餐厅”、“埃菲尔铁塔”和“距离”，因为距离在维基百科中具有有效的含义和文章。咖啡馆可能是餐厅的合适同义词，复数形式的“餐厅”也可能是这样。
目标是在标题和第一句中包含所有三个实体。例如：“距离埃菲尔铁塔不远的餐厅。”
文中旨在讨论这些实体之间的相互关系。例如：“儒勒·凡尔纳餐厅实际上就在里面。” 假设“it”在写作的上下文中明确指的是埃菲尔铁塔，则不需要每次都写出来。保持语言自然。

这对于实体 SEO 来说足够了吗？

不，可能不是。（欢迎您阅读我的书！）但是，作为作家或网站所有者，并非所有因素都在您的控制之下。

不过，有两个想法似乎确实产生了影响，一是链接上下文中其他页面的内容，二是添加架构以帮助定义。

通过使用“关于”和“提及”模式可以为搜索引擎提供进一步的清晰度，以帮助搜索引擎消除内容的歧义。

这两种模式类型有助于描述页面正在讨论的内容。

通过制作一个页面“关于”一两个实体并“提及”可能更多的实体，SEO 专业人员可以以一种现成的方式将长篇内容快速总结到其关键领域，以供知识图使用。

但值得注意的是，谷歌并未明确说明是否在其核心算法中使用这一模式。

我可能会将此架构添加到我的文章中：

{
“@context”：“https://schema.org”，
“@type”: “网页”,
“@id”：“https://www.yoursite.com/yourURL#ContentSchema”，
“headline”：“距离埃菲尔铁塔不远的餐厅”，
“url”：“https://www.yoursite.com/yourURL”，
“关于”： [
{“@type”：“东西”，“名称”：“餐厅”，“sameAs”：“https://en.wikipedia.org/wiki/Restaurant”}，
{“@type”：“地点”，“名称”：“艾菲尔铁塔”，“sameAs”：“https://en.wikipedia.org/wiki/Eiffel_Tower”}
],
“提及”：[
{“@type”：“事物”，“名称”：“距离”，“sameAs”：“https://en.wikipedia.org/wiki/Distance”}，
{“@type”：“地点”，“名称”：“巴黎”，“sameAs”：“https://en.wikipedia.org/wiki/Paris”}
]
} 脚本>

模式的确切选择既是一个 SEO 问题，也是一个哲学问题。

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0评论 0

0 条相关评论

相关最新动态

推荐最新动态

点击排行