使用此Python脚本分析内容发布速度
发布:泰安网站建设 更新时间:2024-01-10 01:23
无论您正在运行全面的seo活动还是专注于语义SEO,了解竞争对手的内容战略都至关重要。
我开发了一个免费的Python脚本,用于分析竞争对手的发布频率。它利用站点地图数据揭示竞争对手多久发布新内容或更新现有内容。
这个洞察对Google在评估您的专题权威性时非常重要。这个用户友好的工具通过提供基于数据的方法,消除了在内容规划中的猜测。
确定适量的内容对于SEO的成功至关重要,而这个脚本则帮助您根据数据完善您的策略。下面是操作方法。
为什么了解竞争对手的内容发布速度在语义SEO中很重要
让我们从一个快速的回顾开始,解释为什么发布速度很重要。然后,我将指导您如何实际使用这个脚本。
内容速度
这个概念很简单:在一个主题上定期发布相关的高质量内容表明对Google而言,该站点是该领域的一个当前且权威的来源。
了解内容速度对于任何想要在其领域建立权威的网站都是至关重要的。
寻找微小内容领域以建立专题权威
专题权威是一个相对的概念,正如我们之前讨论过的那样。
Google采用先进的机器学习技术来:
- 准确区分一个主题的结束和另一个的开始。
- 识别相关子主题的边界。
然后,他们可以利用这些边界来了解哪些站点在特定主题上有权威。
这个复杂的过程意味着,通过使用图形语言通过向量的技术,Google可以将专题权威分配给在主题的子领域中的站点,而不仅仅是在广泛的主题中。作为内容创作者,这意味着在微小领域(例如“篮球罚球”)建立权威比在与已建立的巨头竞争的广泛领域(例如“篮球”)更可行。分析竞争对手的站点地图可以揭示这些微小领域中的内容差距和机会。 稍后,我将演示如何使用脚本来筛选特定关键词的站点地图,以识别在目标区域内的内容流速。
了解你与竞争对手之间的差距
在语义SEO的范围之外,了解竞争对手的内容投资至关重要。
如果竞争对手在SEO上投入大量资源并且超过了您的网站,这可以作为您需要保持竞争力所需努力和资源的基准。
自我分析
使用相同的工具分析您自己网站的站点地图可能会有所启示。通过将发布时间与流量数据相关联,您可以揭示Google认为您的站点在哪些主题上具有权威性。
在历史上,追踪新发布内容在Google中开始排名所需的时间是通过Google Search Console或像Ahrefs这样的工具。
使用Python脚本还可以完成的另外两件事包括:
使用下面的Python脚本进行快速流量分析
- 利用Google Colab或在本地运行Python脚本,可以将您的站点地图和发布日期与Ahrefs等工具的流量数据相结合。
- 这可以揭示最近更新的帖子中哪些正在吸引关注,引导您关注与您的受众和搜索引擎产生共鸣的主题。
- 这种有针对性的内容开发方法可以显著增强您的SEO努力。
识别长时间未更新的页面
- 每个强大的站点都会更新其表现出色的页面,使它们对用户更有利。
- 分析您的站点地图的一个好处是迅速查看哪些帖子具有流量但长时间未更新。
虽然这个列表远非详尽无遗,但既然我们已经总结了为什么理解发布频率很重要,让我们开始使用这个Python脚本。
运行Python脚本
通过点击此链接访问脚本:Posting_Analysis.ipynb
注意:在Google Colab上运行脚本无需先前了解Python或其包,因为它提供了用于代码共享和执行的虚拟机环境。
步骤 1:查找并上传站点地图
在此演示中,我将使用我们公司的网址。
此脚本与任何 XML 站点地图兼容,但对于大多数 WordPress 网站,您可以通过在网址末尾添加 "sitemap.xml" 来定位站点地图。
如果这不起作用,我建议使用 Google 的站点运算符搜索:
- site:example.com sitemap
这可能会显示 XML 站点地图。
WordPress
WordPress 默认按页面和帖子组织站点地图。如果您的站点已使用额外的类别进行定制,则这些类别也将显示在此主视图中。
将每个站点地图复制并粘贴到 Python 列表中,用引号括起每个条目,并用逗号分隔。您可以根据需要添加多个站点地图进行分析。
注意:大型网站可能将其站点地图压缩为 .tgz ZIP 文件。站点地图的 URL 限制为 50,000 条。分析大型网站将更耗时,因为您必须手动提取每个站点地图。此脚本未设计用于处理此类网站。
单击播放图标以执行代码并将站点地图存储在内存中以供进一步处理。稍后我们将回顾 filter_term 字段,因为它是用于选择性分析的可选参数。
步骤 2:上传 Ahrefs 流量数据(可选)
这个可选步骤需要一个活跃的 Ahrefs 账户。它允许我们使用流量和排名关键字信息丰富我们的站点地图数据。
为此,请转到 Ahrefs Site Explorer 中的您的域,然后访问“Top Pages”部分。
接下来,点击“导出”。
我已经定制了脚本以适应不同的编码选项。但是,首选是选择 UTF-8。
通过单击运行图标并上传最近下载的文件来继续。如果您有该文件,请在页面底部找到上传文件框并上传。或者,您可以跳过此步骤。
一旦文件上传完成,脚本将处理数据。
请注意,如果您正在分析多个竞争对手的站点地图,您可以将每个竞争对手的“Top Pages”报告附加到要上传的 CSV 文件的底部。 这将使脚本能够将每个站点地图与相应的流量数据进行匹配。
步骤 3:运行脚本
如果您整合了 Ahrefs 数据,您的分析应该已经完成。
但是,如果您跳过了数据上传步骤,请在单击播放图标时点击“取消上传”而不是上传文件。然后脚本将执行并呈现您的分析结果。
步骤 4:分析结果
该分析为竞争对手策略提供了有价值的见解。
多年的SEO经验表明,关键词策略、发布频率和获取链接是成功SEO的影响参数。
虽然像 Ahrefs 这样的工具有助于识别关键词和反向链接,但它们可能无法全面洞察竞争对手发布频率或指导内容发布决策。
首先,查看竞争对手的内容类型和发布频率。初始图表很好地显示了竞争对手发布新内容的频率。
对于考虑帖子和页面的 WordPress 站点,建议区分货币页面和信息页面。(然而,站点结构各异;查看站点地图可以帮助识别特定页面类型。)
注意:您将在每个图表底部看到一个平均计算。
我添加了一个额外的视图,让您可以比较您的站点与竞争对手或同时查看一组竞争对手的站点地图。这简化了站点比较和竞争对手分析。
分析最近更新的页面和流量的有效性
利用搜索控制台查询来识别 Google 认为相关的主题一直是会员和SEO从业者的常见做法。
随着在广泛或利基类别中建立主题权威性,新发布的内容往往会迅速引起关注。
此报告提供了从 Google 视角了解竞争对手内容表现的见解。如果您观察到最近编辑的内容(通常是新发布的内容)具有显着的流量,那么您的竞争对手正处于 Google 认识其在已发布内容上的权威地位的阶段。 通过将交通数据叠加在发布频率上,您可以迅速评估新发布的内容与旧内容相比的有效性。
深入细节
这个高层次的概述可以引导您关注可能对竞争对手或您的网站有效的策略。
然而,这种高层次的视角有时可能会被离群值或异常值所偏离,这些只有在深入数据分析时才会显现出来。
最终的图表可以导出为CSV文件,使您能够深入研究报告的细微差别。
要查看所有数据,请点击以下链接:
通过点击导出数据:
附加用途
网站实用性
- 这些数据是监测您的SEO努力的有价值工具。您可以验证您的SEO提供商或写作团队是否持续更新关键页面并发布新内容。
竞争对手洞察
- 了解竞争对手更新关键内容的频率。例如,如果竞争对手在关键关键字上超过您,监控他们的内容更新频率可以揭示他们在多大程度上积极改进它。
- 这些信息可以指导您在维护和改进现有内容与创建新内容之间取得平衡时做出决策。
步骤5:使用“包含关键字”来了解网站上特定主题的内容速度
这最后的方面与先前文章中讨论的语义SEO概念一致。
识别竞争对手覆盖不足的领域在制定内容战略时可能是有利的。
瞄准这些未被充分关注的子主题,增加您被认为是主题权威的机会。
回到篮球的比喻,这种方法涉及识别和解决竞争对手忽视比赛特定方面的领域。
脚本的最终可定制功能允许您按类别隔离站点地图。虽然这种方法并不完美,因为它不涉及对实际页面的爬取,但它是一个有价值的起点。
通过在filter_term
变量中引入关键词,您可以将输出限制为包含该关键词的页面,无论是在其URL路径还是其顶部关键词中。这使您能够分析不同主题的发布频率。
例如,如果您想检查竞争对手在仅与转化率优化(CRO)相关的页面上的发布频率,您可以将filter_term
设置为“CRO”。
这将提供有关他们在这个特定主题上发布内容的频率的见解。
让我们重新运行脚本:
正如您所看到的,只有一篇文章在其URL路径或“顶部关键词”中包含了“CRO”。
这个过滤器通常对较大的网站更有效,它可以准确地衡量特定关键词的发布速度。
主要收获
本文探讨了在语义SEO中分析竞争对手的内容发布模式的关键作用。使用我们演示的Python脚本,您可以深入了解竞争对手的策略。
理解内容速度
- 该脚本使用户能够测量竞争对手的内容发布频率和重点,提供有关其专题权威和重点领域的见解。
- 这一知识对于调整自己的内容策略以与成功做法保持一致或找到独特的利基非常宝贵。
识别微观内容领域
- 通过检查竞争对手内容中的特定区域,该脚本有助于发现未开发的利基,提供在竞争较小的领域建立专题权威的机会。
基准和自我分析
- 将自己的内容战略与竞争对手进行比较,并通过相同的视角分析自己的站点,对于保持竞争力并了解自己在行业中的地位至关重要。
与流量分析工具集成
- 该脚本结合来自诸如Ahrefs等工具的流量分析的站点地图数据的能力,提供了对内容战略对网站流量和SEO性能影响的更深入了解。
长期内容管理
- 该脚本有助于识别需要更新的内容,确保高效的页面保持相关和有效。
然而,认识到该脚本的一些限制是至关重要的。
- 它可能在庞大网站的复杂站点地图上遇到困难,并且无法完全捕捉每个页面上内容的性质。
- 它依赖于外部流量数据,这可能不够全面。
- “最后修改”无法区分已更新和新创建的内容。
尽管存在这些限制,该脚本为在充满活力的数字环境中优化您的SEO战略提供了一个强大的起点。
本文中表达的观点属于客座作者,不一定代表Search Engine Land的观点。工作人员作者名单请参见此处。