你好!在新版本的SiteAnalyzer 2.2中,我们尝试添加一些逾期未交的功能,并优化并简化一些现有工具。下面我们将详细介绍所有内容。
主要的变化
1. 添加了一个自定义过滤器模块,用于在爬网期间搜索网站页面上的内容。
网站内容搜索功能使您可以搜索源代码,并显示包含所需内容的网页。
自定义过滤器模块使您可以检查网站上是否存在微标记,元标记,分析系统,自由文本或HTML代码的片段。
在过滤器配置窗口中,有几个参数用于搜索站点页面上的某些文本片段,或者相反,用于从搜索结果中排除包含某些文本或HTML代码片段的页面(此功能类似于使用Ctrl-F在页面的源代码中搜索内容) ...
注意。要熟悉自定义过滤器模块的工作方式,可以在过滤器下拉列表中选择“不包含”项,然后在文本输入字段中输入品牌名称。如此一来,在对网站进行爬网之后,您可以获得不包含品牌名称的页面列表,并分析这些页面包含与主站点不同的模板的原因。
有关自定义过滤器模块如何工作的更多详细信息,请参见“文档”部分。 阅读更多 >>
2. 添加了网站页面上内部链接的分布图。
此图显示了站点页面上内部链接质量的分布(我们可以说这是以可视形式显示的链接的可视化,而不是在可视化图上显示)。 阅读更多 >>
左边是页面数,右边是链接数。以下是按页面分位数的百分比。绘制图形时,重复的链接将被丢弃(如果从A页到B页有3个链接,则我们将它们视为一个)。
例如,根据上面的屏幕快照,对于约70页的网站:
- 1% 页面有 ~68 传入链接.
- 10% 页面有 ~66 传入链接.
- 20% 页面有 ~15 传入链接.
- 30% 页面有 ~8 传入链接.
- 40% 页面有 ~7 传入链接.
- 50% 页面有 ~6 传入链接.
- 60% 页面有 ~5 传入链接.
- 70% 页面有 ~5 传入链接.
- 80% 页面有 ~3 传入链接.
- 90% 页面有 ~2 传入链接.
也就是说,如果我们看到有少于10个入站链接指向的页面,则可以认为此类页面链接不牢固,并且通常有60%的页面链接。基于此,我们可以为这些链接薄弱的页面添加更多内部链接(如果这些页面对提升很重要),或者如果这些页面的重要性和优先级较低,则可以保持原样。
通常,内部链接少于10个的页面不太可能被搜索引擎机器人(尤其是Google机器人)抓取。
因此,如果您看到一个网站,通常只有该网站总数的20-30%的页面链接到该网站,则有必要深入研究链接设置或考虑如何处理80-70%的弱链接页面(删除,隐藏索引,放置重定向)。
弱链接站点的示例:
一个链接良好的网站的示例:
有关内部链接分发计划如何工作的更多详细信息,请参见“文档”部分。 阅读更多 >>
3. 优化了可视化图的工作。
- 拖动图节点时,添加了子级的比例转移。
- 当您在图形上选择一个节点时,入站和出站链接将以不同的颜色进行着色,以提高清晰度。
- 为可视化图的图例块增加了交互性:单击图例元素时,相应的节点在图上突出显示。
4. 搜寻网站时添加了对“ X-Robots标记”标头的考虑。
现在,可以在爬网站点时在程序设置中禁用或启用“ X-Robots Tag”参数的记帐,因为以前它仅在统计信息中显示。
注意:X-Robots-Tag标头包含在特定URL的HTTP响应中。 X-Robots-Tag标头支持与元机器人标签相同的指令。可以在X-Robots-Tag中指定可在meta robots标签中使用的任何指令。
注:
- 使用类优化了H1-H6标头的解析。
- 修复了大型项目扫描结束时的冻结问题。
- 在重复的“描述”部分中,修复了统计信息的错误显示。
- 修复了带有404响应码的页面统计信息的错误显示。
- 对于锁定在Robots.txt中的页面,现在返回600响应代码。
- 现在可以更正确地计算“响应时间”参数。
- 修复了并非始终正确的Sitemap.xml站点地图布局。
- 重定向现在可以更正确地显示。
- 按URL排序已变得更加合乎逻辑。
先前版本概述: