Facebook Twitter

SiteAnalyzer 文档

详细说明的程序SiteAnalyzer

计划的目的

该程序SiteAnalyzer的目的是为了分析的网站并鉴别技术上的错误(搜索损坏的链接,重复网页,以不正确的服务器应对)的错误和遗漏SEO(空白元的标签,多余的或完全没有网页的标题h1,分析的页面内容、质量链接,以及许多其他搜索引擎优化参数)。

SiteAnalyzer, 计划的目的

主要特点

  • 扫描所有网页以及图像、脚本和文件
  • 获得服务器回应代码,用于在网站的每个页面(200, 301, 302, 404, 500, 503 等等)。
  • 确定存在和内容标题、关键词、描述、H1-H6
  • 搜索和显示的"重复"的网页,元的标签和标题
  • 确定存在的rel="典型"的每一页的网站
  • 遵循文件“robots.txt”的指令,元標記“robots”或X-Robots-Tag
  • 在抓取網站頁面時記帳“noindex”和“nofollow”
  • 參考分析:網站任何頁面的內部和外部鏈接的定義
  • 計算站點每個頁面的內部PageRank
  • 確定頁面重定向的數量(重定向)
  • 掃描任意URL和外部Sitemap.xml
  • Sitemap“sitemap.xml”生成(可能分成幾個文件)
  • 通過任何參數過濾數據(任何復雜度的過濾器的靈活配置)
  • 出口报告中CSV和Excel(完整的报告以Excel格式)

不同于类似

  • 低要求的计算机资源、低消耗的RAM
  • 扫描站在几乎任何大小由于低要求的计算机资源
  • 便携式格式(工作没有安装在电脑或直接从移动媒体)

部分的文件

工作的开始

当你开始的程序提供给用户的地址栏进入网址的分析网站(可以进入的网站的页面作为一个搜索机器人,链接的初始转的网站,包括主页,提供,所有链接都在HTML和不使用Javascript)。

之后按"开始"按钮,搜索引擎开始爬的所有网页或内部链接(外部资源,他不走,也不要求使用Javascript)。

一旦机器人将绕过所有网页变为可用的报告的形式提出一个表,显示收到的数据分组成的专题的标签。

所有分析的项目都显示在左侧的一部分的程序,并自动保存在数据库一起收到的数据。 删除网站,使用的上下文的菜单中的项目清单。

注意到:

  • 当你点击按钮"暂停"扫描项目被暂停,并对目前的进展的扫描储存在一个数据库,从而允许例如关闭程序和继续扫描项目之后重新启动该程序。
  • "停止"按钮中断扫描述当前项目不可能继续扫描

该计划设置

主菜单部分"设置"是用于精细的调整程序的工作与外部网站,包含7个标签:

SiteAnalyzer, 该计划设置

基本的设置

节的主要设置是用于指定用户的指令时要使用扫描一个网站。

说明的参数:

  • 数线
    • 更多线程的数量,更多的网址将能够处理每单位时间。 应当指出的是,数量较多的线导致的更大数量的资源使用的电脑。 它建议设置的数量线范围为5-10。
  • 扫描的时间
    • 用于设置的限制扫描站的时间。 是衡量小时。
  • 最大深度
    • 此参数用于指定的深度扫描的网站。 该主页的网站具有一个嵌套的水平=0. 例如,如果您需要扫描页类型"somedomain.ru/catalog.html"和"somedomain.ru/catalog/tovar.html"在这种情况下,必须设置的最大深度=2.
  • 之间的延迟请求
    • 设置暂停,当呼吁的扫描仪的网页。 这是非常有用的网站与"弱"的主人,不承受沉重的负荷和频繁的呼吁。
  • 超时的请求
    • 设置时间超时的响应从该网站要求的程序。 如果任何这些网页的响应缓慢(漫长的货物),扫描站可能需要相当长的时间。 这些页面可以切断通过指定一个价值,其后该扫描仪进行扫描的其他网页的网站,因而不会拖延总体进展情况。
  • 这些页的扫描
    • 一个限制数量最大的网页的扫描。 是有用的,例如,如果您需要扫描的第N网页的网站(不包括图像、样式表脚本和其他类型的文件)。

扫描

SiteAnalyzer, 扫描

考虑的内容

  • 在本节你选择的数据类型将考虑通过分析程序,同时穿越页(图像、视频、样式脚本),或消除不必要信息的当分析。

扫描规则

  • 这些设置相关的设置例外时爬这网站使用的文件扫描仪"robots.txt"链接类型的"希望",并且使用的指令"meta-name=的机器人"直接在你的代码页。

SEO

SiteAnalyzer, SEO

这一节指定的基本分析搜索引擎优化的因素,这在未来将被检验用于正在分析网页,其后得到的统计数据将显示在卡"搜索引擎优化统计数据"右侧的主要窗口。

Yandex XML

借助這些設置,您可以選擇一項服務,通過該服務檢查搜索引擎Yandex中的頁面索引。檢查索引有兩種選擇:使用Yandex XML服務或Majento.ru服務。

SiteAnalyzer, Yandex XML

選擇Yandex XML服務時,您需要考慮可能的限制(每小時或每天),這可以在檢查頁面索引時應用,關於您的Yandex帳戶的現有限制,因此通常會出現您的帳戶限制不足以檢查的情況一次一頁,你必須等待下一個小時。

使用Majento.ru服務時,實際上不存在每小時或每日限制,因為您的限製字面上合併到一般限制池中,這個限製本身並不小,但是與Yandex XML上的任何單個用戶帳戶相比,每小時限制具有更大的限制。 。

SiteAnalyzer, 檢查Yandex中的索引頁面

User-Agent

在部分用户的代理,你可以指定哪些用户代理将提交计划时访问外部网站在他们的扫描。 通过默认设置一个自定义用户的代理,但如果必要的话,你可以选择一个标准剂最经常遇到的互联网。 其中包括例如:机器人的搜索引擎YandexBot的,蜘蛛,MicrosoftEdge,机器人浏览器铬、火狐,IE8和移动设备的iPhone,安卓,和其他许多人。

代理服务器

如果有必要的工作,通过代理,在这一页你可以添加一个清单服务器代理通过该程序将访问外部资源。 此外,还有一种可能性,检查代理绩效,并且删除不活动的代理服务器。

SiteAnalyzer, 代理服务器

排除網址

这部分是旨在排除绕过某些网页和网站,当分析。

使用搜索模式*和? 您可以指定爬網程序不應爬網站點的哪些部分,因此不應包含在程序數據庫中。 这个名单是一个地方列出的例外扫描期间的网站(相对于他的"全球"列表是一个文件"robots.txt"在根本的网站)。

SiteAnalyzer, 排除網址

關注網址

同樣,您可以添加必須抓取的網址。 在這種情況下,掃描期間將忽略這些文件夾之外的所有其他URL。 此選項也適用於搜索模式*和?

SiteAnalyzer, 關注網址

PageRank

使用PageRank參數,您可以分析站點的導航結構,以及優化Web資源的內部鏈接系統,以便將參考權重傳輸到最重要的頁面。

SiteAnalyzer, PageRank settings

該程序有兩個計算PageRank的選項:經典算法及其更現代的算法。通常,對於站點內部鏈接的分析,使用第一種或第二種算法時沒有太大區別,因此您可以使用這兩種算法中的任何一種。

有關算法的詳細說明和計算PageRank的原則,請參閱“內部PageRank的計算”一文: >>

工作与程序

扫描完成后,你会看到的信息包含在方框"掌握的数据"。 每个选项包含的数据进行分组方面,以他们的名字(例如,标签的标题中将包含的内容的页的标题,标题>和lt;/title>在标签上的"图像"列表显示的所有图像从网站等等)。 与这些数据,可以分析内容的网站,查找"破"链接的或不完整的元的标签。

SiteAnalyzer, 计划的目的

SiteAnalyzer, 工作与程序

如果有必要(例如,进行更改后的网站上)通过使用上下文的菜单有可能的新的扫描的个人网址,以反映变化中的程序。

使用这个菜单,你可以显示重复的页面的相关参数(双倍的标题,说明、关键词、h1,h2,内容页)。

SiteAnalyzer, 工作与程序

过滤数据

为便于分析网站的统计数据,应用程序可以筛选数据。 过滤可能在两种变体:

  • 对于任何字段,使用"快速"过滤器
  • 使用一个定义过滤器(用的先进设置的样品数据)

快速的过滤器

用于快速筛选数据和同时施加的所有领域的当前的标签。

SiteAnalyzer, 快速的过滤器

定义过滤器

设计用于广泛的筛选并且可以包含多个条件。 例如,对于元"标题"的标签要过滤网页,通过他们的长度,它不超过70个字符,并且也会包含的案文"新闻"。 然后这个过滤器,将是这样的:

SiteAnalyzer, 定义过滤器

例的样本过滤器上:

SiteAnalyzer, 定义过滤器

因此,施加一个自定义过滤器的任何标签,你可以得到采样数据的任何复杂性。

技術站點統計

該站點的技術統計選項卡位於“附加數據”面板上,包含一組基本站點技術參數:鏈接統計信息,元標記,頁面響應代碼,頁面索引參數,內容類型等。參數。

單擊其中一個參數,它們將在站點主數據的相應選項卡中自動過濾,同時統計信息顯示在頁面底部的圖表上。

SiteAnalyzer, 技術站點統計

SEO統計

SEO-statistics選項卡用於進行全面的站點審核,包含50多個主要的SEO參數,並識別超過60個關鍵的內部優化錯誤!錯誤映射分為多個組,而這些組又包含一組分析的參數和過濾器,用於檢測站點上的錯誤。

本文將詳細介紹所有已檢查的參數。 >>

SiteAnalyzer, SEO統計

對於所有過濾結果,可以快速將它們導出到Excel而無需其他對話(報告保存在程序文件夾中)。

网站的结构

这一功能目的是创造一个网站结构的基础上获得的数据。 该网站的结构产生的嵌套的网址。 后产生的结构,其出口CSV格式(Excel)。

SiteAnalyzer, 网站的结构

菜单的项目清单

  • 在该列表中的项目提供大规模的扫描通过选择所需的网站并点击"重新扫描"的。 在这之后,所有网站都在地方和被扫描交替在标准模式。
  • 此外,为方便使用的程序、大量删除选择的地点也可用于"清除"按钮。
  • 除了一个扫描站,有一个方法可以批量增加网站的项目列表中使用的一种特殊形式,然后,用户可以扫描有趣的项目作为一个整体。

SiteAnalyzer

代Sitemap.xml

该网站地图是产生基于扫描页。 她加入网页的格式"text/html"。

生成地图的网站后,立即扫描网站使用的主菜单项"的项目>网站地图产生的"。

SiteAnalyzer, 代Sitemap.xml

网站有大量的50 000页自动划分的"sitemap.xml"在多个文件(在这种情况下,该文件包含链接到其他含有直接链接页面的网站)。 这是由于要求的搜索引擎对于处理网站地图的大尺寸。

SiteAnalyzer, 代Sitemap.xml

如果有必要,数量页的文件"sitemap.xml"可以通过改变价值的50 000(默认)的期望值在主要程序的设置。

扫描一个任意的URL

菜单项目"进口URL"被设计用扫描任意列出的网址和XML网站地图Sitemap.xml (包括索引),用于以后分析。

SiteAnalyzer, Import URL

扫描定义URL可能在三个方面:

  • 通过插入清单的网址从剪贴板
  • 启动时从硬盘格式的文件*.txt,并且*.xml的URL清单
  • 通过下载的文件Sitemap.xml 直接从网站
SiteAnalyzer, Scanning a list of arbitrary URLs

SiteAnalyzer, Scanning Sitemap.xml by URL

这个模式是,当你扫描一个任意的URL"项目"是不存在的程序及其数据不是添加到数据库。 还不可用部分的"结构"和"仪表板".

了解更多有关该工作的选择"进网址的",在这篇文章: 概述的新版本 SiteAnalyzer 1.9.

Dashboard

仪表板签显示的详细报告关于目前的质量网站的优化。 该报告是基于产生数据的标签"搜索引擎优化统计数据的"。 除了这些数据报告中包含的指示总体质量指数化,计算出在100点的规模相对于目前程度的优化。 它可以导出的数据的标签"仪表板"在一个方便的PDF格式的报告。

SiteAnalyzer, Dashboard

出口数据

为更加灵活的数据的分析可供下载的CSV格式(出口到当前活动"标签"),以及产生一份完整的报告,以Microsoft Excel所有的标签,在一个文件。

SiteAnalyzer, 出口数据

当出口数据以Excel有一个特殊的窗口,用户可以从中选择所需的列,然后生成报告所需的数据。

SiteAnalyzer, 出口数据

多语言

该方案有选择优选用语文的工作。

主要的支持语言:俄语、英语、德语、意大利、西班牙、法国...目前,该软件已被翻译成超过十五(15)最受欢迎的语言。

SiteAnalyzer, 多语言

如果你要翻译的程序,以自己的母语,只是翻译的文件"*的。天然气"你的语言,然后翻译的文件应送至该地址"support@site-analyzer.pro"(意见,信中必须写在俄语或英语),并翻译将包括在新释放的程序。

更详细的说明翻译成语言正在分发的文件("lcids.txt").

P.S.如果你有任何评论意见翻译质量发送评论和修正"support@site-analyzer.ru"上。

數據庫壓縮

主菜单项的"缩小数据库"的目的是为了操作的包装数据库(清洁数据库以前删除的项目,以及组织数据(类似的碎片的数据在个人计算机)项)。

这一程序是有效的情况下,例如,从该方案是删除了一个大型项目中含有大量的记录。 在一般情况下,建议进行定期压缩的数据,以摆脱的冗余数据和降低数据库的大小.

与回答其他问题可以发现的常见问题部分 >>

我们的客户