Facebook Twitter

SiteAnalyzer Документація

Докладний опис роботи з програмою SiteAnalyzer

Призначення програми

Програма SiteAnalyzer призначена для аналізу сайту і виявлення технічних помилок (пошук битих посилань, дублікатів сторінок, некоректних відповідей сервера), а також помилок і недоробок в SEO-оптимізації (незаповнені мета-теги, надлишок або повна відсутність заголовків сторінок h1, аналіз контенту сторінки, якість перелінковки і безліч інших SEO-параметрів).

SiteAnalyzer, Призначення програми

Основні можливості

  • Сканування всіх сторінок сайту, а також зображень, скриптів і документів
  • Отримання кодів відповіді сервера для кожної сторінки сайту (200, 301, 302, 404, 500, 503 і т. д.)
  • Визначення наявності та вмісту Title, Keywords, Description, H1-H6
  • Пошук і відображення "дублікатів" сторінок, мета-тегів і заголовків
  • Визначення наявності атрибуту rel="canonical" для кожної сторінки сайту
  • Дотримання директивам файлу "robots.txt", мета-тега "robots", або X-Robots-Tag
  • Облік "noindex" і "nofollow" при обході сторінок сайту
  • Нормативний аналіз: визначення внутрішніх і зовнішніх посилань для будь-якої сторінки сайту
  • Розрахунок внутрішнього показника PageRank для кожної сторінки сайту
  • Визначення кількості перенаправлень зі сторінки (редиректів)
  • Сканування довільних URL і зовнішніх Sitemap.xml
  • Генерація карти сайту "sitemap.xml" (з можливістю розбиття на кілька файлів)
  • Фільтрація даних по будь-якому параметру (гнучке налаштування фільтрів будь-якої складності)
  • Експорт звітів в CSV, Excel i PDF

Відмінності від аналогів

  • Низькі вимоги до ресурсів комп'ютера, малий витрата оперативної пам'яті
  • Сканування сайтів практично будь-яких обсягів за рахунок низьких вимог до ресурсів комп'ютера
  • Портативний формат (працює без інсталяції на ПК або прямо зі змінного носія)

Розділи документації

Початок роботи

При запуску програми користувачу доступна адресний рядок для введення URL аналізованого сайту (можна ввести будь-яку сторінку сайту, так як пошуковий робот, пройшовши по посиланнях вихідної сторінки обійде весь сайт, в тому числі і головну сторінку, при умови що всі посилання виконані в HTML і не використовують Javascript).

Після натискання кнопки "Старт", пошуковий робот починає обхід всіх сторінок сайту за внутрішніми посиланнями (на зовнішні ресурси, він не переходить, також не переходить за посиланнями, виконаним на Javascript).

Після того, як робот обійде всі сторінки сайту стає доступним звіт, виконаний у вигляді таблиці і відображає отримані дані, згруповані за тематичним закладок.

Усі аналізовані проекти відображаються в лівій частині програми і автоматично зберігаються в базі програми разом з одержаними даними. Для видалення непотрібних сайтів скористайтеся контекстним меню списку проектів.

Примітка:

  • при натисканні на кнопку "Пауза" сканування проекту призупиняється, паралельно поточний прогрес сканування зберігається в базу, що дозволяє, наприклад, закрити програму і продовжити сканування проекту після перезапуску програми з місця зупинки
  • кнопка "Стоп" перериває сканування поточного проекту без можливості продовження його сканування

Налаштування програми

Розділ головного меню "Параметри" призначений для тонкого налаштування роботи програми із зовнішніми сайтами і містить 7 вкладок:

SiteAnalyzer, Налаштування програми

Основні налаштування

Розділ основних налаштувань служить для вказівки програмі користувача директив, використовуваних при скануванні сайту.

Опис параметрів:

  • Кількість потоків
    • Чим більше число потоків, тим більше URL зможе обробити в одиницю часу. При цьому потрібно враховувати, що більша кількість потоків веде до більшого числа використовуваних ресурсів ПК. Рекомендується встановлювати кількість потоків в діапазоні 5-10.
  • Час сканування
    • Служить для встановлення обмеження сканування сайту за часом. Вимірюється у годинах.
  • Максимальна глибина
    • Даний параметр служить для вказівки глибини сканування сайту. Головна сторінка сайту має рівень вкладеності = 0. Наприклад, якщо потрібно сканувати сторінки сайту виду "somedomain.ru/catalog.html" і "somedomain.ru/catalog/tovar.html", то в такому випадку необхідно виставити значення максимальної глибини = 2.
  • Затримка між запитами
    • Служить для установки пауз при зверненнях сканера до сторінок сайту. Це буває необхідно для сайтів на "слабких" хостингах, не витримують великих навантажень і частих до них звернень.
  • Таймаут запиту
    • Установка часу очікування відповіді сайту на запит програми. Якщо якісь із сторінок сайту відповідають повільно (довго вантажаться), то сканування сайту може зайняти досить тривалий час. Такі сторінки можна відсікти, вказавши значення, після якого сканер перейде до сканування решти сторінок сайту і тим самим не буде затримувати загальний прогрес.
  • Число сканованих сторінок сайту
    • Обмеження на максимальне число сканованих сторінок. Буває корисно, якщо, наприклад, вам потрібно просканувати перші N сторінок сайту (при цьому не враховуються зображення, файли стилів, скрипти і інші типи файлів).

Сканування

SiteAnalyzer, Сканування

Враховувати контент

  • У цьому розділі можна вибрати типи даних, які будуть враховуватися парсером при обході сторінок (зображення, відео, стилі, скрипти), або виключити зайву інформацію при парсингу.

Правила сканування

  • Дані налаштування пов'язані з налаштуваннями винятків при обході сайту сканер використовуючи файл "robots.txt" за посиланнями типу "nofollow", а також використовуючи директиви "meta name=robots" безпосередньо в коді сторінок сайту.

SEO

SiteAnalyzer, SEO

Даний розділ служить для вказівки основних аналізованих SEO-параметрів, які в подальшому будуть перевірятися на коректність при парсингу сторінок, після чого отримана статистика буде відображена на вкладці "Статистика SEO" в правій частині головного вікна програми.

Yandex XML

За допомогою даних налаштувань можна вибрати сервіс, за допомогою якого буде проводитися перевірка індексації сторінок в пошуковій системі Yandex. Є два варіанти перевірки індексації: за допомогою сервісу Yandex XML або сервісу Majento.ru.

SiteAnalyzer, Yandex XML

При виборі сервісу Yandex XML потрібно враховувати можливі обмеження (погодинні або щоденні), які можуть бути застосовані при перевірці індексації сторінок, щодо наявних лімітів на ваш обліковий запис Yandex, в результаті чого часто можуть виникати ситуації, коли лімітів вашого облікового запису не буде вистачати для перевірки всіх сторінок за один раз і для цього доведеться чекати наступної години.

При використанні сервісу Majento.ru погодинні або щоденні обмеження практично відсутні, так як ваш ліміт буквально вливається в загальний пул лімітів, який сам по собі не малий, а також має значно більший ліміт при погодинних обмеженнях, ніж будь-який з окремих користувальницьких акаунтів на Yandex XML.

SiteAnalyzer, Перевірка індексації сторінок в Yandex

User-Agent

В розділі User-Agent можна вказати, яким юзер-агентом буде представлятися програма при зверненні до зовнішніх сайтів під час сканування. За умочанию, встановлений користувальницький юзер-агент, однак при необхідності можна вибрати один із стандартних агентів, найбільш часто зустрічаються в інтернет. Серед них є такі, як: боти пошукових систем YandexBot, GoogleBot, MicrosoftEdge, боти браузерів Chrome, Firefox, IE8, а також мобільних пристроїв iPhone, Android і багато інших.

Proxy-сервер

Якщо є необхідність працювати через проксі, то в даному розділі ви можете додати список проксі-серверів, через які програма буде звертатися до зовнішніх ресурсів. Додатково, є можливість перевірки проксі на працездатність, а також функція видалення неактивних проксі-серверів.

SiteAnalyzer, Proxy-сервер

Винятки

Даний розділ призначений для виключення обходу певних сторінок і розділів сайту при парсингу.

За допомогою регулярних виразів можна вказати які розділи сайту не повинні обходитися сканером і, відповідно, не повинні потрапити в базу програми. Даний список є локальним списком винятків на час сканування сайту (щодо нього "глобальним" списком є файл "robots.txt" в корені сайту).

PageRank

За допомогою параметра PageRank можна аналізувати навігаційну структуру ваших сайтів, а також оптимізувати систему внутрішніх посилань веб-ресурсу для передачі посилального ваги найбільш важливих сторінок.

SiteAnalyzer, PageRank settings

У програмі є два варіанти розрахунку PageRank: класичний алгоритм і його більш сучасний аналог. В цілому, для аналізу внутрішньої перелинковки сайту немає великої різниці при використанні першого або другого алгоритмів, тому ви можете використовувати будь-який алгоритм з двох запропонованих.

Детальний опис алгоритму та принципи розрахунку PageRank читайте в статті "Розрахунок внутрішнього PageRank": >>

Робота з програмою

Після завершення сканування користувачеві стає доступна інформація, розміщена у блоці "Основні дані". Кожна вкладка містить дані, згруповані щодо їх назв (наприклад, вкладка "Title" містить вміст заголовків сторінок <title> < /title>, вкладка "Зображення" містить список всіх зображень сайту і так далі). З допомогою цих даних можна проводити аналіз вмісту сайту, знаходити "биті" посилання або некоректно заповнені мета-теги.

SiteAnalyzer, Призначення програми

SiteAnalyzer, Робота з програмою

При необхідності (наприклад, після внесення змін на сайті) з допомогою контекстного меню є можливість нове сканування окремих URL для відображення змін у програмі.

З допомогою цього меню можна відображати дублікати сторінок за відповідними параметрами (дублі title, description, keywords, h1, h2, контент сторінок).

SiteAnalyzer, Робота з програмою

Фільтрація даних

Для більш зручного аналізу статистики сайту в програмі доступна фільтрація даних. Фільтрація можлива у двох варіантах:

  • по будь-яких полях за допомогою "швидкого" фільтра
  • з використанням настроюваного фільтра (за допомогою розширених налаштувань вибірки даних)

Швидкий фільтр

Використовується для швидкого фільтрування даних і застосовується одночасно до всіх полів поточної вкладки.

SiteAnalyzer, Швидкий фільтр

Настроюваний фільтр

Призначений для детальної фільтрації і може містити одночасно кілька умов. Наприклад, для мета-тегу "title" ви ходите відфільтрувати сторінки по їх довжині, щоб він не перевищував 70 символів і одночасно містив текст "новости". Тоді цей фільтр буде виглядати так:

SiteAnalyzer, Настроюваний фільтр

Приклад вибірки з даного фільтру:

SiteAnalyzer, Настроюваний фільтр

Таким чином, застосовуючи настроюваний фільтр до будь-якої з вкладок ви можете отримувати вибірки даних будь-якої складності.

Технічна статистика сайту

Вкладка технічної статистики сайту знаходиться на панелі "Додаткові дані" і містить набір основних технічних параметрів сайту: статистика по посиланнях, мета-тегами, кодами відповідей сторінок, параметрам індексації сторінок, типам контенту і т.п. параметрам.

Клікнувши по одному з параметрів вони автоматично фільтруються у відповідній вкладці основних даних сайту, а також одночасно відображається статистика на діаграмі в нижній частині сторінки.

SiteAnalyzer, Технічна статистика сайту

Статистика SEO

Вкладка SEO-статистики призначена для проведення повноцінних аудитів сайту і містить 50+ основних SEO-параметрів і визначає більш 60 ключових помилок внутрішньої оптимізації! Відображення помилок ділиться на групи, які, в свою чергу, містять набори аналізованих параметрів і фільтри, що виявляють помилки на сайті.

Детальний опис усіх перевірених параметрів читайте в цій статті. >>

SiteAnalyzer, Статистика SEO

Для всіх результатів фільтрації є можливість їх швидкого експорту в Excel без додаткових діалогів (звіт зберігається в папці з програмою).

Структура сайту

Даний функціонал призначений для створення структури сайту на основі отриманих даних. Структура сайту генерується виходячи з вкладеності URL сторінок. Після генерації структури доступний її експорт в CSV формат (Excel).

SiteAnalyzer, Структура сайту

Контекстне меню списку проектів

  • У списку проектів доступно масове сканування шляхом виділення потрібних сайтів і натискання кнопки "Пересканувати". Після чого всі сайти стають в чергу і скануються по черзі в стандартному режимі.
  • Також, для зручності роботи з програмою, масове видалення вибраних сайтів також доступно по кнопці "Видалити".
  • Крім одиничного сканування сайтів, існує можливість масового додавання сайтів в список проектів за допомогою спеціальної форми, після чого користувач може просканувати цікавлять проекти цілком.

SiteAnalyzer

Генерація Sitemap.xml

Карта сайту генерується на основі просканованих сторінок сайту. До неї додаються сторінки формату "text/html".

Згенерувати карту сайту можна відразу після сканування сайту, через головне меню-пункт "Проекти -> Генерувати Sitemap".

SiteAnalyzer, Генерація Sitemap.xml

Для сайтів великих обсягів, від 50 000 сторінок, є функція автоматичного розбиття "sitemap.xml" на декілька файлів (в цьому випадку основний файл містить посилання на додаткові, що містять безпосередньо посилання на сторінки сайту). Це пов'язано з вимогами пошукових систем для обробки файлів sitemap великих розмірів.

SiteAnalyzer, Генерація Sitemap.xml

При необхідності, обсяг сторінок у файлі "sitemap.xml" можна варіювати, змінюючи значення 50 000 (встановлено за умовчанням) на потрібне значення в основних налаштуваннях програми.

Сканування довільних URL

Пункт меню "Імпорт URL" призначений для сканування довільних списків URL, а також XML-карт сайту Sitemap.xml (в тому числі і індексних) для їх подальшого аналізу.

SiteAnalyzer, Import URL

Сканування довільних URL можливо трьома способами:

  • шляхом вставки списку URL з буфера обміну
  • завантаження з жорсткого диска файлів формату *.txt і *.xml, що містять списки URL
  • шляхом скачування файлу Sitemap.xml безпосередньо з сайту
SiteAnalyzer, Scanning a list of arbitrary URLs

SiteAnalyzer, Scanning Sitemap.xml by URL

Особливістю цього режиму є те, що при скануванні довільних URL сам "проект" не зберігається в програмі і дані за нього не додається в базу. Також не доступні розділи "Структура сайту" і "Дашборд".

Більш детально ознайомитись з роботою пункту "Імпорт URL" можна в цій статті: Огляд нової версії SiteAnalyzer 1.9.

Dashboard

Вкладка "Дашборд", відображає докладний звіт про поточний якості оптимізації сайту. Звіт генерується на основі даних вкладки "Статистика SEO". Крім цих даних у звіті присутня вказівка загального показника якості оптимізації сайту, розраховується за 100-бальною шкалою щодо поточної ступеня його оптимізації. Є можливість експорту даних вкладки "Дашборд" у зручний звіт у форматі PDF.

SiteAnalyzer, Dashboard

Експорт даних

Для більш гнучкого аналізу отриманих даних є можливість їх вивантаження в CSV формат (експортується поточна активна вкладка), а також генерації повноцінного звіту в Microsoft Excel з усіма вкладками в одному файлі.

SiteAnalyzer, Експорт даних

При експорті даних в Excel з'являється спеціальне вікно, в якому користувач може вибрати колонки і потім згенерувати звіт з потрібними даними.

SiteAnalyzer, Експорт даних

Багатомовність

У програмі є можливість вибору потрібної мови, на якому буде вестися робота.

Основні підтримувані мови: російська, англійська, німецька, італійська, іспанська, французька... На даний момент програма перекладена на більш ніж за п'ятнадцять (15) найбільш популярних мов.

SiteAnalyzer, Багатомовність

Якщо ви хочете перевести програму на свою рідну мову, то для цього достатньо перевести будь-який файл "*.lng" на зацікавив мову, після чого перекладений файл потрібно відправити на адресу "support@site-analyzer.pro" (коментарі до листа повинні бути написані російською або англійською мовами) і ваш переклад буде включений в новий реліз програми.

Більш детальна інструкція по перекладу програми на мови знаходиться в дистрибутиві (файл "lcids.txt").

P. S. Якщо у вас є зауваження за якістю перекладу - відправляйте зауваження і виправлення "support@site-analyzer.ru".

Стиснення бази даних

Пункт головного меню "Стиснути базу даних" призначений для виконання операції упаковки бази даних (чистка бази від раніше видалених проектів, а також упорядкування даних (аналог дефрагментації даних на персональних комп'ютерах)).

Дана процедура ефективна в разі, коли наприклад, з програми було видалено великий проект, який містить велику кількість записів. В цілому рекомендується проводити періодичне стиснення даних для рятування від надлишкових даних і зменшення обсягу бази.

З відповідями на інші питання можна ознайомитися в розділі FAQ >>

Наші клієнти