Twitter Facebook Linkedin

Шолу жаңа нұсқасын SiteAnalyzer 2.5

Сипаттамасы жаңалықтарды нұсқасы 2.5 (құрастыру 280)

Comments: 0
 538
2021-07-26 | Уақыт оқулары: 5 минут
Facebook
Автор: Simagin Andrey

Бәріңе сәлем! Біз қайтадан бизнеспіз!

Өте ұзақ кезеңнен кейін біз SiteAnalyzer жаңа шығарылымын дайындадық, ол сіздің үміттеріңізге сай болады және SEO-ны алға жылжытуда таптырмас көмекші болады.

SiteAnalyzer-дің жаңа нұсқасында біз пайдаланушылар тарапынан ең көп сұралған бірнеше функцияларды жүзеге асырдық, мысалы: деректерді скрепинг (сайттан деректерді шығару), мазмұнның бірегейлігін тексеру және Google PageSpeed арқылы парақтың жүктелу жылдамдығын тексеру. Сонымен бірге көптеген қателер жойылып, логотип өзгертілді. Барлығы туралы толығырақ сөйлесейік.

SiteAnalyzer 2.5

Негізгі өзгерістер

1. XPath, CSS, XQuery, RegEx көмегімен деректерді қыру.

Веб-скрепинг - бұл белгілі ережелерге сәйкес сайттағы қызығушылықты беттерден деректерді шығарудың автоматтандырылған процесі.

Data scraping XPath, CSS, XQuery, RegEx

Веб-скрепингтің негізгі әдістері - XPath, CSS селекторлары, XQuery, RegExp және HTML шаблондарының көмегімен талдау әдістері.

  • XPath - бұл XML / XHTML құжат элементтеріне арналған арнайы сұраныс тілі. Элементтерге қол жеткізу үшін XPath бетте қажетті элементке жолды сипаттау арқылы DOM навигациясын қолданады. Оның көмегімен сіз құжаттың реттік нөмірі бойынша элементтің мәнін алуға, оның мәтіндік мазмұнын немесе ішкі кодын алуға, бетте белгілі бір элементтің бар-жоғын тексеруге болады.
  • CSS селекторлары оның бөлігінің (атрибутының) элементін табу үшін қолданылады. CSS синтаксистік жағынан XPath-қа ұқсас, бірақ кейбір жағдайларда CSS локаторлары жылдамырақ және сипаттамалы әрі қысқа болады. CSS-тің минусы - ол тек бір бағытта - құжаттың тереңінде жұмыс істейтіндігінде. XPath, керісінше, екі тәсілмен де жұмыс істейді (мысалы, сіз ата-ана элементін баладан іздей аласыз).
  • XQuery негізі XPath. XQuery XML-ді имитациялайды, бұл XSLT-де мүмкін емес тәсілмен кірістірілген өрнектер жасауға мүмкіндік береді.
  • RegExp - мәтіндік жолдар жиынтығынан қажетті шарттарға сәйкес келетін мәндерді шығаруға арналған ресми іздеу тілі (тұрақты өрнек).
  • HTML шаблоны - бұл HTML фрагменті үшін қажетті фрагменттің іздеу шаблонын, сонымен қатар деректерді шығарып алу және түрлендіру функциялары мен операцияларын сипаттау үшін HTML белгілеуінің тіркесімі болып табылатын мәліметтерді шығаруға арналған тіл.

Әдетте, скрепинг қолмен өңдеу қиын болатын тапсырмаларды шешу үшін қолданылады. Бұл жаңа интернет-дүкен құру үшін тауарлардың сипаттамаларын шығарып алу, бағаларды бақылау немесе жарнамаларды бақылау үшін маркетингтік зерттеулерде қырып тастау болуы мүмкін.

Data scraping

SiteAnalyzer-де қырып алу экстракция ережелері конфигурацияланған Деректерді шығару қойындысында реттелген. Ережелерді сақтауға және қажет болған жағдайда редакциялауға болады.

Scraping settings

Ережелерді тексеру модулі де бар. Кірістірілген ережелерді жөндеу құралын пайдаланып, сіз сайттың кез-келген парағының HTML мазмұнын тез және оңай ала аласыз және сұраныстардың жұмысын тексере аласыз, содан кейін SiteAnalyzer-да деректерді талдау үшін түзетілген ережелерді қолдана аласыз.

Testing the scraping rules

Деректерді шығаруды аяқтағаннан кейін барлық жиналған ақпаратты Excel бағдарламасына экспорттауға болады.

Exporting data to Excel

Модульдің жұмысын неғұрлым егжей-тегжейлі зерделеу және кең таралған ережелер мен тұрақты тіркестердің тізімін

2. Сайт ішіндегі мазмұнның бірегейлігін тексеру.

Бұл құрал қайталанатын беттерді іздеуге және сайт ішіндегі мәтіндердің бірегейлігін тексеруге мүмкіндік береді. Басқаша айтқанда, бұл URL мекенжайлар тобының бір-біріне деген біртұтастығын пакеттік тексеру.

Бұл жағдайда пайдалы болуы мүмкін:

  • Толық қайталанатын беттерді іздеу үшін (мысалы, параметірлері бар парақ және бірдей парақ, бірақ CNC көрінісінде).
  • Мазмұнның ішінара сәйкестігін іздеу үшін (мысалы, аспаздық блогтағы бір-біріне 96% ұқсас екі борщ рецепті, бұл мүмкін трафикті каннибализациядан арылту үшін мақалалардың бірін өшіру керек).
  • Сіз мақалалар сайтында кездейсоқ 10 жыл бұрын жазған тақырыпқа мақала жаздыңыз. Бұл жағдайда біздің құрал осындай мақаланың телнұсқасын анықтайды.

Мазмұнның бірегейлігін тексеру құралының принципі қарапайым: бағдарлама олардың мазмұнын веб-сайттар тізімінен жүктейді, парақтың мәтіндік мазмұнын алады (HEAD блогынсыз және HTML тегтерсіз), содан кейін оларды әрқайсысымен салыстырады Shingle алгоритмін қолданатын басқа.

Content uniqueness check

Осылайша, черепицаларды қолданып, біз парақтардың бірегейлігін анықтаймыз және 0% бірегейлігімен парақтардың толық көшірмелерін де, мәтін мазмұнының әр түрлі бірегейлік деңгейлерімен ішінара телнұсқаларын да есептей аламыз. Бағдарлама черепицаның ұзындығы 5-ке тең.

Модульдің қалай жұмыс істейтіні туралы көбірек білуге болады.: >>

3. Google PageSpeed арқылы беттерді жүктеу жылдамдығын тексеру.

Google іздеу алыбының PageSpeed Insights құралы белгілі бір парақ элементтерінің жүктеу жылдамдығын тексеруге мүмкіндік береді, сонымен қатар жұмыс үстеліне және шолғыштың мобильді нұсқаларына қызығушылық тудыратын URL мекенжайларының жүктеме жылдамдығының жалпы бағасын көрсетеді.

How Google PageSpeed Insights works

Google-дің құралы бәріне пайдалы, дегенмен оның бір маңызды кемшілігі бар - бұл сіздің топтық URL тексерулерін құруға мүмкіндік бермейді, бұл сіздің сайтыңыздың көптеген беттерін тексергенде қолайсыздық тудырады: 100 немесе одан да көп URL мекенжайлары үшін жүктеу жылдамдығын қолмен тексеруге келісім беріңіз бір парақ қиын және көп уақытты алуы мүмкін.

Сондықтан біз Google PageSpeed Insights құралындағы арнайы API арқылы парақтың жүктелу жылдамдығын топтық тексерулерді құруға мүмкіндік беретін модуль құрдық.

Checking page loading speed, Google PageSpeed

Негізгі талданған параметрлер:

  • FCP (First Contentful Paint) – бірінші мазмұнды көрсету уақыты.
  • SI (Speed Index) – мазмұнның парақта қаншалықты тез көрсетілетінін көрсететін көрсеткіш.
  • LCP (Largest Contentful Paint) – беттегі ең үлкен элементтің көрсетілу уақыты.
  • TTI (Time to Interactive) – парақ пайдаланушының өзара әрекеттесуіне толық дайын болатын уақыт.
  • TBT (Total Blocking Time) – мазмұнның алғашқы көрсетілуінен бастап пайдаланушының өзара әрекеттесуіне дайын болғанға дейінгі уақыт.
  • CLS (Cumulative Layout Shift) – жиынтық ауысым. Парақтың визуалды тұрақтылығын өлшеуге қызмет етеді.

SiteAnalyzer-дің көп ағынды жұмысының арқасында жүздеген немесе одан да көп URL мекенжайларын тексеру бірнеше минутты алады, бұл қолмен режимде браузер арқылы бір күн немесе одан да көп уақыт алуы мүмкін.

Сонымен бірге URL мекен-жайын талдау небары екі-ақ рет басылады, содан кейін есепті жүктеуге болады, оның ішінде Excel-де ыңғайлы формадағы чектердің негізгі сипаттамалары бар.

Жұмысты бастау үшін API кілтін алу қажет.
Мұны қалай жасауға болады, осы мақалада сипатталған. >>

4. Жобаларды қалталар бойынша топтастыру мүмкіндігі қосылды.

Жобалар тізімі бойынша ыңғайлы навигация үшін сайттарды қалталар бойынша топтастыру мүмкіндігі қосылды.

Grouping projects into folders

Сонымен қатар, жобалар тізімін атауы бойынша сүзуге мүмкіндік туды.

5. Бағдарлама параметрлерінің интерфейсі жаңартылды.

SiteAnalyzer settings interface updated

Бағдарламаның функционалдығын кеңейте отырып, біз үшін қойындыларды пайдалану «тығыз» болды, сондықтан біз параметрлер терезесін түсінікті және функционалды интерфейске қайта құрдық.

Ескертпелер:

  • URL ерекшеліктерін есепке алудың қате есебі
  • сайтты тексеру тереңдігінің қате есебі
  • файлдан импортталған URL мекенжайлары үшін бағыттаулардың қалпына келтірілуі
  • қойындылардағы бағандардың ретін қайта құру және есте сақтау қабілетін қалпына келтірді
  • канондық емес парақтардың есебін қалпына келтірді, мәселені бос метатегтермен шешті
  • «Ақпарат» қойындысындағы сілтемелер якорларының көрсетілімі қалпына келтірілді
  • буферден көптеген URL мекен-жайларын жылдам импорттау
  • тақырып пен сипаттаманы әрдайым дұрыс талдауға болмайды
  • кескіндердегі альт пен тақырыптың қалпына келтірілуі
  • жобаны сканерлеу кезінде «Сыртқы сілтемелер» қойындысына ауысу кезінде қатып қалу
  • жобалар арасында ауысу кезінде және «Сайтты тексеріп шығу статистикасы» қойындысының түйіндерін жаңарту кезінде пайда болған қатені жойды
  • параметрлері бар URL мекен-жайы үшін ұяшық деңгейінің қате анықтамасы
  • негізгі кестеде HTML-хэш өрісі бойынша тіркелген деректерді сұрыптау
  • бағдарламаның кириллица домендерімен оңтайландырылған жұмысы
  • жаңартылған бағдарлама параметрлерінің интерфейсі
  • логотип дизайны жаңартылды

Қосылыңыз, біздің арна Facebook! https://www.facebook.com/siteanalyzer.pro/
Үшін дауыс беріңіздер, сонда бізді Product Hunt!
SiteAnalyzer on Product Hunt

Бағалаңыз бап
0/5
0


Алдыңғы нұсқаларға шолу:



0 comments

You must be logged to leave a comment.


<< Бұрын

Біздің клиенттер