Для тих, хто пов'язаний створенням сайтів, дроп, сітками сайтів тощо не потрібно пояснювати, як корисний сайт web.archive.org (веб архів орг).
Основне його завдання подивитися web архів сайтів яких вже немає в пошуковій видачі. Тобто контент сайту і його структура, який був розміщений на ньому раніше. Звичайно, архів є не для всіх сайтів. В основному для активних сайтів, які розвивалися.
Як подивитися архів сайту
Все просто, відкриваємо сайт http://web.archive.org/ і вводимо потрібний сайт в рядок пошуку.
Далі, якщо у сайту є архів, Ви побачите дати, у вигляді календаря, за які є архіви. Потрібно просто вибрати дату, для відкриття сайту.
Ще можна перевірити архів сайту відразу написавши в адресному рядку браузера
https://web.archive.org/web/*/ + потрібний сайт, наприклад
https://web.archive.org/web/*/https://bestweb4u.net/
Розглянемо випадок, коли Ви хочете купити домен, не нова, але який вже закінчився, але скажімо у нього вже є посилальна маса, ІКС і інші показники. Такий сайт буде простіше просунути. А ще краще буде відновити його структуру і контент. В такому випадку пошуковики швидко обійдуть його, і все відновлять. І Ви почнете отримувати трафік. Зрозуміло, що це дуже ідеальний варіант.
Саме в цьому випадку Вам допоможе Веб Архив. Знайти такий домен важко, і треба щоб ще і архів був. Найчастіше доводиться перевірити багато сайтів на доступність архіву.
Парсер веб архіву (web.archive.org)
У мене недавно була така потреба. І так як я користуюся універсальним парсером Datacol, то без праці накидав проект, який допоможе в цьому.
Це готовий проект парсер / чекер web.archive.org під Датакол. Парсер веб архіву перевіряє кожен сайт і знаходить дату першого архіву, дату останнього архіву і окремо параметр є сайт в архіві чи ні. Хоча якщо є дати, то і так зрозуміло, що сайт є в архіві. Для перевірки потрібно всього лише підготувати список сайтів або доменів. На виході отримаєте CSV файл з даними по кожному сайту.
Парсер web.archive.org абсолютно безкоштовний і завантажити його може кожен. Налаштування дуже проста. Просто задаєте список доменів / сайтів в список початкових URL і в експорті задаєте папку для збереження підсумкового файлу. За замовчуванням в корінь диска D.
Для тих, хто не знайомий з Датакол, можна ознайомиться з можливостями на офф сайті . І також отримати знижку 20% на його покупку.
Якщо Вам потрібна доробка парсеру під свої потреби, пишіть в форму нижче.
Written by Адміністратор in / 759 Wiews