niedziela, 10 kwietnia 2011

Jak znaleźć niedziałające linki, czyli słowo o konserwacji katalogu stron.

Katalog stron ale i każda inna strona internetowa, która nie dba o regularne sprawdzanie poprawności linków oraz jakości stron, do których linkuje staje się z czasem jedynie mało atrakcyjnym archiwum Internetu. Prezentowanie linków do wygasłych domen, stron na parkingach, stron z błędami nie jest przydatne dla użytkowników. Duża liczba takich linków może być sygnałem dla wyszukiwarek, że zasoby katalogu straciły na swojej wartości.

Jak zakończyć może żywot przeciętna strona internetowa?
  • autor podejmuje decyzję o zamknięciu strony, domena przestaje istnieć, wyświetla się błąd o nieistniejącym adresie
  • domena po wygaśnięciu może zostać przejęta i wylądować na parkingu domen, giełdzie domen
  • domena po przejęciu przez inną osobę może całkowicie zmienić zawartość i, na przykład wartościowa strona hobbystyczna zamienia się w zaplecze pod SWL
Na każdej stronie mogą występować przejściowe problemy z dostępnością.
  • szeroko pojęte problemy z hostingiem np. chwilowa awaria hostingu, awaria łączy albo informacja o uregulowaniu zaległych płatności za serwer
  • błędy w skrypcie, silniku strony objawiające się komunikatami błędów
  • strona może paść łupem hakera, który podmieni treść, zostawi złośliwy kod lub przekieruje domenę

Najlepszym sposobem, ale i najbardziej czasochłonnym jest "ręczne" sprawdzanie. Daje dobre wyniki, bo wychwytujemy nie tylko nieaktywne strony, ale możemy na nowo dokonać oceny wpisów pod kątem treści. Nieaktualizowany serwis informacyjny lub blog nadaje się do usunięcia. Oczywiście przeglądnięcie dużego katalogu, to wiele dni lub tygodni pracy, ale wystarczy, że będziemy przeglądać choć kilkadziesiąt stron dziennie. Dzięki temu wychwycimy dużo nieaktywnych i porzuconych stron.

Do pomocy możemy też zaciągnąć użytkowników katalogu. Należy udostępnić odwiedzającym na przykład prosty odnośnik, dzięki któremu będą mogli zgłosić niedziałającą stronę. System ten sprawdza się bardzo dobrze, pod warunkiem że katalog stron jest popularny. Problemem w przypadku tego rozwiązania są fałszywe zgłoszenia. Część tych nieprawidłowych zgłoszeń wynika z głupich żartów, a część jest wynikiem chwilowej niedostępności danej strony.

Wykrywanie domen z problemami możemy zautomatyzować. Pobieramy treść strony i badamy pod kątem błędów http oraz charakterystycznych komunikatów. Dzięki zastosowaniu wyrażeń regularnych wyłapiemy większość kodów i komunikatów typowych dla parkingów domen, komunikatów hosta, błędów php, informacji w stylu "strona w przebudowie", "domena na sprzedaż" i wiele wiele innych. Pomocny może okazać się też niezwykle przydatny i darmowy program Xenu Link Sleuth,  który poza sprawdzaniem poprawności wewnętrznych linków może sprawdzać zewnętrzne linki.

Pamiętaj, aby nie usuwać od razu strony, ale dać jej kilka, kilkanaście dni. Nie chcemy przecież usuwać dobrych stron, które mają przejściowe problemy z hostingiem lub są w trakcie przebudowy. Połączenie wszystkich wymienionych powyżej sposobów da nam najlepszy efekt. Dzięki temu będziemy mieć świeży i zadbany katalog stron.

Brak komentarzy:

Prześlij komentarz