Inhaltsverzeichnis
Link-Validierung
Technischer Hintergrund
1 Links - insbesondere auf externe Seiten - können im Prinzip in jedem Textfeld von TYPO3 gespeichert werden. Um die Links validieren zu können, müssen sie also extrahiert werden. Links sind sogenannte Soft References und können im Reference Index von TYPO3 (Tabelle sys_refindex) gespeichert werden. Damit TYPO3 solche Referenzen erkannt, werden sie im TCA des gewünschten Feldes konfiguriert:
'softref' => 'typolink_tag,email[subst],url',
Diese Konfiguration bedeutet, dass in diesem Feld Typolink-Tags vorkommen können (z.B. Link auf Seite 100: <link 100>Seite</link>), E-Mail-Adressen und URLs. Ist diese Konfiguration gesetzt, wird bei Anlegen oder Speichern eines Records via TYPO3-Backend überprüft, ob ein Link vorhanden ist und ein entsprechender Eintrag in den Reference Index geschrieben.
(Bei der Extbase Persistence, z.B. Import via Command Controller, muss dies explizit aktiviert werden!) Wird ein Eintrag erst nachträglich hinzugefügt, muss der Reference Index manuell aktualisiert werden.
Der Linkvalidator bedient sich nun den Links im Reference Index und überprüft durch einen Request für jeden Link, ob eine gültige Antwort (z.B. HTTP 200 OK) zurückkommt. Ist dies nicht der Fall, wird ein Eintrag in die Tabelle der fehlerhaften Links geschrieben.
Diese Überprüfung kann im Backend manuell durchgeführt werden oder aber per Scheduler-Task automatisch gemacht werden. Scheduler-Tasks können über den Betrieb eingerichtet werden.
Eingesetzte Scheduler-Tasks
- Adressen Personensuche/Feld Website: Dieses wird täglich um 22 Uhr (eine Stunde nach Import der Adressen) überprüft. Bei einem Fehler wird das Web-Team der Unilu per E-Mail benachrichtigt.
Manuelle Link-Validierung
Berechtigung: Web-Administrator
Die manuelle Link-Validierung ist für normale Seiten, Inhalte und News sowie für die Titel der Publikationsdatenbank konfiguriert. Es können einzelne Seiten, aber auch mehrere Seiten bis hin zu (theoretisch) der ganzen Website überprüft werden. Da für jeden Link eine Anfrage abgesetzt wird, ist diese Aufgabe aber sehr aufwändig, sodass es sich lohnt, keine allzu grossen Segmente auf einmal zu prüfen.
Um eine Link-Validierung durchzuführen, wird das Modul Info > Linkvalidierung aufgerufen und eine Seite ausgewählt. Die Auswahl „Diese Ebenen prüfen“ bezieht sich auf die gewählte Seite, im folgenden Beispiel werden also alle Links (aller Typen) der Seite „Studieren in Luzern“ und ihrer Unterseiten überprüft:
Sobald die Überprüfung abgeschlossen ist, erscheint ein Bericht als Tabelle unterhalb. Fehlerhafte Einträge können durch Klicken auf das Bearbeiten-Icon direkt korrigiert werden:
Wichtig: Es kann durchaus auch falsche Treffer geben, falls eine Seite kurzzeitig nicht erreichbar ist oder eine Umleitung aufweist. Entsprechend wichtig ist es, die eigentlichen Fehlermeldungen zu studieren.
Sichere Fehler
- 410 Gone: Die Seite wurde dauerhaft entfernt. Der Link muss also entfernt oder auf eine andere passende Seite angepasst werden.
- Seite XXX existiert nicht/ist nicht sichtbar/ist gelöscht: Es handelt sich um einen internen Link auf eine Seite, die nicht im System vorhanden ist/nicht sichtbar bzw. gelöscht wurde.
- Seite [Titel] (XXX) ist nicht sichtbar: Es handelt sich um einen internen Link auf eine Seite, die nicht sichtbar ist.
- 404 nicht gefunden: Die Seite wurde entfernt.
Mögliche falsche Treffer
- 400 Bad Request: Deutet auf eine Firewall hin, die die Anfrage des TYPO3-Bots blockiert. Link manuell überprüfen.
- 30x Weiterleitungen: Ev. kann die Link-Validierung einer Weiterleitung nicht folgen. Link manuell überprüfen.