Benutzer-Werkzeuge

Webseiten-Werkzeuge


administration:suche

Dies ist eine alte Version des Dokuments!


Suche

Für die Suche kommt die TYPO3-Extension „solr“, die einen Apache Solr-Suchindex nutzt, zur Anwendung. Sowohl die Extension als auch der Solr-Server sind extrem flexibel und gut konfigurierbar.

Folgende Elemente werden indexiert:

  • Seiten: Werden über den normalen Solr-Indexer-Scheduler-Task indexiert. Änderungen an Seiten und Inhalten werden über DataHandler-Hooks erkannt und bei einer Änderung wird das entsprechende Element zur Neuindexierung/Löschung terminiert.
  • Dokumente: Im Inhalt verlinkte Dokumente werden von der Extension „solrfal“ (nur für EAP2-Kunden zugänglich, visol ist EAP2-Kunde) indexiert. Bei der Indexierung wird über SignalSlot der Tika-Dienst der Extension „tika“ aufgerufen, welcher die Metadaten und den Inhalt der Datei ausliest und in der Tabelle sys_file_reference speichert (Feld „tika_content“). Der Inhalt dieses Feldes wird ebenfalls in die Datenbank geschrieben, sodass eine Volltextsuche aller Dokumente möglich ist. Der Titel aus sys_file_reference wird in ein separates Feld „falTitle_stringS“ gespeichert und wird - falls gesetzt - anstelle des Dateinamens ausgegeben.
  • Personen: Die proprietäre Extension useruniluaddress importiert täglich alle Adressen aus einem von der Uni automatisiert auf den Server (/home/www-data/externaldata) gestellten XML-File. Ist dieses File gültig, werden via DataHandler alle bestehenden Adressen gelöscht, was auch die Löschung aus dem Solr-Index triggert. Danach werden alle Adressen neu importiert. Für Personen gibt es eine spezielle Suchausgabe, die direkt Telefonnummer, E-Mail-Adresse und Links auf Visitenkarte und Website anzeigt. Personen werden mit einem boostQuery priorisiert, sodass z.B. bei der Suche nach „Portmann“ das Personen-Resultat Lukas Portmann vor Seiten mit Portmann im Text erscheint.

Für die Eingrenzung der Suche werden Facets verwenden. Die Facetten stehen bereits im Suchformular zur Verfügung:

Lehrveranstaltungssuche

Die Lehrveranstaltungssuche ist eine externe Suche. Sie steht aber bereits in den Facets zur Verfügung. Per JavaScript wird vor dem Abschicken der Suche geprüft, ob die entsprechende Facet angewählt wurde. Falls dem so ist, wird der Query String an die Lehrveranstaltungssuche in einem neuen Tab übergeben.

Seiten von der Suche ausschliessen

Berechtigung: Web-Administrator

Seiten, die nicht in der Suche erscheinen sollen, können für die Suche in den Seiteneigenschaften deaktiviert werden:

Um dies für mehrere Seiten rekursiv zu machen, gibt es im Bereich Web > Funktionen ein Modul:

Troubleshooting

Da Nine keinen Solr-Server in Version 4.8 bieten kann, wurde der Solr-Server mit dem Benutzer www-data selber installiert und muss auch selber betrieben werden. Insofern ist bei technischen Problemen von Nine auch keine Unterstützung zu erwarten.

Tika überlastet Server

Tika extrahiert Inhalt und Metadaten aus allen Dokumenten, die auf der Website verknüpft sind. Offenbar kann Tika leaken; vermutlich, wenn es ein besonders grosses File oder ein fehlerhaftes File zu lesen versucht. Der Java-Prozess benötigt dann rund 100% CPU über längere Zeit, was den Server langsam macht.

Durch ein „killall java“ werden alle Java-Prozesse beendet, damit allerdings auch der Solr-Server, der neu gestartet werden muss.

ToDo: Hier muss noch eine bessere Lösung gefunden werden

Solr-Server starten

Wurde der Solr-Server beendet, z.B. aufgrund eines „killall java“ (s.o.), muss er neu gestartet werden. Für Shutdown und Startup gibt es Skripts:

~/solr-tomcat/tomcat/bin/shutdown.sh
~/solr-tomcat/tomcat/bin/startup.sh

Der englische Index funktionierte nach einem Startup ohne vorheriges Shutdown jeweils nicht mehr, was eigentlich unlogisch ist.

Dass Solr wieder geht, kann anschliessend im Backend verifiziert werden:

administration/suche.1404556657.txt.gz · Zuletzt geändert: (Externe Bearbeitung)

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki