2018.06

Suche in MyCoRe mit Apache Solr

Die MyCoRe-Anwendungen benötigen eine leistungsstarke Suchmaschine für vielfältige Suchoperationen. Die Grundinstallation wird auf dieser Seite beschrieben. Hinsichtlich der konkreten MyCoRe-Anwendung gibt es weiterführenden Hinweise im Kapitel Suche.

Einrichtung eines Solr-Servers

Mit dem Release 2018.06 wurde in MyCoRe von Solr 4.10 (siehe Archiv) auf Solr 7 umgestellt. Um Solr zu installieren, folge man der Anleitung "Installing Solr" von der Solr Homepage.

Die richtige Solr Version kann hier heruntergeladen werden.

Es ist sinnvoll, wenn man das Datenverzeichnis mit den eigenen Cores nicht innerhalb der Solr-Distribution anlegt. Das gilt auch für die Log-Dateien.

Mit folgendem Kommando lässt sich der Solr-Server 'individualisiert' starten:

cd .../solr-7.4.0/bin ; solr start -s {my_data_dir} -p {my_port} -m {my_ram} -Dsolr.log.dir={my_log_dir}

Die Cores werden dabei nach {my_data_dir} gelegt, Log-Dateien nach {my_log_dir}. Beide Verzeichnisse müssen vorher angelegt werden. Eine detailierte Beschreibung der Startparameter und weitere Konfigurationsmöglichkeiten liefert die Seite "Solr Control Script Reference".

Für den produktiven Einsatz von Solr (Verzeichnisstruktur, init.d Skript für den automatischen Start, ...) liefert die Seite "Taking Solr to Production". die notwendigen Informationen.

Hinweis: Die mit Version 7 mitgelieferten TIKA-Bibliotheken führen bei Volltextindizierung zu enormen Performanceproblemen und Instabilitäten. Um das zu vermeiden müssen die Bibliotheken unter solr-7.*/contrib/extraction/lib/tika-*.jar gegen die Bibliotheken der Version 1.16 ausgetauscht werden. Diese können hier heruntergeladen werden:

Konfiguration

Damit ist die Solr-Installation abgeschlossen. Für jede MyCoRe-Anwendung müssen jetzt eine oder mehrere Solr-Cores angelegt werden. Die Konfiguration der Cores wird im Abschnitt Solr-Nutzung beschrieben.

Migration von Solr 4

Einige Dinge haben sich zwischen Version 4 und 7 geändert. Diese sollen in loser Reihenfolge hier aufgelistet werden.

  • Die solr.xml hat sich völlig verändert und sollte von einem Solr 7-Beispiel übernommen werden.
  • Die Schemadaten stehen nicht mehr in schema.xml sondern in der Datei managed-schema.
  • Einige Typbezeichnungen und Filterklassen gibt es nicht mehr, hier muss einen händische anpassung entsprechend der Dokumentation erfolgen.
  • Das Standardformat der Rückgabe einer Anfrage ist jetzt json und nicht mehr xml.

 Kathleen Neumann, Jens Kupferschmidt, Robert Stephan - 2018-08-08