• Open Source e-Learning
Kunkel, Matthias [mkunkel] - 25. Nov 2015, 17:25

Profi-Suchtipps mit Lucene

Um Inhalte auf der Installation zu finden, bietet ILIAS drei Sucharten an: die Direktsuche, die Indizierte Suche (aka Index-Suche) und die Lucene-Suche[1] . Letztere muss zwar zusätzlich konfiguriert werden. Dennoch ist sie die erste Wahl für große Installationen, da sie auch bei einem großen Magazin schnell zielgenaue Suchergebnisse liefert. Beliebt ist die Lucene-Suche auch deshalb, weil mit ihr Dateien unabhängig von ihrem Format (PDF, Word, Excel, ...) nach Inhalten durchsucht werden können. Weniger bekannt ist dagegen ihre umfangreiche Syntax, die das Suchen mit Platzhaltern und verschiedenen Operatoren unterstützt. Nachfolgend möchte ich einige Tricks für die Lucene-Suche kurz vorstellen:
Das Suche-Formular in ILIAS bietet neben der Eingabe der Suchbegriffe schon die Möglichkeit, den Suchbereich auf einen bestimmten Teil des Magazins einzugrenzen, nur in bestimmten Objekttypen zu suchen oder - ab ILIAS 5.1 - nur Objekte anzuzeigen, die vor oder die nach einem bestimmten Datum erzeugt worden sind. Die Lucene-Syntax bietet darüber hinaus aber noch weitere Möglichkeiten:
  • ILIAS owner:homer sucht nach Inhalten mit dem Begriff ILIAS, die in Objekten vorkommen, die dem Benutzer homer gehören.
  • tag:ILIAS zeigt alle ILIAS-Objekte, die mit dem Begriff ILIAS getaggt sind.
Die Lucene-Suche unterstützt auch Platzhalter, sogenannte „Wildcards“. Hierbei ersetzen bestimmte Zeichen einen oder mehrere Buchstaben oder Ziffern innerhalb des Suchbegriffs, wodurch sich die Trefferzahl erhöht:
  • Bei der Eingabe des Suchbegriffs organi?ation wird sowohl nach 'organisation' als auch nach 'organization' gesucht. Das ? steht hierbei für jeden beliebigen Buchstaben bzw. Ziffer.
  • Der Suchbegriff Politi* zeigt unter anderem Ergebnisse für Politik, Politics, Politische, usw... Bei der Eingabe von Lea*ing würden unter anderen Learning und Leading als Treffer ausgegeben. Das Zeichen * ersetzt hierbei jeweils kein, ein oder mehrere Zeichen.
Auch boolesche Operatoren wie AND oder NOT werden von der Lucene-Suche unterstützt. Mit diesen können Bedingungen und Verknüpfungen der Suchbegriffe definiert werden. WIchtig ist, die Operatoren immer mit Großbuchstaben zu schreiben:
  • Templates AND Kurs zeigt nur Ergebnisse an, in denen sowohl der Begriff Templates als auch der Begriff Kurs vorkommt.
  • Bei der Eingabe von +Kompetenz Mathematik muss das Ergebnis Kompetenz und kann Mathematik enthalten.
  • Durch Mitglieder NOT Gruppe werden nur Ergebnisse angezeigt, die zwar den Begriff Mitglieder, nicht aber Gruppe enthalten.
  • Und mit der Eingabe Didaktische -"Didaktische Templates" erreicht man, dass zwar Ergebnisse mit dem Begriff Didakische angezeigt werden, nicht aber Ergebnisse, die Didaktische Templates beinhalten.
Und jetzt viel Glück beim Suchen!
P.S.: Vielen Dank an Stefan Meyer, der nicht nur der langjährige Entwickler der Suche ist, sondern mich auch daran erinnert hat, dass ich die Lucene-Suchsyntax bereits in meinem ILIAS-Praxisbuch 2011 erläutert hatte und sie für den heutigen Blogbeitrag dort noch einmal nachlesen konnte.

[1] Lucene ist eine Programmbibliothek zur Volltextsuche, die von der Apache Software Foundation veröffentlicht wird. Die Bibliothek unterliegt der Apache-Lizenz und wird als Teil des ILIAS-Softwarepakets mit ausgeliefert. Weitere Infos unter https://lucene.apache.org/core/

User Image: Fabian
Kruse, Fabian [Fabian] - 08. Feb 2016

Dear Joke, we’re currently working on getting the English blog going. Our translator will also be creating an English version of this text!
User Image: Joke
van Cappelle, Joke [Joke] - Last edited on 07. Jan 2016

The content has been removed.

User Image: Joke
van Cappelle, Joke [Joke] - 07. Jan 2016

Thanks for this information. Where I can find this information in English?
User Image: ILIAS_LM
Mela, Alix [ILIAS_LM] - 26. Nov 2015

Ah, eine sehr schöne Aufstellung. Vielen Dank!
RSS