SUCHMASCHINEN NACHHILFE

Suchmaschinen als Glücksspiel


Quelle: http://www.akademie.de

Darüber hinaus bietet die Suchmaschine schon bei der einfachen Suche ("Simple Search") sehr viele Möglichkeiten, die bei anderen Suchmaschinen auch in der fortgeschrittenen Version ("Advanced Search") nicht möglich sind.

Erfahrenen Anwendern ist aber auch bewußt, daß es sich bei der Suche in AltaVista nicht um eine exakte Wissenschaft, sondern eher um eine Art Glückspiel handelt. Das liegt teilweise in der Natur der Sache.

Suchmaschinen vergleichen nur die Eingabe des Benutzers mit dem Inhalt des Index. Der Bedeutungsgehalt der eingegebenen Worte wird dabei vollständig ignoriert.

Woher sollte AltaVista beispielsweise wissen, daß sich ein Teil der Suchanfragen nach "pupil" auf Schüler (englisch: pupil), ein anderer auf Pupillen (englisch: pupil) bezieht?

Doch auch in anderen Punkten zeigt AltaVista - ebenso wie andere Suchmaschinen - wenig Objektivität. Gibt man etwa die gleiche Suchanfrage zu verschiedenen Zeitpunkten bei AltaVista ein, so stellt man etwas interessantes fest: Die Zahl der Treffer unterscheidet sich teilweise enorm.

Dieses Phänomen läßt sich unter anderem darauf zurückführen, daß der AltaVista-Index auf verschiedenen Rechnern gespiegelt wird, um die vielen tausend gleichzeitigen Anfragen bedienen zu können. Da aber diese "Mirrors" (Spiegel) ständig aktualisiert werden, kann oft nicht der gesamte Datenbestand für die Suche verwendet werden.

Einige Experten vermuten außerdem, daß AltaVista zu Spitzenzeiten ein Zeitlimit für Suchanfragen setzt. So wird dann nur ein Teil des Index durchsucht.

Trotz dieser Einschränkungen genießt AltaVista hohes Ansehen, denn die von der Maschine gebotenen Suchmöglichkeiten sind enorm und sie werden ständig weiterentwickelt.

Phrasen-Suche bei AltaVista

So werden seit einiger Zeit mehrere, hintereinander eingegebene Begriffe als "Phrase" interpretiert, wenn es sich um häufig wiederkehrende Suchanfragen handelt. Das heißt, AltaVista geht bei häufig eingegeben Wortkombinationen davon aus, daß alle Suchbegriffe in der eingegebenen Reihenfolge und direkt aufeinanderfolgend im Text erscheinen müssen.

In der Praxis klappt das auch erstaunlich gut. Dennoch sollte man bei Suchen immer auch selbst etwas Hand anlegen. Wir möchten das an einigen Beispielen verdeutlichen, wobei wir zum besseren Verständnis die Eingabe jeweils zwischen < und > einklammern:

Microsoft-Chef Bill Gates ist eine bekannte Persönlichkeit und vermutlich suchen viele Anwender nach Informationen über ihn. Entsprechend hoch ist die Zahl der Ergebnisse für die Eingabe . Insgesamt 124.937 Seiten werden hier als Ergebnis aufgelistet.

Die Eingabe liefert sogar 134.400 Seiten, denn AltaVista sucht bei kleingeschriebenen Buchstaben nach der Schreibweise mit kleinen und großen Buchstaben, bei Großschreibung dagegen nur nach großen Buchstaben.

Suchen wir dann nach der Phrase "Bill Gates" - indem wir Vor- und Nachname zwischen Hochkommata stellen - erhalten wir das gleiche Ergebnis: <"Bill Gates"> führt wie zuvor zu 124.937 und <"bill gates"> zu 134.400 Treffern. Hier scheint die automatische Phrasenbildung also hervorragend zu arbeiten.

Bei weniger bekannten Namen, nach denen die Anwender vermutlich nicht so häufig suchen, sieht die Sache allerdings anders aus. Testen wir es einmal mit dem durchaus nicht seltenen deutschen Namen Stefan Müller: Die Eingabe (394.970 Treffer) produziert wie im vorherigen Beispiel weniger Ergebnisse als (417.130 Treffer).

Doch hier endet schon Übereinstimmung mit dem Beispiel "Bill Gates". Die Eingabe <"Stefan Müller"> als Phrase liefert nur noch 1.213 und <"stefan müller"> entsprechend 1248 Treffer. Hier bildet AltaVista also offensichtlich keine Phrasen. Unser Beispiel zeigt daher, daß es sich empfiehlt, die Phrasierung von Suchbegriffen nicht in jedem Fall der Suchmaschine zu überlassen.

Wie wichtig das ist, zeigt eine Weiterführung des Beispiels. Stellen wir uns vor vor, wir wären auf der Suche nach Informationen über den Geburtstag unseres fiktiven Stefan Müller. Geben wir ein, so werden wir von der Riesenzahl der Ergebnisse schier erschlagen: 528.560 Treffer sind eindeutig zuviel.

Wir können nun die Zahl der Ergebnisse verbessern, indem wir AltaVista die Phrasierung abnehmen. Und siehe da, die Eingabe <"Stefan Müller" Geburtstag> reduziert die Zahl der Ergebnisse bereits auf 73.210. Wir sind auf dem richtigen Weg! Um das Ergebnis weiter zu verbessern, müssen wir aber die Eingabe noch etwas überarbeiten.

Um dies zu tun, muß man folgendes wissen: Die Arbeitsweise AltaVistas läßt sich zwar nicht mehr nur durch die einfache Anwendung Bool'scher Algebra erklären. Doch logische Verknüpfungen etwa mit "und" beziehungsweise "oder" spielen immer noch eine außerordentlich wichtige Rolle.

Eingrenzung mit einer UND-Verknüpfung

Testen wir daher eine einfache Und-Verknüpfung: Die Eingabe lautet dann <"Stefan Müller" +Geburtstag>. Auf den ersten Blick scheint dies der richtige Weg, denn die Zahl der Ergebnisse reduziert sich erneut auf jetzt nur noch 39.670 Treffer. Bei näherem Hinsehen stellt man allerdings fest, daß fast alle gefundenen Seiten den Ausdruck "Geburtstag", aber nur ganz wenige die Zeichenfolge "Stefan Müller" enthalten.

Hier hilft nun ein kleiner Trick: Wir setzen einfach vor beide Suchbegriffe den Verknüpfungsbefehl "+". Die Eingabe <+"Stefan Müller" +Geburtstag> produziert plötzlich nur noch 31 Ergebnisse. Nochmal zum Vergleich: Bei der einfachen Eingabe erhielten wir fast 20.000mal mehr Treffer.

Zugegeben, Informationen über Stefan Müllers Geburtstag haben wir bei unserer Suche auch nicht sehr viele gefunden. Doch wir konnten zeigen, daß die Anwendung kleiner Tricks das Ergebnis einer Recherche wesentlich verbessern kann.

Noch deutlicher wird dies, wenn Sie nicht nach "Stefan Müllers Geburtstag", sondern beispielsweise nach Informationen über "Impfstoffe gegen Malaria und Kontraindikationen bei Schwangerschaft" oder "Johann Sebastian Bachs Jugend in Eisenach" suchen.

Denn diese Regel gilt für alle Suchmaschinen: Je eindeutiger eine Suchanfrage formuliert werden kann und je mehr spezielle Suchbegriffe verwendet werden können, um so eher sind Suchmaschinen geeignet. Kennt man dagegen nur Oberbegriffe zu einem Thema, so sollte man sich eher an ein Verzeichnis wenden.