II.1.1. Benutzung von Suchmaschinen

Im Folgenden sollen der Übersichtlichkeit halber nur die drei „größten“ Suchmaschinen Google, Yahoo und MSN besprochen werden. Auch Suchanfragen, die aus nur einem Wort bestehen, werden hier nicht näher betrachtet. Schwierigkeiten können hingegen auftreten, wenn mehrere Begriffe in das Suchfeld eingegeben werden. Diese Wörter können logisch mit sogenannten Boole'schen Operatorenschlage den Begriff Boole'schen Operatoren im Glossar nach verknüpft werden. Praktisch jede Suchmaschine kann mit boole'schen Operatoren umgehen. Folgende Tabelle gibt eine Übersicht über die bei der Suche wichtigen boole'schen Operatoren:

Tabelle II.1.1. Boole'sche Operatoren

Operator (englisch)Operator (deutsch)ErklärungBeispiel
ANDUNDbeide Begriffe müssen vorkommenPazzi UND Medici
ORODERmindestens einer der Begriffe muss vorkommenBorgia ODER Borja
NOTNICHTder Begriff darf nicht vorkommenBorgia NICHT Rodrigo

Die boole'schen Operatoren UND und NICHT werden in den Suchmaschinen allerdings etwas anders implementiert. Die Angabe von UND ist nicht notwendig. Es genügt, einzelne Begriffe durch Leerzeichen zu trennen. Die Suchmaschine verknüpft dann alle eingegebenen Wörter implizit mit UND. Sollen Begriffe aus der Suche ausgeschlossen werden, muss man ein „-“ (Minuszeichen) davor setzen. Der deutsche Operator ODER funktioniert nur bei einer Suche nach deutschen Seiten. Bei einer Suche „im Web“, also international, muss die englische Form „OR“ verwendet werden.

Bei der Formulierung einer Suchanfrage ist es wichtig, zu wissen, dass die Suchmaschinen selbständig Wörter aus der Anfrage aussortieren, die keinen oder einen minimalen semantischen Inhalt haben. Diese sogenannten Stop-Wörterschlage den Begriff Stop-Wörter im Glossar nach betreffen hauptsächlich sehr kurze Wörter, Artikel, Pronomina und Konjunktionen, da diese nicht geeignet sind, eine Suche einzuschränken und nur die Suchmaschine belasten würden. In bestimmten Fällen sollen aber auch solche Stop-Wörter in die Suche miteinbezogen werden. Beispielsweise würde bei einer Suche nach Friedrich I. das „I“ aussortiert werden. Um es explizit mit einzubeziehen, setzt man ein „+“ (Pluszeichen) davor, also [ Friedrich +I ][11]. Alternativ ließe sich der Ausdruck auch in Anführungszeichen setzen, welche eine Suche nach exakt dieser Phrase startet. Die Anfrage lautet dann [ "Friedrich I." ].

Somit ergeben sich folgende grundlegende Modifikatoren, die in dieser Form von fast allen Suchmaschinen akzeptiert werden:

Tabelle II.1.2. Operatoren in Suchmaschinen

OperatorErklärungBeispiel
+dieses Wort muss vorkommenFriedrich +I
-dieses Wort darf nicht vorkommen-Rodrigo
ODER / ORmindestens einer der Begriffe muss vorkommenBorgia ODER Borja
" "diese Phrase muss exakt so vorkommen"Friedrich I."

Sowohl Google als auch Yahoo und MSN sind intelligent genug, um auch bei uneinheitlicher Groß- und Kleinschreibung oder verschiedenen Schreibweisen die richtigen Einträge zu finden. So finden sowohl Suchanfragen nach [ münchen ] als auch nach [ Muenchen ] Seiten, in denen von der bayerischen Landeshauptstadt die Rede ist. Verknüpfungen mit ODER werden damit überflüssig. Sollte man sich bei der Eingabe eines Suchbegriffs vertippt haben, können die Suchmaschinen außerdem die Schreibfehler feststellen und dem Benutzer auf der Ergebnisübersicht Vorschläge für korrekte Begriffe unterbreiten. Gibt man bei einer Suche nach [ Inquisition ] versehentlich [ Inqusition ] ein, erhält der Nutzer noch vor der Auflistung der Treffer den Hinweis „Meinten Sie: Inquisition“. Um die Suche nach genau einer bestimmten Schreibweise zu erzwingen, setzt man wieder ein „+“ davor: [ +Grafik ] ignoriert dann alle Seiten, die das Wort „Graphik“ enthalten und findet nur Einträge mit „Grafik“.

Neben diesen Operatoren kennen die geläufigen Suchmaschinen einige spezielle Modifikatoren, um die Suche über Meta-Angaben weiter einzuschränken, beispielsweise auf einen bestimmten Dateityp wie PDFschlage den Begriff PDF im Glossar nach oder eine bestimmte Domainschlage den Begriff Domain im Glossar nach oder URLschlage den Begriff URL im Glossar nach. Dies sind die wichtigsten Modifikatoren:

Tabelle II.1.3. Modifikatoren bei Suchmaschinen

ModifikatorErklärungBeispielErklärung des Beispiels
site:beschränke Suche auf Dokumente einer bestimmten Domainsite:uni-passau.dedurchsucht nur die Seiten der Universität Passau
link:finde die Dokumente, die auf die angegebene URL verlinkenlink:http://www.uni-passau.de/wir.htmlgibt alle Dokumente zurück, die auf http://www.uni-passau.de/wir.html verlinken
inurl:finde die Dokumente, die in ihrer URL den angegebenen Begriff enthalteninurl:passaugibt alle Dokumente zurück, die in ihrer URLpassau“ enthalten, z.B. www.passau.de und www.uni-passau.de
file:beschränke Suche auf den angegebenen Dokumententypfile:pdfnur PDF-Dokumente tauchen in der Trefferliste auf

Bei der Verwendung dieser Modifikatoren ist zu beachten, dass nach dem Doppelpunkt kein Leerzeichen stehen darf. Die meisten Suchmaschinen kennen noch mehr Modifikatoren, allerdings sind manche suchmaschinenspezifisch. Google bietet eine gute Übersicht unter http://www.google.com/help/operators.htmlhttp://www.google.com/help/operators.html (in einem neuen Fenster) an. Die entsprechende MSN-Hilfeseite ist unter http://search.msn.de/docs/help.aspx?t=SEARCH_REF_AdvSrchOperators.htmhttp://search.msn.de/docs/help.aspx?t=SEARCH_REF_AdvSrchOperators.htm (in einem neuen Fenster), das Yahoo-Pendant unter http://eur.help.yahoo.com/help/de/ysearch/basics/basics-08.htmlhttp://eur.help.yahoo.com/help/de/ysearch/basics/basics-08.html (in einem neuen Fenster) abrufbar.

Wer die Formulierung einer komplexen Suchanfrage auf diese Art für zu mühselig hält, gelangt mit einem Klick auf „Erweiterte Suche“ zu einem Formular, das dem Benutzer mit Hilfe von Auswahllisten die richtige Kombination von boole'schen Operatoren und Modifikatoren abnimmt und ihm darüber hinaus weitere Sucheinschränkungen wie das letzte Aktualisierungsdatum eines Dokuments bietet. Besonders die erweiterte Suche von Google bietet viele Möglichkeiten, eine Suche einzuschränken, und ist selbsterklärend.

Abbildung II.1.1. Bildschirmausschnitt: Erweiterte Suche von Google (27.06.2006)

Bildschirmausschnitt: Erweiterte Suche von Google

Bei der Trefferliste ist zu beachten, dass die Suchmaschinenbetreiber Platz für bezahlte Links freihalten. Diese sind nicht Bestandteil des eigentlichen Suchergebnisses und daher besonders gekennzeichnet. MSN fasst kommerzielle Links in einem Kasten „Gesponsorte Seiten“ zusammen. Bei Google heißt diese Rubrik „Anzeigen“. Die einzelnen Treffer werden wie folgt dargestellt. Unter dem Titel, der mit der Zielseite verlinkt ist, kann man einen Blick auf einen Ausschnitt des Textes werfen, wobei die Begriffe, nach denen gesucht wurden, fett hervorgehoben werden. So kann man die Treffer zumindest teilweise nach Brauchbarkeit überprüfen, ohne direkt auf die Seite zu gehen. Vorsicht ist vor Textausschnitten geboten, die eine bloße Aneinanderreihung von Schlagwörtern darstellen: Darunter verbergen sich meist unseriöse oder gar kriminelle Anbieter. Unter dem Textausschnitt findet man die komplette URL der gefundenen Seite. Auch sie kann Aufschluss über die zu erwartende Qualität liefern. Unter dem Link „Zwischengespeicherte Seite“ lässt sich, sofern die eigentliche Seite nicht mehr aufrufbar ist, eine ältere Version der Seite abrufen, die bei MSN gespeichert wurde. Google und Yahoo nennen diese Funktion „Im Cache“.

Abbildung II.1.2. Bildschirmausschnitt: Trefferliste von MSN (28.06.2006)

Bildschirmausschnitt: Trefferliste von MSN

Die Notwendigkeit einer sinnvollen Formulierung der Suchanfragen zeigen Beispielrecherchen nach Alfons de Borja und Friedrich I., König in Preußen, die mit Google, Yahoo und MSN durchgeführt wurden. Dabei wurde, wie in den Tabellen zu sehen ist, die Suche immer weiter eingeschränkt. Festgestellt wurden jeweils die gesamte Anzahl der Einträge, die die Suchmaschine ermittelt hat, sowie die Anzahl der Links auf der 1. Seite der Trefferliste, die tatsächlich zu Seiten führen, die die gesuchten Personen behandeln.[12]

Tabelle II.1.4. Ergebnisse der Suche nach Alfons de Borja

SuchanfrageGoogleYahooMSN
Treffer insg.tatsächl. Treffer auf Seite 1Treffer insg.tatsächl. Treffer auf Seite 1Treffer insg.tatsächl. Treffer auf Seite 1
Borja4.190.0001 / 102.100.0000 / 10667.8480 / 10
Alfons de Borja79.6007 / 105.3307 / 103.9094 / 10
"Alfons de Borja"2267 / 101627 / 101106 / 10

Es ist leicht zu sehen, dass eine unspezifische Suche nach Borja praktisch nutzlos ist. Selbst bei einer exakten Suche nach Alfons de Borja enthielten von den 10 Treffern, die auf der 1. Seite angezeigt wurden, nur maximal 7 Treffer Informationen zur historischen Person. Der Rest umfasste Links zu Instituten diesen Namens, Buchbesprechungen und bei Yahoo sogar einen Link zu einem historischen Roman bei Amazon. Aber selbst die 6 oder 7 vermeintlich brauchbaren Seiten lassen sich bei genauerer Betrachtung kaum für ernsthafte Recherchen heranziehen. Neben einigen wirklichen Kurzbiografien zu Alfons de Borja werden auch solche Seiten gelistet, die beispielsweise nur einen kurzen Hinweis darauf geben, dass Borja von 1455 bis 1458 unter dem Namen Kalixt III. Papst war und sonst keine weiteren Informationen liefern. Im Yahoo-Ergebnis war eine Dublette zu finden: Der gleiche Text wurde zweimal angeboten, allerdings in verschiedenen Sprachen.

Tabelle II.1.5. Ergebnisse der Suche nach Friedrich I., König in Preußen

SuchanfrageGoogleYahooMSN
Treffer insg.tatsächl. Treffer auf Seite 1Treffer insg.tatsächl. Treffer auf Seite 1Treffer insg.tatsächl. Treffer auf Seite 1
Friedrich I51.000.0000 / 1025.300.0000 / 109.375.2501 / 10
Friedrich +I25.500.0005 / 1025.900.0000 / 10575.4243 / 10
"Friedrich I."454.0005 / 10175.0000 / 1042.7034 / 10
"Friedrich I." -Barbarossa324.0006 / 10133.0000 / 1031.0054 / 10
"Friedrich I." Preußen106.0008 / 1045.3003 / 108.9808 / 10

Hier ergibt sich ein ähnlich unpräzises Bild. Neben dem gesuchten König Friedrich I. in Preußen schafften es auch Friedrich Barbarossa sowie Friedrich I., Kurfürst von der Pfalz, und Friedrich I. von Baden unter die 10 vermeintlich besten Treffer. Das Ausschließen von Barbarossa eliminierte diesen zwar aus der Trefferliste, dafür rückten andere nicht gesuchte Friedriche nach. Die Eingrenzung auf Preußen lieferte hingegen ein recht brauchbares Ergebnis. Die beiden verbleibenden Fehltreffer bei Google führten zum einen zu Friedrich Wilhelm I., dem Sohn von Friedrich I., und zum anderen auf eine „Kitschminiatur“, die bei eBay angeboten wurde. Das Suchergebnis bei Yahoo war sehr schlecht. Kaum ein Treffer führte zu einer Seite über König Friedrich I. in Preußen. Stattdessen setzte Yahoo einen Link zu Amazon sogar auf den 1. Platz. Hieran wird ersichtlich, warum man nicht mit nur einer Suchmaschine suchen sollte. Ansonsten unterscheiden sich auch hier die tatsächlichen Treffer enorm in der Qualität und Quantität: Einige der Seiten boten nur rudimentäre Informationen und enthielten so viel Werbung, dass man die eigentliche Information schwer finden konnte.



[11] Die eckigen Klammern dienen nur der Abgrenzung der Suchanfrage im Text. Anführungszeichen sind dafür ungeeignet, weil sie selbst eine besondere Bedeutung innerhalb von Suchausdrücken haben.

[12] Die Abfragen wurden am 28.06.2006 getätigt und nicht auf deutsche Seiten beschränkt. Eine Qualitätsbewertung der gefundenen Quellen beinhaltet diese Auflistung nicht.

„Wer sucht, der findet - oder auch nicht.“PDF-VersionCopyright © 2006 Christoph Bichlmeier