Kapitel II.1. Suchmaschinen

Inhaltsverzeichnis

II.1.1. Benutzung von Suchmaschinen
II.1.2. Beispiele zur Benutzung von Suchmaschinen
II.1.2.1. Metacrawler
II.1.2.2. Clusty.com
II.1.3. Nutzen und Validierung von Suchmaschinen

Suchmaschinen sind das wohl bekannteste Hilfsmittel zur Informationsgewinnung im Internet. Sie nehmen Suchbegriffe, bestehend aus einzelnen oder mehreren Wörtern, entgegen, suchen dazu aus ihrer Datenbank passende Einträge heraus und stellen die Ergebnisse in einer Liste dar, in der Regel mit Linksschlage den Begriff Links im Glossar nach zu den Quellen. Die Suchmaschine „Google“ (http://www.google.dehttp://www.google.de (in einem neuen Fenster)), die den Inhalt von über 8 Milliarden Webseitenschlage den Begriff Webseiten im Glossar nach gespeichert hat[3], hat bereits den Sprachgebrauch geprägt: Das Verb „googeln“ als Synonym für die Online-Suche mittels einer Suchmaschine hat bereits 2004 den Eingang in die 23. Auflage des Dudens gefunden.[4] Weitere wichtige Suchdienste sind „AltaVista“ (http://www.altavista.dehttp://www.altavista.de (in einem neuen Fenster)), „Alexa“ (http://www.alexa.comhttp://www.alexa.com (in einem neuen Fenster)), „MSN Suche“ (http://search.msn.dehttp://search.msn.de (in einem neuen Fenster)), „Yahoo! Suche“ (http://search.yahoo.dehttp://search.yahoo.de (in einem neuen Fenster)), „Seekport“ (http://seekport.dehttp://seekport.de (in einem neuen Fenster)), „Lycos“ (http://www.lycos.dehttp://www.lycos.de (in einem neuen Fenster)), „Web.de“ (http://www.web.dehttp://www.web.de (in einem neuen Fenster)) und „Ask“ (http://ask.comhttp://ask.com (in einem neuen Fenster)).

Zur Erfassung des Inhalts von Webseiten greifen Suchmaschinen auf sogenannte Webcrawlerschlage den Begriff Webcrawler im Glossar nach, auch Spiderschlage den Begriff Spider im Glossar nach oder Botsschlage den Begriff Bots im Glossar nach genannt, zurück. Dies sind Programme, die automatisch die Seiten durchsuchen und deren Inhalt in eine Datenbank eintragen. Ein Spider kann dabei den Links auf den einzelnen Seiten folgen und gelangt so auf neue Seiten, die ebenfalls durchsucht werden. In der Regel stützen sich Suchmaschinen beim Indizieren einer Seite nicht allein auf die Meta-Angaben des Dokuments[5], sondern erfassen wie Google auch die Position einzelner Wörter im Text.[6] Das Netz wird dabei von den Suchmaschinen nur in bestimmten Abständen durchsucht, so dass Änderungen auf Webseiten nicht in Echtzeit in die Datenbanken der Suchmaschinen übernommen werden.

Die Kriterien, nach denen die Relevanz der Treffer zu einem Suchbegriff berechnet wird, unterscheiden sich von Suchmaschine zu Suchmaschine. Auch sind die eingesetzten Verfahren unterschiedlich transparent. Während in der unübersichtlichen Online-Hilfe des MSN-Suchdienstes keinerlei Angaben zur Gewichtung der Treffer zu finden waren, spricht Yahoo lediglich davon, bei der Erstellung des Ranking unter anderem den Titel, den Text, die Quelle und die Verlinkungen zu berücksichtigen[7], verschweigt aber, wie die einzelnen Kriterien gewichtet werden. Google gibt etwas mehr über die verwendete Technologie preis: Neben der Position der Suchbegriffe im Text und der Einbeziehung des Inhalts benachbarter Seiten wird für die Relevanzkalkulation auf die sogenannte „PageRank“-Technologie zurückgegriffen. Die Wichtigkeit einer Seite steigt dabei mit der Anzahl der Links, die auf die Seite verweisen. Dabei geht Google über die bloße Zählung der Links hinaus: Je wichtiger die verlinkende Seite ihrerseits ist, desto mehr steigt die Relevanz der verlinkten Seite.[8]

Da sich die Suchmaschinen in ihrem Datenbestand sehr unterscheiden, liegt eine parallele Suche in mehreren Suchmaschinen nahe. Sogenannte Meta-Suchmaschinen leiten eine Suchanfrage an normale Suchmaschinen weiter und holen das Ergebnis ab, wobei die Trefferlisten kombiniert und dabei neu geordnet sowie Dubletten entfernt werden. Die Verlässlichkeit der Ergebnisse steigt dadurch. Auf spezielle Funktionen einzelner Suchmaschinen muss man dabei aber verzichten.[9] Außerdem sind sie etwas langsamer. Bekannte Vertreter sind die Meta-Suchmaschinen „Metacrawler“ (http://www.metacrawler.dehttp://www.metacrawler.de (in einem neuen Fenster)), „MetaGer“ (http://meta.rrzn.uni-hannover.dehttp://meta.rrzn.uni-hannover.de (in einem neuen Fenster)) und „Metaspinner“ (http://index.meta-spinner.dehttp://index.meta-spinner.de (in einem neuen Fenster))

Clustersuchmaschinen wie „Clusty.com“ (http://www.clusty.comhttp://clusty.com (in einem neuen Fenster)) fassen Suchergebnisse zu Clustern zusammen, sprich sie gruppieren sie thematisch. Die Suchanfrage kann dann bequem weiter eingeschränkt werden, indem man durch den Themenbaum navigiert, der zu einer Suchanfrage generiert wurde. Clusty.com ist gleichzeitig eine Meta-Suchmaschine und greift unter anderem auf die MSN-Suche[10] zurück.

Auf „Sucharchiv.com“ (http://www.sucharchiv.comhttp://www.sucharchiv.com (in einem neuen Fenster)) und „Klug Suchen!“ (http://www.klug-suchen.dehttp://www.klug-suchen.de (in einem neuen Fenster)) sind umfangreiche, kommentierte Verzeichnisse allgemeiner, regionaler und fachspezifischer Suchdienste zu finden. Sie umfassen aber nicht nur klassische Suchmaschinen und Meta-Suchmaschinen, sondern auch Webkataloge, Linklisten, Portale und Online-Datenbanken.



[3] Vgl. Google Inc., <Unternehmensprofil>, online unter: http://www.google.de/intl/de/corporate/http://www.google.de/intl/de/corporate/ (in einem neuen Fenster), Abruf: 05.10.2006.

[4] Vgl. Michael Eckert, „"Googeln" schafft es in den neuen Duden“, 01.09.2004, online unter: http://www.tecchannel.de/news/themen/business/419615/http://www.tecchannel.de/news/themen/business/419615/ (in einem neuen Fenster), Abruf: 02.09.2006.

[5] Diese umfassen meist Angaben zum Autor, Keywords und eine Kurzbeschreibung und sind im Browserschlage den Begriff Browser im Glossar nach nicht sichtbar, wohl aber für die Bots der Suchmaschinen.

[6] Vgl. Google Inc., <Unternehmensinformationen. Google-Technologie>, online unter: http://www.google.de/corporate/tech.htmlhttp://www.google.de/corporate/tech.html (in einem neuen Fenster), Abruf: 20.10.2005.

[7] Vgl. Yahoo! Deutschland GmbH, <Wie funktioniert das Ranking der Web-Sites?>, online unter: http://eur.help.yahoo.com/help/de/ysearch/ranking/ranking-01.htmlhttp://eur.help.yahoo.com/help/de/ysearch/ranking/ranking-01.html (in einem neuen Fenster), Abruf: 25.06.2006.

[9] Vgl. Waldemar Grosch, Geschichte im Internet: Tipps, Tricks und Adressen, Schwalbach 2002.

[10] Weitere Quellen sind die Dienste Ask, GigaBlast, das Open Directory Project, LookSmart und WiseNut.

„Wer sucht, der findet - oder auch nicht.“PDF-VersionCopyright © 2006 Christoph Bichlmeier