[Home]

Zitierweise: Eysenbach, Gunther: Online-Recherche und Datenbanken im Internet. In: O.P. Schaefer (Hrsg.): Praxis und Computer. 20. Ed. Berlin-Heidelberg-New York: Springer-Verlag, 1998

 

Medizinische Datenbanken

Teil 4: Online-Recherche und Datenbanken im Internet

 

Das Internet ermöglicht Zugang zu einem weltweiten Pool an biomedizinischer Information und hat medizinische Recherchetechniken für klinische oder wissenschaftliche Fragestellungen innerhalb weniger Jahre revolutioniert. Während früher der Gang in die Bibliothek und die Suche in kostenpflichtigen Datenbanken meist der erste Schritt der Recherche darstellte, ist heute oftmals das Internet die erste Anlaufstelle. Seit sogar die Literaturdatenbank MEDLINE im Internet kostenlos zur Verfügung steht, hat der Mediziner direkt von seinem Schreibtisch aus Zugriff auf einen Großteil des medizinischen Wissens - "information at your fingertips". Und sollte das Gesuchte doch einmal nicht über das Internet zur Verfügung stehen (denn noch immer findet sich das weitaus größte Wissen in Bibliotheken), vereinfacht das Internet doch zumindest die Literaturbestellung und Zugang zu anderen Ressourcen erheblich.

Dieser Beitrag liefert einen Überblick über die wichtigsten Quellen und Recherchetechniken für medizinische Information im Internet.

 

Gunther Eysenbach

 

In diesem Kapitel erfahren Sie:

 

Generelle Einführung: Grundlagen des Internet

Das Internet ist - etwas vereinfacht ausgedrückt - ein globales Computernetz, welches die Rechner von Universitäten, Firmen und Privatnutzern miteinander verbindet.

Die technischen Grundlagen des Internets zu erläutern geht über die Zielsetzung dieses Beitrags hinaus, dennoch hier nochmals einige Grundlagen, die für die Recherche im Internet wichtig sind, erläutert werden. Für weitere Internet-Grundbegriffe wird auf das Glossar verwiesen.

Das Internet stellt dem Benutzer bekanntlich verschiedene Dienste zur Verfügung. Für die medizinische Recherche am wichtigsten sind:

World Wide Web (WWW): Dies ist neben Email mittlerweile der wichtigste "Dienst" des Internets - wer heute Internet sagt, meint meist das WWW. Es ist eine Art Benutzeroberfläche, welches dem Anwender Zugriff auf jegliche Art von Information gibt, die unter Umständen auf Rechnern rund um den Globus verteilt sein kann. Das WWW besteht aus einem Netz von sogenannten "Webservern" (Websites, Sites, Server), die Informationen nach dem WWW-Standard anbieten. Auf den Webservern "liegen" die elektronisch abrufbaren WWW-Dokumente ("Seiten", wobei die Hauptseite als Homepage bezeichnet wird). Die Dokumente können neben Text auch Bilder und andere multimediale Elemente enthalten (Filme, Töne usw.). Sogenannte Links (Hypertext-Verweise) verbinden die Dokumente miteinander, so daß eine Information, die auf einem bestimmten Server nicht verfügbar ist, von einem anderen beschafft werden kann. Somit kann auch ein vollkommen unbedarfter Anfänger ohne große Schulung im Internet nach Informationen recherchieren. Jedes Dokument im WWW hat eine eindeutige Adresse, die sogenannte URL (uniform resource locator), die immer mit "http://" anfängt (diese Abkürzung steht für Hypertext Transmission Protocol).

Telnet, Remote Login: Interaktive, kommandozeilen-orientierte Kommunikation mit einem Rechner.

Gopher: Textbasierte, menüorientierte Informationsausgabe

File Transfer (FTP): Mit diesem Protokoll kann der Benutzer Dateien, z.B. Computerprogramme, von anderen Rechnern auf seinen Rechner "herunterladen".

Das WWW ist die jüngste Entwicklung im Internet, während Telnet, Gopher und natürlich Email teilweise so alt sind, wie das Internet selbst. Am "anwenderfreundlichsten" ist zweifellos das WWW. Dennoch gibt es noch immer Rechner, insbesondere Bibliotheksrechner (OPACs, siehe unten), die noch nicht über eine "WWW-Benutzeroberfläche" verfügen und daher nur über Telnet zu erreichen sind. Auch gibt es noch ein paar wenige Informationssysteme, die nur über Gopher zu erreichen sind.

Softwarevoraussetzungen

Für das WWW benötigt man als Software einen Webbrowser (Netscape, Internet Explorer). Mit diesem lassen sich auch "Gopher"-orientierte Systeme lesen.

Um Dateien zu "FTPen" genügt meist ebenfalls der Webbrowser. Darüber hinaus gibt es auch eigene Programme (sogenannte FTP-Client-Programme), die noch etwas mehr Möglichkeiten bieten, als der Webbrowser, beispielsweise WS-FTP für Windows. Diese sind kostenlos im Internet verfügbar.

Für Telnet benötigt man meist ein spezielles Programm (Telnet-Client), welches entweder ebenfalls im Internet frei verfügbar ist oder sogar beim Betriebssystem mitgeliefert wird (UNIX, Windows-NT).

Bei der Suche und dem Download von Volltext-Artikeln stößt man sehr häufig auf Dateien, die im sogenannten PDF-Format abgespeichert sind. PDF steht für Portable Document Format und erlaubt die Darstellung am Bildschirm und den Ausdruck von fertig layouteten Dokumenten. PDF ist somit der de facto Standard für die elektronische Distribution von Dokumenten. Nach Auskunft von Adobe gibt es derzeit über 250.000 Websites, die PDF-Dokumente anbieten. Um eine PDF-Datei dazustellen, benötigt man den kostenlos erhältlichen Adobe Acrobat Reader, eine Software, die es für jeden Rechner (jede gebräuchliche Betriebssystemplattform) gibt. Im Internet kann der Acrobat Reader bei http://www.adobe.com/prodindex/acrobat/main.html heruntergeladen werden.

Allgemeine Recherchetechniken

Es sollen zunächst einige allgemeine Recherchetechniken angesprochen werden, bevor wir zu den rein medizinischen Werkzeugen und Methoden kommen.

Nach Traugott Koch (1996) werden 3 Arten von Navigation im Internet unterschieden:

Generell läßt sich sagen, daß der Informationssuchende am besten im Internet

Das "Surfen" hingegen ist eine sehr Internet-spezifische Art der Informationsaufnahme - sie eignet sich am ehesten dafür, wenn man neue Assoziationen und Verbindungen zu einem bekannten Thema aufsuchen und herstellen will - beim "Surfen" hat man also vorher von dem, was man sucht, noch gar keine Ahnung. "Surfen" ist einerseits gerade deswegen faszinierend, weil man auf neue Wissensgebiete und möglicherweise Querverbindungen zum gesuchten Thema stößt, von dem man gar nicht wußte, daß sie existieren, andererseits kann man sich beim wahllosen Surfen auch "verzetteln" und letztlich nach stundenlangem Internetsurfen feststellen, daß man eigentlich nichts Neues gelernt hat.

Aus dem oben Gesagten ergibt sich, daß man eher

Browsingdienste: Inhaltsverzeichnis des WWW

Auf der Suche nach Informationen im World Wide Web können verzeichnisorientierte Browsingdienste genutzt werden. Hauptmerkmal von Browsingdiensten ist die

Organisation der Daten in hierarchischen Strukturen. Meist sind diese nach Inhalten sortiert, es gibt aber auch geographische, chronologische ("What's new") oder nach Dokumenttypen geordnete Aufteilungen. Die Strukturen sind nicht durch die Tätigkeit von Maschinen, sondern durch die Arbeitsleistung von Menschen entstanden (Redakteure, die die entsprechenden Websites auf Vorschlag der "Anmelder" - meist der Autoren/Webmaster - in die entsprechenden Kategorien einordnen). Einer der bekanntesten Web-Verzeichnisse ist Yahoo! <www.yahoo.de>. Abbildung 1 zeigt die Verzeichniseinträge unter der Überschrift "Medizin" bei Yahoo.

Vor- und Nachteile

Die Vorteile ergeben sich durch die gezielte Auswahl und Aufnahme von Dokumenten in den Katalog. Es werden nur Texte aufgenommen, die die Redaktion als für Außenstehende relevant und von ausreichender Qualität befindet. Die Suche innerhalb der Browsingdienste bringt kaum Treffer, bei denen das Suchwort eher zufällig vorkommt. Durch die Ergänzung der Dokumente mit einer kurzen Zusammenfassung verbessert sich die Qualität der Suche. Die gelisteten Einträge liegen meist dicht an dem gesuchten Thema, das heißt die Präzision der Recherche ist sehr gut.

Der Einsatz von Redakteuern kann gleichzeitig zum Nachteil werden, da sich die Mitarbeiter der Browsingdienste für eine Kategorie entscheiden müssen und hier subjektive Einflüsse eine Rolle spielen können. Nicht immer ist eine eindeutige Zuordnung möglich. Ein noch gravierenderer Nachteil ist, daß nur ein sehr geringer Teil der verfügbaren Ressourcen im Internet katalogisiert werden kann (beispielsweise hat Yahoo! ungefähr 120.000 Web-Sites katalogisiert). Ein weiteres Problem von Browsingdiensten ist die manchmal mangelnde Aktualität der Verzeichnisse, da die Beständigkeit der erfaßten Dokumente fehlt und daher eine regelmäßige Überprüfung erfordern. Dieses ist mit manuellen Mitteln schwer zu bewältigen und erfordert den Einsatz maschineller Unterstützung.

 

Tab. 1: Browsingdienste (Kataloge) versus Suchdienste (Indices)

  Browsingdienst (Katalog) Suchdienst (Index)
Ausbeute (recall) niedrig hoch
Präzision hoch niedrig

 

Suchdienste: Index des WWW

Bei Suchdiensten handelt es sich um riesige, von Computern erstellte Datenbanken mit Informationen über Millionen von Web-Seiten.

Im Gegensatz zu Browsingdiensten wird auf den Einsatz von Menschen zur qualitativen Einschätzung der Informationen verzichtet. Die Dokumente werden mittels Software-Robotern (Softbots, Agenten) dem WWW entnommen. Anschließend werden die Daten indiziert und in die Datenbank eingeordnet. Bei der Suche nach einzelnen oder mit logischen Operatoren verknüpften Suchwörtern wird der Index per Software durchsucht und als Ergebnis eine Menge von Dokumenten ausgegeben.

Eine Suchmaschine besteht aus einem Informationssammler (genannt Robot, Spider, Crawler), der Indizierungssoftware und der Schnittstelle für Suchanfragen.

Die Informationssammler der Suchmaschinen sind automatische Programme, die im Web den Links in HTML-Dokumenten folgen. Startpunkte sind neben den bereits durchsuchten Seiten Listen mit Adressen ergiebiger oder neuer WWW-Server sowie Dokumentenadressen, die von den Autoren und Webmastern angemeldet werden. Alle gefundenen Dokumente werden erfaßt und der Inhalt wird "indexiert". Dabei wird eine Indextabelle angelegt, in der die vorkommenden Worte einer Seite aufgenommen werden. Oft werden dabei sogenannte Stoppwörter (stop words), wie Artikel (der, die, das), Präpositionen und Hilfsverben ignoriert.

Bei der automatischen Indizierung werden folgende Varianten unterschieden:

Daneben wird die konzeptbasierte Suche angewendet (bei der Suchmaschine Excite). Das System versucht mit Hilfe linguistischer Techniken herauszufinden, worum es in den Texten einer Web-Seite geht, um so die Suche qualitativ zu verbessern und relevante Suchergebnisse zu liefern.

Die meisten Suchmaschinen unterscheiden eine einfache oder fortgeschrittene Suche. Die fortgeschrittene Suche unterstützt - in Ergänzung zur einfache Suche - die Verknüpfung mehrerer Suchbegriffe oder Phrasen durch Boole'sche Operatoren. Hierdurch kann die Abfrage weiter präzisiert werden.

Vor- und Nachteile

Die wesentlichen Vorteile liegen - im Vergleich zu Browsingdiensten - in der höheren Vollständigkeit und Aktualität der erfaßten Ressourcen. Durch den Einsatz der Roboter werden automatisch umfangreiche Datenbestände erfaßt und indiziert. Die Ausbeute (recall) der Suche ist somit höher. Zudem werden inhaltliche Änderungen der Dokumente im Rahmen der Aktualisierungsintervalle der Datenbestände durch Neuindizierung berücksichtigt und gleichzeitig "tote" Links beseitigt. Das Aufsuchen sehr spezifischer Informationen wird durch die Volltextindizierung unterstützt.

Die Aktualität und Vollständigkeit der Suchmaschinen wird mit dem Nachteil der sehr hohen Netzbelastung erkauft. Für den Anwender gravierender ist der Nachteil, daß die "Präzision" der Recherche sehr niedrig ist, da auch ein unwichtiges Vorkommen eines Stichwortes zu einer gleichberechtigten Listung dieser "unwichtigen" Dokumenten neben relevanten Dokumenten.

 

Trotz der genannten Nachteile setzten sich die Suchmaschinen weiter durch, da nur so dem exponentiellen Wachstum der Informationen im Web Rechnung getragen werden kann. Dennoch ist in naher Zukunft keine annähernd hundertprozentige Abdeckung aller Ressourcen durch einen Suchdienst zu erwarten. Daher ist es sinnvoll, bei einer umfassenden Suche mehrere Suchmaschinen in Anspruch zu nehmen, um den Deckungsgrad der durchsuchten Ressourcen zu erhöhen.

Meta-Suchmaschinen durchsuchen gleich mehrere Suchserver auf einmal. Hierbei unterscheidet man zum einen "echte" Meta-Suchmaschinen, die gleichzeitig eine Reihe weiterer Server durchsuchen und die Ergebnisse dann übersichtlich aufbereiten und zum anderen solche Services, die eine oft große Zahl an Eingabemasken auf einer zentralen Seite versammeln.

 

Unterscheidungskriterien

Von den in Tab. 2 genannten Unterscheidungskriterien sollen hier besonders die unterschiedlichen Möglichkeiten zur Suche hervorgehoben werden:

Suchmöglichkeiten ...

Tab. 2

Kriterien AltaVista

www.altavista.digital.com

Excite

www.excite.com

HotBot

www.hotbot.com

Lycos

www.lycos.com

Opentext

www.opentext.com

Webcrawler

www.webcrawler.com

Stichwortsuche im            
- WWW Ja Ja Ja Ja Ja Ja
- Usenet Ja Ja Ja Nein Nein Nein
- Gopher Nein Nein Nein Ja Ja Ja
- FTP Nein Nein Nein Ja Ja Ja
Index-Typ Volltext Volltext Volltext Textanfang Volltext Volltext
Umfang (in Millionen)            
- WWW-Adressen *) 31 50 53,6 70 27,6 0,5
- Usenet-Artikel 4 1 k.A. - - -
Aktualisierungszyklen (in Wochen) 4-6 1 1 4 k.A. 4
Suchmöglichkeiten            
- Groß- / Kleinschreibung Ja Nein Nein Nein Nein Nein
- Boole'sche Operatoren Ja Ja Ja Ja Ja Ja
- Klammerung Ja Ja Ja Nein Nein Ja
- Wildcards (manuell) Ja Nein Nein Ja Nein Nein
- Nachbarschaftssuche Ja Nein Nein Nein Ja Ja
- Felder eines Dokumentes Ja Nein Ja Nein Ja Nein
Registrierung            
- Seite hinzufügen Ja Ja Ja Ja Ja Ja
- Seite löschen Nein Nein Nein Nein Nein Nein

*) Die Angaben sind nur bedingt miteinander vergleichbar, da die Zählweise unterschiedlich sein kann.

 

Beispielsuchen bei AltaVista

AltaVista, eine Entwicklung der Digital Equipment Corporation (DEC), ist zur Zeit der wahrscheinlich leistungsfähigste Suchdienst im World Wide Web. Der Dienst ging am 15. Dezember 1995 online. Initial entwickelte DEC AltaVista um die Leistungsfähigkeit der eigenen Computerhardware zu demonstrieren. Der große Erfolg (ca. 31 Millionen Zugriffe pro Tag) bewog DEC dazu eine ganze Produktlinie unter dem Namen "AltaVista" zu etablieren. Der gesamte Index hat eine Größe von 40 GigaByte

Herausragend sind bei AltaVista die umfangreichen Abfragemöglichkeiten.

Im einfachen Suchmodus wird eine Liste von Suchwörtern und/oder Phrasensuche unterstützt, wobei optional jedem Suchwort ein '+' oder '-' vorangestellt werden kann, um das Enthaltensein des Wortes im Dokument zu erzwingen oder verbieten. Zum Beispiel findet

AIDS therapie

alle Dokumente, in denen mindestens "AIDS" oder "therapie" vorkommt (wobei auch Therapie gefunden wird, aber nicht z.B. Aids oder aids - wenn Groß-/Kleinschreibung egal sein soll, Wörter immer in Kleinschrift eingeben!), während

+AIDS +therapie

nur Dokumente findet, in denen sowohl "AIDS" als auch "therapie" vorkommt, und

+AIDS -therapie

findet nur Seiten, in denen zwar "AIDS", aber nicht "therapie" vorkommt.

Will man nach "Phrasen" suchen, müssen die Ausdrücke in Hochkommata eingeschlossen werden, z.B.

+"AIDS therapie"

findet alle Dokumente, in denen beispielsweise die Phrase "AIDS-Therapie" vorkommt, aber nicht Texte, in denen die Wörter getrennt voneinander vorkommen, zum Beispiel ".. ist für AIDS eine gute Therapie...".

 

Im erweiterten Suchmodus wird zusätzlich Boole'sche Suche inklusive Klammerung und Nachbarschaftssuche (NEAR) unterstützt. Beispiel:

(aids NEAR therapy) AND ((AZT OR zidovudine OR retrovir) NEAR side effects)

 

In beiden Suchmodi stehen Wildcards am rechten Ende eines Wortes zur Verfügung. So findet zum Beispiel

AIDS therapie*

auch Dokumente, bei denen es um "AIDS-Therapieversuche" oder (englisch) um "AIDS therapies" geht.

Ausserdem kann in bestimmten Feldern eines Dokuments gesucht werden, zum Beispiel im Titel, in der URL oder im Hostnamen einer Seite.

+title:AIDS

findet zum Beispiel alle Dokumente, die "AIDS" im Titel haben.

Interessant ist auch die Möglichkeit, nach allen Seiten mit Links suchen zu können, die auf eine bestimmte Website führen, zum Beispiel findet

+links:yi.com -host:yi.com

alle Seiten, die einen Link auf die Website yi.com haben (wobei alle Seiten auf demselben Host yi.com, also "Selbstzitierungen", ausgeschlossen werden).

 

Aufgrund der großen Nachfrage wurde die Suchmaschine AltaVista in verschiedenen anderen Ländern - für Europa in Schweden (altavista.telia.com) - gespiegelt. Dabei wird in Europa die Suchschnittstelle und die Hilfeleistungen in verschiedenen Sprachen angeboten (z.B. http://altavista.telia.com/cgi-bin/telia?country=de&lang=de für die deutsche Sprache).

In jüngster Zeit gab es einige weitere Innovationen bei AltaVista. So gibt es jetzt auch zusätzlich einen Browsingindex (http://altavista.looksmart.com/altavista.html).

Faszinierend ist auch die noch relativ neue Möglichkeit, fremdsprachige Seiten (englisch, spanisch, französisch, portugiesisch, italienisch) in eine andere der genannten fünf Sprachen automatisch übersetzen zu lassen. Das Ergebnis ist zum Teil amüsant, zum Teil aber auch überraschend gut und reicht allemal aus, um den Inhalt zu verstehen. (Um die Übersetzung zu starten, klicken Sie auf "translate" beim Suchergebnis, oder wählen Sie direkt http://babelfish.altavista.digital.com/cgi-bin/translate?).

Eine weitere interessante Neuerung ist der sogenannte Cow9-Verfeinerungs-Algorithmus: Wenn der Benutzer nach einer Suche "refine" anklickt, wertet dieses Programm die in den gefundenen Dokumenten vorkommenden Wörter statistisch aus und zeigt die häufigsten Begriffe - gruppiert mit anderen assoziierten Begriffen - auf Wunsch graphisch an. Der Benutzer kann dann einfach die Begriffe anklicken, die er ein- oder ausschließen will.

Wie findet man Institutionen, Organisationen, Email-Adressen?

Sucht man nach einer Homepage von Institutionen, Organisationen oder Personen, fängt man in der Regel mit einem Suchindex an - wie man auch in einem Buch zuerst im Index nachschlagen würde. Nur, wenn es sich um sehr häufige, unspezifische Namen handelt (z.B. Miller), würde der Einstieg über einen Katalog ebenfalls Sinn machen.

Gerade bei der Suche nach Namen ist es wichtig, die Groß-/Kleinschreibung zu beachten. Man sollte bei der Suche nach einer Person zunächst nach der ganzen "Phrase" inklusive Vornamen suchen, zum Beispiel:

+"Bill Clinton"

Analog gibt man bei der Suche nach einer Institution den kompletten Namen ein. Führt dies zu sehr vielen gefundenen Einträgen, kann man die Suche etwa dadurch einschränken, daß man den Ortsnamen mit angibt, zum Beispiel:

+"Bill Clinton" +Washingon

Werden bei dieser sehr spezifischen Suche hingegen keine Einträge gefunden, versucht man es mit einer Nachbarschaftssuche:

Bill NEAR Clinton

und schließlich kann man es mit einer getrennten Suche von Vor- und Nachnamen versuchen:

+Bill +Clinton

oder schließlich ganz ohne Vornamen:

+Clinton

Bei AltaVista gibt es seit kurzem auch einen speziellen Modus, den "PeopleSearch", der allerdings auch nicht viel mehr hergibt, als die freie Suche nach dem obigen Schema.

Email-Adressen

Um die Email-Adresse einer bestimmten Person herauszubekommen - oder auch umgekehrt eine bekannte Email-Adresse einer Person zuzuordnen - kann man prinzipiell ebenfalls zunächst in einem Index nachschlagen - in der Hoffnung, darüber auf die Homepage und somit weitergehenden Informationen zu der Person oder Email-Adresse zu stoßen. Da aber natürlich längst nicht jeder, der eine Email-Adresse besitzt, auch eine Homepage auf dem WWW hat, ist dieser Ansatz nicht immer von Erfolg gekrönt. Daher gibt es auch spezielle Email-Suchdienste, die ihren Datenbestand zumeist aus Newsgroups (Usenet) beziehen. Eine Suche dort ist also meist auch nur erfolgreich, wenn die gesuchte Person schon einmal einen Newsgroup-Beitrag geschrieben hat. Email-Suchdienste sind zum Beispiel:

Four11 <four11.com>: eine der ältesten Email-Suchdienste.

WhoWhere <http://www.whowhere.com/>

Internet Address Finder (IAF) <http://www.iaf.net/>

Suchen.de: ein deutschsprachiger E-Mail Adressensucher,

MESA <http://mesa.rrzn.uni-hannover.de/>, der MetaEmailSearchAgent existiert seit Mai 1997 und ist eine Meta-Suchmaschine für E-Mail Adressen. Sie wird wie MetaGer vom Regionalen Rechenzentrum für Niedersachsen betrieben und durchsucht gleichzeitig die E-Mail Verzeichnisse ESP, IAF, Infospace, suchen.de, DejaNews, SwissInfo, Four11 und Bigfoot.

Bei den meisten Email-Suchdiensten kann man sich auch manuell anmelden und auch weitere Informationen (Beruf usw.) angeben, wenn man von anderen gefunden werden will.

 

Spezielle Methoden und Werkzeuge für die medizinische Recherche

Spezielle Suchmaschinen für Mediziner

Medivista

Das Deutsche Medizin Forum machte im Juli 1997 eine rein medizinische Suchmaschine "Medivista" unter der Internetadresse http://www.medivista.de/ zugänglich (siehe auch Kapitel 08.06 Teil 2). Hier werden sowohl deutschsprachige als auch internationale Internet-Rechner mit medizinischen Dokumenten und Artikeln indexiert. Die Zieladressen wurden vom Team des Deutschen Medizin Forums ausgewählt. Anfang 1998 hatte "Medivista" über 12.500 medizinische Internetrechner besucht und aus den Inhalten einen Index von über 260.000 abfragbaren Stichworten erzeugt. Nach einer Softwareverbesserung im Februar 1998 können ca. 6.000 neue Dokumente wöchentlich neu indiziert werden.

Antonius

Einen etwas anderen Ansatz verfolgt Antonius (http://www.klinik.uni-frankfurt.de/antonius/), eine Suchmaschine, die am Institut für medizinische Informatik an der Universität Frankfurt entwickelt wurde. Im Gegensatz zu Medivista indexiert Antonius ausschließlich deutsche Texte (die anhand der Stopwort-Liste erkannt werden, d.h. Antonius erkennt häufige Wörter wie "der, die, das" usw.), und zudem erkennt Antonius anhand einer internen "Jargon-Liste" (die aus einer großen Anzhal von medizinischen Fachbegriffen besteht) automatisch, ob es sich um eine medizinische Website handelt, oder nicht. Innovativ an diesem Suchindex ist insbesondere ein experimenteller errechneter "Impact-Factor", der angibt, wie oft eine Website von anderen Websites referenziert ("verlinkt") wurde.

Webcite.net

Dieses zur Zeit noch im Aufbau befindliche System indexiert ausschließlich wissenschaftliche Artikel, die auf dem Internet publiziert wurden. Artikel müssen entweder explizit angemeldet werden, oder sie werden vom webcite.net indexiert, wenn sie von einem anderen Artikel zitiert werden (in der Form von "http://webcite.net/?url=..."). Das System erstellt einen sogenannte WebCitation-Index, der in Analogie zum Science Citation Index Artikel nach Sachgebieten zusammenfasst, die eine gemeinsame Teilmenge an zitierten Publikationen oder Webartikeln haben. Außerdem kann aus der Häufigkeit der Zitate ein Impact Factor für jeden Webartikel errechnet werden, der auf die Qualität eines Internet-Artikels schließen läßt, und somit dem Leser einen Hinweis auf die Glaubwürdigkeit des Autors gibt. Im Gegensatz zu Antonius ist dieser Impact-Faktor weitaus spezifischer, da nur zitierende Fachartikel berücksichtigt werden, und nicht ganze Websites mit willkürlichem Inhalt. Weiterhin erlaubt webcite.net das Hinterlegen von "Leserkommentaren" als peer-review zu jedem Artikel.

 

Marvin

Als Beispiel für eine internationale medizinische Suchmaschine sei hier Marvin genannt (Multi-Agent Retrieval Vagabond on Information Networks), welche unter Bezeichnung MedHunt über die Website der Health on the Net Foundation abfragbar ist (http://www.hon.ch/cgi-bin/find). Auch hier dient eine 12.000 medizinische Begriffe umfassende Terminologieliste als Basis für Marvin, um medizinische Websites zu "erkennen". Zusätzlich werden von der Health on the Net Foundation besonders gute Websites auch manuell bewertet und beschrieben.

Spezielle Kataloge (Browsingdienste) für Mediziner

Spezifisch medizinische Kataloge gibt es in weitaus größerer Anzahl als medizinische Suchmaschinen. Als deutschsprachige Beispiele sollen hier der Frankfurter Index (http://www.klinik.uni-frankfurt.de/findex/) und der "Medizinindex Deutschland" (http://www.medizin.de, siehe auch Kapitel 08.06 Teil 2) genannt werden.

Englischsprachige Kataloge gibt es in noch größerer Anzahl, Beispiele sind etwa Medsite

(http://www.medsite.com/), Medical Matrix (http://www.medmatrix.org) und die Health on the Net Foundation (http://www.hon.ch/).

Darüber hinaus gibt es noch eine Vielzahl von anderen Katalogen zu speziellen Medizinthemen.

Literaturrecherche

Bis Mitte 1997 war eine Recherche in Medline stets entweder an umständliche CD-ROM-Recherchen gebunden, die zudem - recherchierte man nicht gerade in einer Bibliothek - nicht gerade billig waren, oder man recherchierte online, was ebenfalls nicht gerade billig war (beide Techniken wurden in den vorangegangenen Kapitelteilen ausführlich beschrieben)

Am 26. Juni hat US Vize-Präsident Al Gore bei einer Pressekonferenz im US Senat den ab sofort kostenlosen Zugriff auf die vollständige Medline Datenbank der NLM bekanntgegeben. Diese Entwicklung kam nicht ganz unerwartet, da diese in der Herstellung sehr aufwendige und teure Datenbank fast ausschließlich vom US-Steuerzahler finanziert wird, und somit (nach Auffassung der US-Regierung) der Allgemeinheit auch zur freien Verfügung stehen sollte (eine Auffassung übrigens, die sich leider noch nicht bis zum DIMDI herumgesprochen hat - ein Bundesinstitut im Einflußbereich des Bundesgesundheitsministeriums, welches ebenfalls von Steuergeldern finanziert wird, verlangt weiterhin kräftige Gebühren für Online-Recherchen). Die bisherigen mit Absicht niedrig gehaltenen Lizenzgebühren der NLM hatten zwar zur enormen weltweiten Verbreitung der Datenbank geführt, zur Kostendeckung jedoch immer nur unwesentlich beigetragen. Insofern war der Schritt, Medline ganz freizugeben, nur konsequent.

PubMed

Gleichzeitig mit der Freigabe von Medline wurde ein neuer, über WWW zugänglicher Online-Dienst namens "PubMed" vorgestellt (Abb. 3), der vom National Center for Biotechnology Information (NCBI) bei der National Library of Medicine (NLM) entwickelt wurde. Über PubMed steht der Öffentlichkeit nicht nur eine einfache Abfrageschnittstelle zu Medline zur Verfügung, sondern sie bietet auch direkte Verknüpfungen von den Medline-Abstracts zu den Volltextartikeln der entsprechenden Journals. Dies wird durch Kollaboration der großen Wissenschaftsverlage mit der NLM möglich. Obwohl manche Publisher auch sämtliche Volltexte kostenlos im WWW anbieten, so daß die Artikel direkt kostenlos heruntergeladen und ausgedruckt werden können, ist dies allerdings doch eher die Ausnahme. Viele Publisher bieten nur einige "Appetithäppchen" als kostenlosen Volltext an, und fordern ein kostenpflichtiges Abonnement oder zumindest eine online-Registrierung. Dennoch bieten auch einige Journals einen Teil oder sogar alle Artikel als Volltext an - zum Beispiel das BMJ (ab Frühjahr 1998). Weitere Informationen zu Online-Journals siehe unten (Elektronische Journals).

Darüber hinaus gibt es von den Medline-Zitaten, die eine Gensequenz o.ä. zitieren, direkte Links von PubMed aus in die entsprechenden molekularbiologischen Datenbanken (Genbank etc., siehe unten).

PubMed beinhaltet auch mehr als die traditionellen Medline-Daten, da einige Publisher nun auch direkt nach Erscheinen der Zeitschrift Ihre Daten per FTP im sogenannten "SGML-tagged" Format an die NLM melden. Somit stehen seit 1997 Abstracts der wichtigsten Journals unmittelbar nach Erscheinen der Zeitschrift als Teildatenbestand von Medline (sogenannte "Premedline") zur Recherche zur Verfügung - und nicht erst ein halbes Jahr später, wie bisher.

Nützlich ist auch das "Clinical Queries Using Research Methodology Filters"-Interface (http://www.ncbi.nlm.nih.gov/PubMed/clinical.html). Dies ist eine Eingabemaske für Benutzer, die klinische Studien zu Therapie, Diagnose, Ätiologie oder Prognose eines medizinischen Problems suchen. Die Benutzerschnittstelle selektiert automatisch die passenden Suchbegriffe (MeSH-Headings, Freitextbegriffe) der entsprechenden Suchkategorie (Therapie, Diagnose usw.), die mit der frei einzugebenden Problemstellung kombiniert wird. Gibt man etwa AIDS als Problemstellung ein, und klickt die Kategorie "Therapie" an, so wird der Suchbegriff AIDS automatisch mit dem Suchstring:

"randomized controlled trial" [PTYP] | "drug therapy" [MESH] | "therapeutic use" [MESH] | "random*" [WORD]

kombiniert (mit einem Boole'schen UND verknüpft). (Eine komplette Liste der Suchbegriffe, die jeweils bei der entsprechenden Kategorie verwendet werden, findet sich bei http://www.ncbi.nlm.nih.gov/PubMed/clinicaltable.html). Diese Begriffe finden mit einer größtmöglichen Sensitivität alle Studien, die sich mit Therapien beschäftigen (es können dabei allerdings auch zahlreiche Artikel gefunden werden, die nicht relevant sind). Im Eingabe-Interface kann man allerdings auch den Schwerpunkt der Recherche auf "Spezifität" legen - in diesem Fall wird bei der Kategorie "Therapie" der Suchbegriff der Problemstellung mit dem folgenden Suchstring verknüpft:

(double [WORD] & blind* [WORD]) | placebo [WORD]

d.h. irgendwo im Titel oder Abstract müssen die Wörter "double blind" oder "placebo" vorkommen - diese Abfrage ist stringenter und findet dafür weniger, aber dafür mit größerer Wahrscheinlichkeit die "richtigen" Artikel. Eine Suche mit Schwerpunkt "Sensitivität" bietet sich also an, wenn man so wenig Artikel wie möglich übersehen will, während eine Suche mit "spezifischen" Suchbegriffen vorzugsweise verwendet werden sollte, wenn man bei einer "sensitiven" Suche zu viele irrelevante Dokumente erhält.

Grateful Med

Grateful Med (http://igm.nlm.nih.gov/) ist - neben PubMed - die derzeit zweite Abfrageschnittstelle, mit der die Datenbanken Medline, HealthSTAR, Premedline, Aidsline, Aidsdrugs, Aidstrials, Dirline, Histline, Hsrproj, Oldmedline und SDIline via Internet abgefragt werden können. Ob man lieber mit PubMed oder Grateful Med recherchiert, ist letztlich Geschmackssache - die reinen Suchmöglichkeiten mit Boole'schen Operatoren unterscheiden sich nicht, die Grateful Med-Schnittstelle ist vielleicht etwas einfacher zu handhaben (Abb. 5).

Eine Besonderheit von Grateful Med ist, daß mit dem sogenannten UMLS (Unified Medical Language System) ein sogenannter Metathesaurus zur Verfügung steht, der verschiedene Begriffe aus verschiedenen Thesauren/Vokabularien zusammenführt. Unter dem Menüpunkt "Analyze Search" kann Grateful Med somit verwandte oder synonyme Begriffe vorschlagen, die in die Suche miteinbezogen werden können oder sollten.

Eine weitere Besonderheit von Grateful Med ist die Anbindung externer Datenbanken wie

HSTAT (Health Services/Technology Assessment Text): Enthält die Volltexte klinischer Leitlinien und Konsumenteninformationen der U.S. Agency for Health Care Policy and Research (AHCPR).

Image Database der History of Medicine Division (IHM): Enthält etwa 60.000 Bilder zur Geschichte der Medizin.

Die Links werden in Form von Buttons in den Suchergebnissen eingeblendet, wenn zu dem entsprechenden gesuchten Begriff (etwa eine Diagnose) Einträge in den externen Datenbanken vorhanden sind.

Weitere Links - etwa zu toxikologischen Datenbanken wie Hazardous Substances Databank (HSDB) und Toxic Release Inventory (TRI) sowie anderen WWW-Resourcen (darunter möglicherweise in zukunft auch die Erlanger Dermatologie Bilddatenbank) sind geplant.

Elektronische Journals online

Abgesehen davon, daß es auch in wachsendem Umfang rein elektronische Journals gibt, bringen immer mehr Publisher zusätzlich zur Printversion traditioneller Journals diese auch auf das Internet.

 

Ein großer Teil der Umsetzung der elektronischen Journals wird und wurde von der "HighWire Press" an der Stanford University in Kalifornien (http://highwire.stanford.edu/) realisiert. Die erste wissenschaftliche Zeitschrift, das Journal of Biological Chemistry, wurde im Februar 1995 von HighWire Press ins Netz gebracht. Viele weitere werden 1998 folgen, darunter das British Medical Journal.

Eine Liste von Journals, die peer-reviewed sind und bei denen Links von PubMed zum entsprechenden Volltext-Artikel besteht, zeigt Tab. 3. Für die jeweiligen Internet-Adressen siehe http://www.ncbi.nlm.nih.gov/PubMed/fulltext.html. Eine komplette Liste von elektronischen Journals findet sich zum Beispiel unter http://www.hol.gr/medical/nuclear/journals.htm.

 

Tab. 3. Liste von elektronischen Journals auf dem WWW, bei denen bei einer PubMed-Recherche in Medline direkt zum Volltext gelinkt werden kann.

 

Analytical Biochemistry Animal Behaviour
Appetite Archives of Biochemistry and Biophysics
Biochemical and Biophysical Research Communications Biochemical and Molecular Medicine
Biochemical Journal Biochemistry (ACS)
Biologicals Blood, Cells, Molecules & Diseases
Brain and Cognition Brain and Language
Brain, Behavior, and Immunity Cell
Cell Biology International Cellular Immunology
Chemistry and Biology Clinical Immunology and Immunopathology
Cognitive Psychology Computers and Biomedical Research
Consciousness and Cognition Contemporary Educational Psychology
Cryobiology Current Biology
Current Biology journals Current Opinion in Biotechnology
Current Opinion in Cell Biology Current Opinion in Genetics & Development
Current Opinion in Immunology Current Opinion in Neurobiology
Current Opinion in Structural Biology Cytokine
Developmental Biology Ecotoxicology and Environmental Safety
Environmental Research Experimental and Molecular Pathology
Experimental Cell Research Experimental Eye Research
Experimental Neurology Experimental Parasitology
Frontiers in Bioscience Frontiers in Neuroendocrinology
Fundamental and Applied Toxicology Fungal Genetics and Biology
General and Comparative Endocrinology Genomics
Gynecologic Oncology Hormones and Behavior
Immunity Journal of Adolescence
Journal of Applied Physiology Journal of Autoimmunity
Journal Of Biological Chemistry Journal of Cell Biology
Journal of Clinical Investigation Journal of Colloid and Interface Science
Journal of Experimental Child Psychology Journal of Experimental Medicine
Journal of General Physiology Journal of Invertebrate Pathology
Journal of Magnetic Resonance Journal of Molecular and Cellular Cardiology
Journal of Molecular Biology Journal of Neuroscience
Journal of Nutrition Journal of Structural Biology
Journal of Surgical Research Journal of Theoretical Biology
Methods: A Companion to Methods in Enzymology Microbial Pathogenesis
Microvascular Research Molecular and Cellular Neurosciences
Molecular and Cellular Probes Molecular Phylogenetics and Evolution
Molecular Vision Neurobiology of Learning and Memory
NeuroImage Neuron
New England Journal of Medicine Nitric Oxide
Nucleic Acids Research Pediatrics
Pharmacological Research Plasmid
Preventive Medicine Proceedings of the National Academy of Sciences (USA)
Protein Expression and Purification Regulatory Toxicology and Pharmacology
Science Seminars in Cancer Biology
Seminars in Cell and Developmental Biology Seminars in Immunology
Structure Theoretical Population Biology
Toxicology and Applied Pharmacology Virology

 

Literaturbestellung, OPACs (Bibliothekskataloge), Verlage

OPACs

OPACs sind online zugängliche Bibliothekskataloge. Sehr häufig sind diese - wie bereits oben angesprochen - nur über telnet zu erreichen, etwa der Verbundkatalog der DLR (telnet://dvs1.bs.dlr.de), Verbundkatalog der wissenschaftlichen Bibliotheken Österreichs (telnet://opac.univie.ac.at).

Zahlreiche Bibliotheken bieten aber auch schon WWW-Benutzerschnittstellen an, bei denen recherchiert und bestellt werden kann, zum Beispiel

Letztere, die Deutsche Zentralbibliothek für Medizin, liefert Kopien von Aufsätzen aus ihrer umfangreichen Zeitschriftensammlung (16.000 biomedizinische Titel, davon 8.000

laufende Abonnements). Zur Bestellung einer Aufsatzkopie können die Bestelldaten direkt in eine Eingabemaske eingegeben werden (http://www.ub.uni-koeln.de/zbmed-bin/zbm-bestellung). Die Gebühren für eine Aufsatzkopie (bis zu 20 Belichtungen) betragen 8,- DM (für öffentliche Einrichtungen) oder 12,- DM (für Privatpersonen).

Eine Zusammenstellung weiterer OPACs und Bibliotheken im Internet findet sich auf der Website des HBZ (Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen) unter http://www.hbz-nrw.de/hbz/germlst.html

Verlage

Große Verlage sind ebenfalls zunehmend eine Quelle, um nach Büchern oder Zeitschriftenartikeln zu recherchieren beziehungsweise um an die Volltexte von Zeitschriftenartikeln heranzukommen.

Springer bietet mit dem neuen Link Information Service (http://link.springer.de/) online-Zugriff auf Artikel (Abstracts, bei Bezahlung auch auf die Volltexte) von über 100 Springer-Zeitschriften. Bis 1999 sollen alle 400 Springer-Titel online sein. Alle Artikel sind Volltext-Indexiert und werden als PDF, Postscript, HTML oder LaTex-Datei zum Download bereitgehalten.

Auch der größte Wissenschaftverlag der Welt, Elsevier Science, mit über 1.100 Zeitschriftentiteln, bietet seit 1997 ein ähnliches System unter dem Namen ScienceDirect an (http://www.sciencedirect.com).

Geschlossene Online-Dienste

Geschlossene Online-Dienste für Mediziner (HOS Multimedica, DGN, Biomednet, siehe Kap. 08.06) bieten ebenfalls ein reichhaltiges Angebot zur Online-Recherche, einschließlich der Möglichkeit zur Literaturbestellung. Für Einzelheiten siehe die entsprechenden Kapitelteile.

 

Bücherdienste

Empfehlenswert für Buchrecherchen sind auch die Datenbanken der kommerziellen Bücherdienste, etwa amazon (www.amazon.com) - nach eigenen Angaben der größte Buchhandel der Welt -oder der ABC-Bücherdienst (www.telebuch.de).

 

Literatur:

Schneppe U. (1997). Seminar "Verteilte Hypertextsysteme" - Thema: Suchmaschinen im Internet. Seminarvortrag am 21. Juni 1997 <http://wwwpi6.fernuni-hagen.de/Lehre/Seminare/Hypertext97/kein_rahmen/schneppe/INHALT.HTM>

Koch T. (1996). Suchmaschinen im Internet. Erste INETBIB-Tagung in der UB Dortmund, 11.3. 1996 <http://www.ub2.lu.se/tk/demos/DO9603-manus.html>

Bank M. (1997) Internet. Seine Bedeutung für Bibliothek und Dokumentation.<http://hub.ib.hu-berlin.de/~wumsta/umbank.html>