Informationsbeschaffung im Internet

Daten, Wissen und Information im Internet

Im Internet steht eine riesige Menge von Daten zu den unterschiedlichsten Themen zum Abruf bereit. Alle im Internet verfügbaren Daten zusammengenommen ergeben das im Internet gespeicherte Wissen. Und das spezifische Wissen, das man in einer bestimmten Situation benötigt um beispielsweise ein Problem zu lösen, wird Information genannt. Bevor wir uns aber mit der Informationssuche beschäftigen können, fassen wir kurz zusammen, wie man via Internet auf Daten zugreifen kann.

Beginnen wir mit einem kurzen Überblick über die wichtigsten Internet-Eigenschaften. Das Internet ist ein Zusammenschluss von Teilnetzen auf der ganzen Welt. Darum wird es auch das Netz der Netze genannt. Am Internet beteiligen sich Millionen von Servern, und jeder Server bietet einen oder mehrere Dienste wie WWW, E-Mail oder News an. Die Server sind grundsätzlich autonom, können also fast nach Belieben schalten und walten und ihre Angebote selbst bestimmen. Das Internet unterliegt an sich keiner zentralen Verwaltung. Allerdings sollten sich alle am Internet teilnehmenden Rechner an gewisse Standards halten, die von zentralen Stellen wie zum Beispiel dem World Wide Web Consortium empfohlen werden.



Die unzähligen Netzverbindungen sorgen dafür, dass die Rechner im Internet sich miteinander unterhalten können. Zwischen zwei Rechnern im Netz sind üblicherweise verschiedene Wege möglich. Das Internet sucht sich automatisch eine mögliche Verbindung.

Für einen Benutzer, der auf das Internet zugreifen möchte, sind vor allem vier Punkte wichtig: (1) Bei langen Leitungen dauert die Übertragung von Daten länger als bei kurzen. (2) Dicke Leitungen können mehr Daten pro Zeiteinheit transportieren als dünne. (3) Leistungsfähigere Server antworten rascher als weniger leistungsfähige. (4) Je grösser die Menge der angeforderten Daten ist, desto länger dauert die Übertragung. Alle vier Punkte beeinflussen die Wartezeit beim Zugriff auf Daten im Internet.

Wie kann nun ein Benutzer konkret auf Daten im Internet zugreifen? Voraussetzung ist natürlich ein passend ausgerüsteter Computer, zum Beispiel ein Laptop. Auf dem Laptop ist ein Web-Browser aufgestartet. Der Web-Browser ist ein Werkzeug zur Ansicht von Daten im Internet und speziell im World Wide Web. Der Browser hat in erster Linie die Aufgabe, Webseiten auf dem Bildschirm darzustellen. Eine Webseite kann beispielsweise lokal in der Datei c:\dateien\home.html gespeichert sein.



Interessanter wird es aber, wenn Webseiten von einem anderen Rechner, einem so genannten Web-Server, stammen. Auf der Anbieterseite steht ein Web-Server, der bestimmte Angebote zur Verfügung stellt. Ein solches Angebot könnte ein fiktiver Bücherkatalog namens AllBooks sein. Der Web-Server hat eine eindeutige Adresse wie zum Beispiel www.allbooks.com. Alle vom Web-Server angebotenen Webseiten liegen in einem Verzeichnisbaum bereit und sind über einen Uniform Resource Locator (URL) eindeutig ansprechbar. Der URL http://www.allbooks.com/overview/list.html identifiziert bei unserem Server die Bücherliste list.html im Übersichtsverzeichnis namens overview. Der Verzeichnisbaum mit den Webseiten ist frei wählbar, muss aber dem Web-Server bekannt gemacht werden. Alle zusammengehörenden Webseiten auf einem Web-Server bezeichnen wir als eine Web-Site. Zum Beispiel besteht die Web-Site von AllBooks aus allen Seiten, die auf dem Server www.allbooks.com liegen.

Die Aufgabe des Internets besteht darin, die Kommunikation zwischen Anbieter- und Benutzerseite zu gewährleisten. Der Benutzer schickt den URL der gewünschten Webseite mit Hilfe des Browsers und via Internet zum entsprechenden Web-Server. Anschliessend transportieren die Rechner im Internet die Antwort vom Server zurück zum Benutzerrechner. Die Verbindung zwischen Benutzer-PC und Internet läuft über eine analoge Telefonverbindung, eine ISDN-Leitung, das Kabelnetz, Mobilfunk oder eine andere Kommunikationstechnologie - es gibt zahlreiche Varianten. Bei einem Firmen-Intranet ist zwischen Benutzer-PC und Internet häufig ein Firewall-Rechner zwischengeschaltet, der unerlaubte Zugriffe von aussen verhindert.

Normalerweise sind Webseiten so genannte statische Seiten, die permanent unter einem eigenen URL ansprechbar sind. Daneben gibt es auch dynamische Seiten, die zum Zeitpunkt des Zugriffs erstellt werden und nur gerade für diesen einen Zugriff existieren. Ein möglicher Weg zum Abrufen beziehungsweise Erstellen von dynamischen Seiten besteht in so genannten CGI-Programmen, die sich häufig schon aufgrund des URL zu erkennen geben: beispielsweise http://www.clock.nz/cgi-bin/germantime.pl. Hier liefert ein Programm namens germantime.pl im CGI-Verzeichnis des Servers www.clock.nz die aktuelle Zeit in Deutschland. Neben den CGI-Programmen gibt es auch andere Methoden zur Erstellung von dynamischen Webseiten.