Verteiltes Datenbanksystem [Diplomarbeit Risikomanagement und Business Intelligence]
Kopfzeilenbild  
Diplomarbeit Risikomanagement  
  :: Inmaco HOME :: 
 
 
Inhaltsverzeichnis
Kapitel 1
Kapitel 2 & 2.1
Kapitel 2.2
Kapitel 2.3
Kapitel 3 & 3.1
Kapitel 3.1.2
Kapitel 3.1.3
Kapitel 3.2 & 3.3
Kapitel 3.4
Kapitel 4 & 4.1
Kapitel 4.2
Kapitel 4.2.3
Kapitel 4.3
Kapitel 4.4
Kapitel 4.4.3
Kapitel 5
Kapitel 6
 
 
Kapitel 3.1.3 Verteiltee Datenbanksysteme  

 

(Auszug aus der Diplomarbeit von Ralph Leipert: "Analytische Informationssysteme als Basis des Risikomanagement der Unternehmung")

3.1.3 Verteilte Datenbanksysteme

In den vorangegangenen Abschnitten wurde näher auf transaktionsorientierte DBS eingegangen und spezifische Eigenschaften hervorgehoben. Die Anforderungen müssen jedoch in ei­nem großen Unternehmen nicht nur diesen einzelnen DBS entsprechen, sondern einem ganzen System, da in einem Unternehmen eine große Anzahl zumeist heterogener DBS existieren. Durch die Migration von historisch gewachsenen Datenbanken entstanden in den Unterneh­men dezentrale DBS bzw. „Verteilte Datenbanksysteme i.w.S. (VDBS)“. Da die DBS meist unter unterschiedlichen Bedingungen bzw. Einsatzzwecken entstanden, existiert eine große Heterogenität in den Informationssystemen. Zur Überwindung dieser Heterogenität bzw. bei der Schaffung einer homogenen Datenbanklandschaft durch Integration, bilden die Unterneh­men aus den verschiedenartigen DBS heterogene VDBS. VDBS, die nicht durch Integration vieler schon vorhandener DBS entstehen, sind meist homogener Natur. Diese DBS nennt man auch „Verteilte Datenbanksystem i.e.S.“. Eine genauere Klassifikation von VDBS ist in fol­gender Abbildung zu sehen und soll hier nicht weiter ausgeführt werden. Für diese VDBS hat Dates33 12 Anforderungen definiert.

Abbildung 3-4 Taxonomy of distributed data systems34

12 Anforderungen an VDBS von Dates

  1. Lokale Autonomie
    Lokale Autonomie bedeutet, daß jeder einzelne Rechner unabhängig von anderen Rechnern funktioniert. Hierbei sollen die Daten lokal verwaltet und bearbeitet wer­den. Die lokale Autonomie kann jedoch nicht 100%-ig erreicht werden. Ein Beispiel dafür ist die verteilte Serialisierbarkeit (Concurrency Control). Das Ziel bei VDBS ist jedoch, einen möglichst hohen Grad an lo­kaler Autonomie zu erreichen.

  2. Unabhängigkeit von einem zentralen Rechner
    Das VDBS sollte unabhängig von einem zentralen Rechner sein, da durch einen System­absturz des zentralen Rechners das ganze System ausfallen würde. Dadurch wäre die ständige Verfügbarkeit der Daten nicht gewährleistet. Durch einen zentralen Rechner könnte aber auch ein Engpaß entstehen, wenn viele Zugriffe zur gleichen Zeit erfolgen.

  3. Dauerbetrieb
    Ein VDBS sollte im Zustand eines Dauerbetriebes sein. Das heißt, daß jederzeit ein be­teiligter Rechner angeschaltet werden kann und dieser sofort funktionsfähig in diesem DBS ist.

  4. Ortstransparenz
    Bei VDBS braucht der Anwender nicht zu wissen, wo die Daten gespeichert sind. Der Anwender sollte keinen Unterschied zwischen einer lokalen und einer verteilten DB se­hen. Der Anwender bekommt das Ergebnis seiner Anfragen komplett zur gleichen Zeit präsentiert, damit für ihn die Verteilung der Daten nicht ersichtlich ist.

  5. Fragmentierungstransparenz
    Die Fragmentierungstransparenz ist ähnlich wie die Ortstransparenz. Da die Daten meist dort gespeichert werden, wo auf die Daten am häufigsten zugriffen wird, man jedoch nicht immer auf die ganzen Datensätze zugreifen muß, werden die Daten frag­mentiert. Das heißt, daß die Daten entweder horizontal oder/und vertikal in Frag­mente geteilt wer­den. Dies stellt keine Probleme dar, da den Verteilten Datenbankmodellen das relationale Datenbankmodell unterstellt wird. Hierbei sollte der Anwender nicht er­fahren, daß und wie die Daten fragmentiert sind. Ortstransparenz und Fragmentie­rungstransparenz treten meist kombiniert auf, da die fragmentierten Daten auf unter­schiedlichen Rechnern ge­speichert sein können.

  6. Replikationstransparenz
    Um bestimmte Daten schnell zur Verfügung zu bekommen, können Kopien von Daten von entfernten Rechnern auf dem eigenen lokalen Rechner erstellt werden. Dies hat den Vorteil, das der zeitaufwendige Transport und die damit verbundenen hohen Datentrans­port­kosten gespart werden. Ein weiterer Vorteil liegt in der schnellen Verfügbarkeit der Daten auf dem loka­len Rechner. Der Nachteil liegt auch sofort nahe; bei Ände­rung der Orginaldaten müssen auch alle Kopien geändert werden. Der Anwender soll jedoch nicht sehen, daß die Daten von einer Kopie stammen.

  7. Verteilte Zugriffsprozesse (Query Processing)
    Bei verteilten Zugriffsprozessen gibt es zwei Punkte zu beachten.
    1. Wenn man z.B. in einem Büro in Augsburg bestimmte Datensätze abrufen möchte und diese in einer entfernten Stadt, wie z.B. Paris gespeichert sind, sendet man beim relati­o­nalen Datenbankmodell zwei Nachrichten. Einmal wird die Nachricht gesendet, daß die Datensätze benötigt werden, und zweitens werden die benötigten Datensätze gesendet. Bei nicht relationalen Datenbanken müssen 2n Nachrichten gesendet werden. Hierbei wird erst nach dem Datensatz gefragt, wird die Bedingung erfüllt wird der Datensatz ge­sendet, sowie gleich nach einem nächsten Datensatz nachgefragt, solange bis alle Daten­sätze gesendet wurden.
    2. Das zweite Problem kommt hauptsächlich in VDBS i.e.S. vor. Muß eine Operation durchgeführt werden, bei der die jeweiligen Daten auf verschiedenen Rechnern gespei­chert sind, stellt sich die Frage auf welchem Rechner die Operation durchgeführt werden soll. Erstens können die Daten von Rechner Y auf Rechner X oder umgekehrt gebracht werden. Es kann aber auch günstiger sein die Daten von Rechner X und von Rechner Y auf den Rechner Z zu bringen um die Operationen dort ausführen.

  8. Verteiltes Transaktionsmanagment
    Das verteilte Transaktionsmanagment beinhaltet zwei wichtige Kontrollmechanis­men, „recovery control“ und „concurrency control“. Da in VDBS auch die Transaktionen verteilt sind, müssen die Kontrollmechanismen für einen gleichzeitigen Zugriff auf einen Datensatz, sowie für das Erkennen und Behandeln von inkonsistenten Zuständen umfang­reicher sein als bei nichtverteilten DBS.

  9. Hardwareunabhängigkeit
    VDBS sollten unabhängig von der vorhandenen Hardware (z.B. APPLE-Rechner, IBM-Rechner und Großrechner) einsetzbar sein. Je mehr unterschiedliche Hardware ein DBS unterstützt bzw. integrieren kann, desto hardwareunabhängiger ist dieses System.

  10. Betriebssystemsunabhängigkeit
    Wie bei den Hardwareproblemen gibt es auch die Probleme mit dem Betriebssystem. Da man z.B. Rechner mit UNIX, MVS und PC/DOS Betriebssystemen hat, ist es schwierig, diese miteinander zu verknüpfen und Software laufen zu lassen. Deshalb sollte das DBS verschiedene Betriebssysteme unterstützen, um so un­abhängig zu sein.

  11. Netzwerkunabhängigkeit
    Das DBS sollte möglichst auf vielen Netzwerksystemen laufen, da es wie bei den zwei vorangegangenen Punkten verschiedene Netzwerksysteme für verschiedene Hardware und Betriebssysteme gibt.

  12. DBMS-Unabhängigkeit
    Das DBS sollte bis zu einem bestimmten Grad Heterogenität unterstützen, d.h. daß in einem VDBS verschiedene DBMS laufen können.

3.1.4 Zusammenfassung

Transaktionsorientierte DBS eignen sich zur Speicherung und Verwaltung von großen Datenmengen. Aus dieser Funktion heraus entstanden auch die Anforderungen an VDBS. VDBS sind eine wichtige Anforderung an Managementunterstützungssysteme (MSS), da hierbei auf eine Vielzahl an Informationen in oft unterschiedlichen DBS zugegriffen werden muß. In die­sen Anforderungen liegen jedoch auch die Problembereiche der Systeme. In der Vergangen­heit hat man sich viel mit diesen Problembereichen auseinandergesetzt und MSS auf der Basis von OLTP entwickelt. Im folgenden Kapitel wird kurz auf die MSS eingegangen, um einen Überblick über die Stärken und Schwächen schon realisierter Systeme zu bekommen.


33 Vgl.: Date, C. J., (1995), S. 596ff

34 Vgl.: Bell/Grimson, (1994), S. 45



 
    ©2000-2007 InMaCo, Powered by Ralph Leipert All rights reserved.