Zum Inhalt springen

Frage zu einem Datawarehouse


DennisXX

Empfohlene Beiträge

Hi Folks !

Ich habe mal eine Frage zu dem Thema Datawarehouse. Ich weis das z.B. Oracle, MS SQL Server und Cognos ein Datawarehouse bzw. solche speziellen Produkte kommerziell anbieten. Gibt es eigentlich auf solche Produkte die kostenfrei sind?

Kann mir ein Datawarehouse so vorstellen, dass ein solches im Prinzip nichts anderes ist, als eine relationale Datenbank, in die nach bestimmten Kriterien verschiedene Daten aus unterschiedlichen Datenquellen geladen werden und von dort aus weiterverarbeitet werden können?

Greetz

Dennis

Link zu diesem Kommentar
Auf anderen Seiten teilen

Richtig. Wobei es auch Datawarehouses gibt, die nicht auf relationalen Datenbanken beruhen. Es gibt je nach Hersteller Erweiterungen, die speziell auf die Eigenschaften eines Datawarehouses abgestimmt sind um Anfragen performater zu gestalten. Grundsätzlich zeichnet sich ein Datawarehouse aber vor allem durch eine stark denormalisierte Datenstruktur mit vielen Redundanzen aus. Des weiteren durch die von dir schon beschriebene einmalige bzw. zyklische Ladung von Daten.

Dim

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hi Folks !

Wobei es auch Datawarehouses gibt, die nicht auf relationalen Datenbanken beruhen.

Interessant. Kannst du vielleicht grob umreissen, wie genau solche System alternativ aufgebaut sind?

Grundsätzlich zeichnet sich ein Datawarehouse aber vor allem durch eine stark denormalisierte Datenstruktur mit vielen Redundanzen aus.

Das verstehe ich ehrlich gesagt nicht ganz.

Greetz

Dennis

Link zu diesem Kommentar
Auf anderen Seiten teilen

Kannst du vielleicht grob umreissen, wie genau solche System alternativ aufgebaut sind?

Also entweder grob oder genau :D Es handelt sich hierbei meistens um IMS Datenbanken (also hierarchische Datenbanken) auf dem Mainframe. Des weiteren kann man auch objektorientierte Datenbanken oder noSQL Datenbanken verwendet. Inwiefern die beiden letzteren in der Praxis verwendet werden kann ich nicht sagen. Nur setzt ein Datawarehouse eben nicht zwingend eine relationale Datenbank voraus.

Das verstehe ich ehrlich gesagt nicht ganz.

In einem "normalen" Datenbankmodell wird im allgemeinen zuerst auf die 3. NF hin entwickelt, und dann in bestimten Punkten gezielt denormalisiert, da dass Modell ansonsten meist zu komplex und inperformant ist.

In einem Datawarehouse werden Daten bewusst in verschiedenen Tabellen doppelt gehalten um die Abfragen, die im allgemeinen riesige Datenmengen verarbeiten, zu beschleunigen. Wo man in einem OLTP System etwa drei Tabellen joinen würde, ist in einem OLAP z.B. alles in einer Tabelle zusammengefasst. Das Stichwort hierzu lautet Star Schema. Dort findest Du noch detailiertere Informationen dazu.

Dim

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hi Folks !

Danke Dim für deinen Beitrag !

IMS Datenbanken (also hierarchische Datenbanken) oder noSQL Datenbanken

Ich muss hier nochmal nachfragen. Was genau sind IMS Datenbanken und vor allem, was genau kann ich mir unter einer noSQL Datenbank vorstellen?

In einem "normalen" Datenbankmodell wird im allgemeinen zuerst auf die 3. NF hin entwickelt, und dann in bestimten Punkten gezielt denormalisiert, da dass Modell ansonsten meist zu komplex und inperformant ist.

In einem Datawarehouse werden Daten bewusst in verschiedenen Tabellen doppelt gehalten um die Abfragen, die im allgemeinen riesige Datenmengen verarbeiten, zu beschleunigen. Wo man in einem OLTP System etwa drei Tabellen joinen würde, ist in einem OLAP z.B. alles in einer Tabelle zusammengefasst. Das Stichwort hierzu lautet Star Schema. Dort findest Du noch detailiertere Informationen dazu.

Ich vermute mal, du spielst hier auf Faktentabellen und Dimensionstabellen an, was die doppelte Datenhaltung / Datenredundanz angeht, richtig?

OLTP System

Auch hier nochmal die Frage an dich. was genau ist ein OLTP System? Sorry, aber das habe ich noch nie gehört.

Danke für deine Hilfe !

Greetz

Dennis

Link zu diesem Kommentar
Auf anderen Seiten teilen

Ich vermute mal, du spielst hier auf Faktentabellen und Dimensionstabellen an, was die doppelte Datenhaltung / Datenredundanz angeht, richtig?

Korrekt.

Zu den anderen Stichpunkten: Bevor ich mich hier darüber auslasse, verweise ich dich der Einfachheit an google, dort findest Du zu jede Menge gutes und detailiertes Material. :-)

Dim

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...