DennisXX Geschrieben 25. August 2011 Geschrieben 25. August 2011 Hi Folks ! Ich habe mal eine Frage zu dem Thema Datawarehouse. Ich weis das z.B. Oracle, MS SQL Server und Cognos ein Datawarehouse bzw. solche speziellen Produkte kommerziell anbieten. Gibt es eigentlich auf solche Produkte die kostenfrei sind? Kann mir ein Datawarehouse so vorstellen, dass ein solches im Prinzip nichts anderes ist, als eine relationale Datenbank, in die nach bestimmten Kriterien verschiedene Daten aus unterschiedlichen Datenquellen geladen werden und von dort aus weiterverarbeitet werden können? Greetz Dennis
dr.dimitri Geschrieben 25. August 2011 Geschrieben 25. August 2011 Richtig. Wobei es auch Datawarehouses gibt, die nicht auf relationalen Datenbanken beruhen. Es gibt je nach Hersteller Erweiterungen, die speziell auf die Eigenschaften eines Datawarehouses abgestimmt sind um Anfragen performater zu gestalten. Grundsätzlich zeichnet sich ein Datawarehouse aber vor allem durch eine stark denormalisierte Datenstruktur mit vielen Redundanzen aus. Des weiteren durch die von dir schon beschriebene einmalige bzw. zyklische Ladung von Daten. Dim
DennisXX Geschrieben 26. August 2011 Autor Geschrieben 26. August 2011 Hi Folks ! Wobei es auch Datawarehouses gibt, die nicht auf relationalen Datenbanken beruhen. Interessant. Kannst du vielleicht grob umreissen, wie genau solche System alternativ aufgebaut sind? Grundsätzlich zeichnet sich ein Datawarehouse aber vor allem durch eine stark denormalisierte Datenstruktur mit vielen Redundanzen aus. Das verstehe ich ehrlich gesagt nicht ganz. Greetz Dennis
dr.dimitri Geschrieben 26. August 2011 Geschrieben 26. August 2011 Kannst du vielleicht grob umreissen, wie genau solche System alternativ aufgebaut sind? Also entweder grob oder genau Es handelt sich hierbei meistens um IMS Datenbanken (also hierarchische Datenbanken) auf dem Mainframe. Des weiteren kann man auch objektorientierte Datenbanken oder noSQL Datenbanken verwendet. Inwiefern die beiden letzteren in der Praxis verwendet werden kann ich nicht sagen. Nur setzt ein Datawarehouse eben nicht zwingend eine relationale Datenbank voraus. Das verstehe ich ehrlich gesagt nicht ganz. In einem "normalen" Datenbankmodell wird im allgemeinen zuerst auf die 3. NF hin entwickelt, und dann in bestimten Punkten gezielt denormalisiert, da dass Modell ansonsten meist zu komplex und inperformant ist. In einem Datawarehouse werden Daten bewusst in verschiedenen Tabellen doppelt gehalten um die Abfragen, die im allgemeinen riesige Datenmengen verarbeiten, zu beschleunigen. Wo man in einem OLTP System etwa drei Tabellen joinen würde, ist in einem OLAP z.B. alles in einer Tabelle zusammengefasst. Das Stichwort hierzu lautet Star Schema. Dort findest Du noch detailiertere Informationen dazu. Dim
DennisXX Geschrieben 26. August 2011 Autor Geschrieben 26. August 2011 Hi Folks ! Danke Dim für deinen Beitrag ! IMS Datenbanken (also hierarchische Datenbanken) oder noSQL Datenbanken Ich muss hier nochmal nachfragen. Was genau sind IMS Datenbanken und vor allem, was genau kann ich mir unter einer noSQL Datenbank vorstellen? In einem "normalen" Datenbankmodell wird im allgemeinen zuerst auf die 3. NF hin entwickelt, und dann in bestimten Punkten gezielt denormalisiert, da dass Modell ansonsten meist zu komplex und inperformant ist. In einem Datawarehouse werden Daten bewusst in verschiedenen Tabellen doppelt gehalten um die Abfragen, die im allgemeinen riesige Datenmengen verarbeiten, zu beschleunigen. Wo man in einem OLTP System etwa drei Tabellen joinen würde, ist in einem OLAP z.B. alles in einer Tabelle zusammengefasst. Das Stichwort hierzu lautet Star Schema. Dort findest Du noch detailiertere Informationen dazu. Ich vermute mal, du spielst hier auf Faktentabellen und Dimensionstabellen an, was die doppelte Datenhaltung / Datenredundanz angeht, richtig? OLTP System Auch hier nochmal die Frage an dich. was genau ist ein OLTP System? Sorry, aber das habe ich noch nie gehört. Danke für deine Hilfe ! Greetz Dennis
dr.dimitri Geschrieben 26. August 2011 Geschrieben 26. August 2011 Ich vermute mal, du spielst hier auf Faktentabellen und Dimensionstabellen an, was die doppelte Datenhaltung / Datenredundanz angeht, richtig? Korrekt. Zu den anderen Stichpunkten: Bevor ich mich hier darüber auslasse, verweise ich dich der Einfachheit an google, dort findest Du zu jede Menge gutes und detailiertes Material. :-) Dim
Empfohlene Beiträge
Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren
Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können
Benutzerkonto erstellen
Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!
Neues Benutzerkonto erstellenAnmelden
Du hast bereits ein Benutzerkonto? Melde Dich hier an.
Jetzt anmelden