DennisXX Geschrieben 25. August 2011 Teilen Geschrieben 25. August 2011 Hi Folks ! Ich habe mal eine Frage zu dem Thema Datawarehouse. Ich weis das z.B. Oracle, MS SQL Server und Cognos ein Datawarehouse bzw. solche speziellen Produkte kommerziell anbieten. Gibt es eigentlich auf solche Produkte die kostenfrei sind? Kann mir ein Datawarehouse so vorstellen, dass ein solches im Prinzip nichts anderes ist, als eine relationale Datenbank, in die nach bestimmten Kriterien verschiedene Daten aus unterschiedlichen Datenquellen geladen werden und von dort aus weiterverarbeitet werden können? Greetz Dennis Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
dr.dimitri Geschrieben 25. August 2011 Teilen Geschrieben 25. August 2011 Richtig. Wobei es auch Datawarehouses gibt, die nicht auf relationalen Datenbanken beruhen. Es gibt je nach Hersteller Erweiterungen, die speziell auf die Eigenschaften eines Datawarehouses abgestimmt sind um Anfragen performater zu gestalten. Grundsätzlich zeichnet sich ein Datawarehouse aber vor allem durch eine stark denormalisierte Datenstruktur mit vielen Redundanzen aus. Des weiteren durch die von dir schon beschriebene einmalige bzw. zyklische Ladung von Daten. Dim Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
DennisXX Geschrieben 26. August 2011 Autor Teilen Geschrieben 26. August 2011 Hi Folks ! Wobei es auch Datawarehouses gibt, die nicht auf relationalen Datenbanken beruhen. Interessant. Kannst du vielleicht grob umreissen, wie genau solche System alternativ aufgebaut sind? Grundsätzlich zeichnet sich ein Datawarehouse aber vor allem durch eine stark denormalisierte Datenstruktur mit vielen Redundanzen aus. Das verstehe ich ehrlich gesagt nicht ganz. Greetz Dennis Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
dr.dimitri Geschrieben 26. August 2011 Teilen Geschrieben 26. August 2011 Kannst du vielleicht grob umreissen, wie genau solche System alternativ aufgebaut sind? Also entweder grob oder genau Es handelt sich hierbei meistens um IMS Datenbanken (also hierarchische Datenbanken) auf dem Mainframe. Des weiteren kann man auch objektorientierte Datenbanken oder noSQL Datenbanken verwendet. Inwiefern die beiden letzteren in der Praxis verwendet werden kann ich nicht sagen. Nur setzt ein Datawarehouse eben nicht zwingend eine relationale Datenbank voraus. Das verstehe ich ehrlich gesagt nicht ganz. In einem "normalen" Datenbankmodell wird im allgemeinen zuerst auf die 3. NF hin entwickelt, und dann in bestimten Punkten gezielt denormalisiert, da dass Modell ansonsten meist zu komplex und inperformant ist. In einem Datawarehouse werden Daten bewusst in verschiedenen Tabellen doppelt gehalten um die Abfragen, die im allgemeinen riesige Datenmengen verarbeiten, zu beschleunigen. Wo man in einem OLTP System etwa drei Tabellen joinen würde, ist in einem OLAP z.B. alles in einer Tabelle zusammengefasst. Das Stichwort hierzu lautet Star Schema. Dort findest Du noch detailiertere Informationen dazu. Dim Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
DennisXX Geschrieben 26. August 2011 Autor Teilen Geschrieben 26. August 2011 Hi Folks ! Danke Dim für deinen Beitrag ! IMS Datenbanken (also hierarchische Datenbanken) oder noSQL Datenbanken Ich muss hier nochmal nachfragen. Was genau sind IMS Datenbanken und vor allem, was genau kann ich mir unter einer noSQL Datenbank vorstellen? In einem "normalen" Datenbankmodell wird im allgemeinen zuerst auf die 3. NF hin entwickelt, und dann in bestimten Punkten gezielt denormalisiert, da dass Modell ansonsten meist zu komplex und inperformant ist. In einem Datawarehouse werden Daten bewusst in verschiedenen Tabellen doppelt gehalten um die Abfragen, die im allgemeinen riesige Datenmengen verarbeiten, zu beschleunigen. Wo man in einem OLTP System etwa drei Tabellen joinen würde, ist in einem OLAP z.B. alles in einer Tabelle zusammengefasst. Das Stichwort hierzu lautet Star Schema. Dort findest Du noch detailiertere Informationen dazu. Ich vermute mal, du spielst hier auf Faktentabellen und Dimensionstabellen an, was die doppelte Datenhaltung / Datenredundanz angeht, richtig? OLTP System Auch hier nochmal die Frage an dich. was genau ist ein OLTP System? Sorry, aber das habe ich noch nie gehört. Danke für deine Hilfe ! Greetz Dennis Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
dr.dimitri Geschrieben 26. August 2011 Teilen Geschrieben 26. August 2011 Ich vermute mal, du spielst hier auf Faktentabellen und Dimensionstabellen an, was die doppelte Datenhaltung / Datenredundanz angeht, richtig? Korrekt. Zu den anderen Stichpunkten: Bevor ich mich hier darüber auslasse, verweise ich dich der Einfachheit an google, dort findest Du zu jede Menge gutes und detailiertes Material. :-) Dim Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.