Details

Data-Warehouse-Systeme für Dummies


Data-Warehouse-Systeme für Dummies


Für Dummies 1. Aufl.

von: Wolfgang Gerken

23,99 €

Verlag: Wiley-VCH
Format: EPUB
Veröffentl.: 27.09.2018
ISBN/EAN: 9783527813032
Sprache: deutsch
Anzahl Seiten: 318

DRM-geschütztes eBook, Sie benötigen z.B. Adobe Digital Editions und eine Adobe ID zum Lesen.

Beschreibungen

Jede Business-Intelligence-Anwendung beruht letzten Endes auf einem Data Warehouse. Data Warehousing ist deshalb ein sehr wichtiges Gebiet der Angewandten Informatik, insbesondere im Zeitalter von Big Data. Das vorliegende Buch beleuchtet das Data Warehouse aus zwei Perspektiven: der des Entwicklers und der des Anwenders. Der zukünftige Entwickler lernt, ein Data Warehouse mit geeigneten Methoden selbst zu entwickeln. Für den zukünftigen Anwender geht der Autor auf die Themen Reporting, Online Analytical Processing und Data Mining ein. Das Lehrbuch ist auch zum Selbststudium geeignet. Kenntnisse über Datenbanksysteme sollten allerdings vorhanden sein.
<p><b>Einleitung 19</b></p> <p>Über dieses Buch 19</p> <p>Konventionen in diesem Buch 20</p> <p>Was Sie nicht lesen müssen 20</p> <p>Törichte Annahmen über den Leser 21</p> <p>Wie dieses Buch aufgebaut ist 21</p> <p>Teil I: Was ist ein Data Warehouse? 21</p> <p>Teil II: Architektur eines Data-Warehouse-Systems 21</p> <p>Teil III: Anwendungsbereiche für ein Data Warehouse 22</p> <p>Teil IV: Modellierung eines Data-Warehouse-Systems 22</p> <p>Teil V: Zugriff auf ein Data Warehouse 22</p> <p>Teil VI: Speicherung und Optimierung auf Datenbankebene 22</p> <p>Teil VII: Der Top-10-Teil 22</p> <p>Symbole, die in diesem Buch verwendet werden23</p> <p>Wie es weitergeht 23</p> <p><b>TEIL I WAS IST EIN DATA WAREHOUSE? 25</b></p> <p><b>Kapitel 1 Ein Beispiel zur Einführung 27</b></p> <p>Daten und ihre Verarbeitung 27</p> <p>Daten und Datenbanken 27</p> <p>Die Verarbeitung von Daten 28</p> <p>Analyse von Absatzmengen und Planzahlen als Beispiel 29</p> <p>Besonderheiten analytischer Aufgabenstellungen 31</p> <p>Wenn personenbezogene Daten ins Spiel kommen 34</p> <p><b>Kapitel 2 Das Data Warehouse im Umfeld der betrieblichen Informationssysteme 35</b></p> <p>Hierarchie betrieblicher Informationssysteme 35</p> <p>Zusammenfassung: Analytische Informationssysteme 38</p> <p>Beispiele für analytische Informationssysteme 39</p> <p>Beispiel 1: Analytische Informationssysteme im CRM 39</p> <p>Beispiel 2: Kennzahlen-Analysesysteme im Rechnungswesen 41</p> <p>Beispiel 3: Website-Analysesysteme 43</p> <p>Fazit: Data Warehouse und analytische Informationssysteme 45</p> <p><b>Kapitel 3 Definition und Abgrenzung des Begriffs »Data Warehouse« 47</b></p> <p>Die 3-Schichten-Architektur analytischer Informationssysteme 47</p> <p>Definitionen des Begriffs Data Warehouse 50</p> <p>Definition von Inmon 50</p> <p>Definition von Kimball 52</p> <p>Vergleich der beiden Definitionen 53</p> <p>Anwendungsfall: Das Data Warehouse und Business Intelligence 54</p> <p><b>TEIL II ARCHITEKTUR EINES DATA-WAREHOUSE-SYSTEMS 57</b></p> <p><b>Kapitel 4 Überblick über die Architektur eines Data-Warehouse-Systems 59</b></p> <p>Die Phasen des Data Warehousing 59</p> <p>Ein allgemeines Data-Warehouse-Architekturmodell 61</p> <p>Vorgehensweisen bei der Erstellung eines Data Warehouse 64</p> <p>Projektdefinition und Machbarkeitsstudie 65</p> <p>Analyse, Entwurf und Einführung für einen Anwendungsbereich 66</p> <p><b>Kapitel 5 Der ETL-Prozess 69</b></p> <p>Überblick 69</p> <p>Ein einführendes Beispiel 70</p> <p>Extraktion 71</p> <p>Das Pull-Prinzip 71</p> <p>Das Push-Prinzip 72</p> <p>Beispiele 72</p> <p>Transformation 77</p> <p>Datenbestandsanalyse 77</p> <p>Datenbereinigung 78</p> <p>Datenintegration 80</p> <p>Laden 82</p> <p><b>Kapitel 6 Die Basisdatenbank 85</b></p> <p>Merkmale der Basisdatenbank 85</p> <p>Unterschied zwischen operativen Datenbanken und der Basisdatenbank 87</p> <p>Die operativen Quellsysteme des Beispiels 88</p> <p>Die Basisdatenbank des Beispiels 89</p> <p><b>Kapitel 7 Das Analyse-Subsystem 93</b></p> <p>Dimensionen und Fakten 93</p> <p>Dimension oder Metrik? 95</p> <p>Metriken als Dimension 96</p> <p>Dimensionen als Metrik 97</p> <p>Klassifizierung von Dimensionen 98</p> <p>Fachliche Dimensionen 98</p> <p>Kategorische Dimensionen 98</p> <p>Strukturelle Dimensionen 99</p> <p>Hierarchien von Dimensionswerten 99</p> <p>Parallele Hierarchien 100</p> <p>Unausgeglichene Hierarchiebäume 101</p> <p>Strukturänderungen in Hierarchien 102</p> <p>Slowly Changing Dimensions 102</p> <p>Typ 1: Überschreiben 103</p> <p>Typ 2: Neue Zeile 104</p> <p>Typ 3: Spalten mit altem und neuem Wert 105</p> <p>Typ 4: Mini-Dimension 105</p> <p>Zusammenfassung 106</p> <p>Verknüpfung von Dimensionen über Metriken 106</p> <p>Aggregationstypen von Fakten 107</p> <p>Die Themen Datenqualität und Datenschutz 108</p> <p>Datenqualität 108</p> <p>Datenschutz 109</p> <p>Architekturvarianten für ein Analyse-Subsystem 109</p> <p>Möglichkeiten für die Architektur 110</p> <p>Die Hub-and-Spoke-Architektur 111</p> <p>Auswertungen und Analysen 112</p> <p><b>Kapitel 8 Metadaten 113</b></p> <p>Was sind Metadaten?113</p> <p>Metadaten im Data-Warehouse-Kontext 114</p> <p>Das Metadaten-Management in einem Data-Warehouse-System 114</p> <p>Standards für Data-Warehouse-Metadaten 118</p> <p>Ein kleines Beispiel 119</p> <p><b>TEIL III ANWENDUNGSBEREICHE FÜR EIN DATA WAREHOUSE 121</b></p> <p><b>Kapitel 9 Reporting 123</b></p> <p>Das Berichtswesen eines Unternehmens 123</p> <p>Überblick und Definition 123</p> <p>Erzeugung und Verteilung von Reports 125</p> <p>Arten von Berichtssystemen 125</p> <p>Was sich Anwender vom Reporting wünschen und wie die Wirklichkeit oft aussieht 126</p> <p>Einige Tipps für die Report-Gestaltung 127</p> <p>Graphische Darstellungen im Report 128</p> <p>Die Hichert-Success-Regeln 131</p> <p>Grundformen für Reports 132</p> <p>Ist-Ist-Vergleiche 132</p> <p>Plan-Ist-Vergleiche 133</p> <p>Plan-Wird-Vergleiche 134</p> <p>Berücksichtigung dynamischer Dimensionsstrukturen 135</p> <p>Report as-is 136</p> <p>Report as-of 136</p> <p>Report as-posted 137</p> <p>Ein praktisches Beispiel 137</p> <p><b>Kapitel 10 Online Analytical Processing 139</b></p> <p>Motivation und Definition 139</p> <p>Charakteristika von OLAP 141</p> <p>Abgrenzung OLAP und OLTP 141</p> <p>Die Coddschen Regeln 142</p> <p>FASMI 143</p> <p>Spezielle OLAP-Operatoren 144</p> <p>Pivotierung bzwRotation 144</p> <p>Roll-up und Drill-down 145</p> <p>Slice und Dice 146</p> <p>Beispiel 148</p> <p><b>Kapitel 11 Data Mining151</b></p> <p>Einführung 151</p> <p>CRISP-DM 153</p> <p>Methoden und Verfahren beim Data Mining 154</p> <p>Assoziationsanalyse 155</p> <p>Clusteranalyse 160</p> <p>Klassifikation mit der Diskriminanzanalyse 164</p> <p>Entscheidungsbaumverfahren 166</p> <p>Spezielle Data-Mining-Fragestellungen im Kontext von Data-Warehouse-Daten 171</p> <p>Welche Artikel werden gemeinsam gekauft? 172</p> <p>Unterscheiden sich gute, normale und schlechte Kunden? 172</p> <p>Welche Kunden besitzen eine bestimmte Produktaffinität? 173</p> <p>Praxisbeispiel »Predictive Analytics« 174</p> <p>Kollaboratives Filtern 175</p> <p><b>TEIL IV MODELLIERUNG EINES DATA-WAREHOUSE-SYSTEMS 177</b></p> <p><b>Kapitel 12 Data Vault 179</b></p> <p>Einführung 179</p> <p>Hubs, Satelliten und Links 180</p> <p>Hubs 180</p> <p>Links 182</p> <p>Satelliten183</p> <p>Beispiel 185</p> <p><b>Kapitel 13 Semantischer Entwurf eines Data Warehouse 191</b></p> <p>Zur Wiederholung: das Entity-Relationship-Modell 191</p> <p>Drei Schritte bei der Modellierung einer Datenbank 192</p> <p>Das ER-Modell: Entitätstypen, Attribute und Beziehungen 192</p> <p>Das multidimensionale ER-Modell 194</p> <p>ADAPT 196</p> <p><b>Kapitel 14 Relationale Modellierung der Datenwürfel 199</b></p> <p>Einführung 199</p> <p>Das Star-Schema 200</p> <p>Beispiel 201</p> <p>Besondere Merkmale des Star-Schemas 204</p> <p>Das Snowflake-Schema 207</p> <p>Vergleich von Star- und Snowflake-Schema 209</p> <p>Das Galaxy-Schema 211</p> <p><b>TEIL V ZUGRIFF AUF EIN DATA WAREHOUSE 213</b></p> <p><b>Kapitel 15 Multidimensionale Abfragen mit SQL 215</b></p> <p>Zugriff auf ein Data Warehouse mit SQL 215</p> <p>Erzeugen der Tabellen 216</p> <p>Typische analytische Fragestellungen 218</p> <p>OLAP-Erweiterungen von SQL 220</p> <p>Die WINDOW-Klausel 220</p> <p>Erweiterungen der GROUP-BY-Option 225</p> <p>Statistische Funktionen 228</p> <p><b>Kapitel 16 Die Abfragesprache MDX 229</b></p> <p>Einführung 229</p> <p>Spezielle OLAP-Operatoren und Funktionen 233</p> <p>Tupel und Sets 233</p> <p>Member und Children 234</p> <p>Kreuzprodukt mittels Crossjoin 234</p> <p>Der WITH-Operator 235</p> <p>Häufige Fragestellungen 236</p> <p><b>Kapitel 17 Zusammenspiel von MDX und SQL 239</b></p> <p>OLAP-Server 239</p> <p>Der OLAP-Server Mondrian 241</p> <p>MDX-Schema von Mondrian 241</p> <p>Mondrian-Frontend-Tools 245</p> <p><b>TEIL VI SPEICHERUNG UND OPTIMIERUNG AUF DATENBANKEBENE 247</b></p> <p><b>Kapitel 18 ROLAP, MOLAP und anderes 249</b></p> <p>ROLAP und MOLAP 249</p> <p>Spaltenorientierte und In-Memory-Speicherung 252</p> <p>NoSQL-Datenbanksysteme 255</p> <p>Typen von NoSQL-Systemen 255</p> <p>NoSQL-Datenbanken bei einem Data Warehouse 258</p> <p>Beurteilung 263</p> <p><b>Kapitel 19 Optimierungsmöglichkeiten bei relationalen Datenbanken 265</b></p> <p>Einführung 265</p> <p>Partitionierung 266</p> <p>Partition by List 267</p> <p>Partition by Range 268</p> <p>Partition by Hash 268</p> <p>Partition by Reference 269</p> <p>Materialized Views 270</p> <p>Klassische Views vsMaterialized Views 270</p> <p>Materialized Views bei einem Data Warehouse 273</p> <p>Indizierung 274</p> <p>Klassischer Index 274</p> <p>Bitmap-Index 275</p> <p>Mehrdimensionale Indizes 276</p> <p><b>TEIL VII DER TOP-10-TEIL 279</b></p> <p><b>Kapitel 20 10 Schritte auf dem Weg zu Ihrem ersten Dashboard 281</b></p> <p>Und so wird es gemacht 282</p> <p>Festlegung der Datenquellen 282</p> <p>Vorbereitung der Daten 283</p> <p>Erstellung eines Dashboards 285</p> <p>Daten aus mehreren Quellen 287</p> <p>Integration von Landkarten 288</p> <p><b>Kapitel 21 10 Schritte, die helfen, die richtige Data-Warehouse-Software zu finden 291</b></p> <p>Marktanalyse für BI-Software 291</p> <p>Definition der eigenen Anforderungen 292</p> <p>Einbindung des Managements, Projektplan 293</p> <p>Marktanalyse der infrage kommenden BI-Anbieter 293</p> <p>Einholung von Angeboten 293</p> <p>Durchführung von Testinstallationen 294</p> <p>Bewertung der Systeme 294</p> <p>Ermittlung der Kosten 295</p> <p>Einholung von Referenzen, Anbieterqualifikation 296</p> <p>Überprüfung der Lizenzvereinbarung 296</p> <p><b>Kapitel 22 10 Übungsaufgaben zur Wiederholung 297</b></p> <p>Aufgaben 297</p> <p>Aufgabe 1: Assoziationsanalyse 297</p> <p>Aufgabe 2: Diskriminanzanalyse 297</p> <p>Aufgabe 3: Data Vault 298</p> <p>Aufgabe 4: ADAPT 298</p> <p>Aufgabe 5: MDX299</p> <p>Aufgabe 6: Star-Schema 299</p> <p>Aufgabe 7: OLAP mit SQL 299</p> <p>Aufgabe 8: Snowflake-Schema 300</p> <p>Aufgabe 9: Optimierung 300</p> <p>Aufgabe 10: Multidimensionale Datenbank301</p> <p>Lösungen 301</p> <p>Lösung von Aufgabe 1 301</p> <p>Lösung von Aufgabe 2 303</p> <p>Lösung von Aufgabe 3 303</p> <p>Lösung von Aufgabe 4 304</p> <p>Lösung von Aufgabe 5 304</p> <p>Lösung von Aufgabe 6 306</p> <p>Lösung von Aufgabe 7 307</p> <p>Lösung von Aufgabe 8 309</p> <p>Lösung von Aufgabe 9 309</p> <p>Lösung von Aufgabe 10 311</p> <p>Literaturverzeichnis 313</p> <p>Stichwortverzeichnis 317</p>
"Das didaktisch gut aufgebaute Buch auf dem aktuellen Stand der Technik endet mit 10 Übungsaufgaben (mit Lösungen) und ist auch zum Selbststudium gut geeignet."<br> (EKZ im Dezember 2018)
Wolfgang Gerken ist Professor für Wirtschaftsinformatik an der Hochschule für Angewandte Wissenschaften Hamburg. Seine Schwerpunktthemen sind Data Warehousing, Data Mining und Business Intelligence.

Diese Produkte könnten Sie auch interessieren:

SQL All-in-One For Dummies
SQL All-in-One For Dummies
von: Allen G. Taylor
EPUB ebook
26,99 €
PowerShell für Dummies
PowerShell für Dummies
von: Andreas Dittfurth
EPUB ebook
21,99 €