Wie ist diese scheiß Wissenspyramide aufgebaut?
Zeichen -> Daten -> Informationen -> Wissen
Was sind analytische Informationssysteme?
Versorgen Fach- und Führungskräfte mit Informationen zu Analysezwecken
Welche 3 Faccetten haben analytische Informationssysteme?
- Data Warehousing (OLAP & Reporting)
- Data Mining
- Betriebswirtschaftliche Anwendungen (Planung, Budgetierung, CRM)
- Data Mining
- Betriebswirtschaftliche Anwendungen (Planung, Budgetierung, CRM)
Was ist BI?
Analytischer Prozess um Unternehmensdaten in Wissen zu überführen, mit dem man dann handeln kann
Was sind Kennzahlen?
Quantitative Informationen mit Aussage über Unternehmenssachverhalte
Wie können Kennzahlen eingeordnet / kategorisiert werden?
Nach
Objektivität:
- Erhebung durch Errechnung, objektiv, direkt
- Erhebung durch Erfragun, subjektiv, indirekt
Zeitorientierung:
- Zeitorientiert, meißt finanziell
- nicht-zeitorientiert, meißt Potentialindikatoren
Objektivität:
- Erhebung durch Errechnung, objektiv, direkt
- Erhebung durch Erfragun, subjektiv, indirekt
Zeitorientierung:
- Zeitorientiert, meißt finanziell
- nicht-zeitorientiert, meißt Potentialindikatoren
Was sind Kennzahlensysteme?
- Gruppe von untereinander abhängigen Kennzahlen (z.B. DuPoint Schema)
- Verknüpfung zu neuen Kennzahlen
- Verknüpfung zu neuen Kennzahlen
Welche Schritte hat der BI Zyklus?
1. Überwachen (Kennzahlen monitoren)
2. Berichten (Informationen weitergeben)
3. Analysieren (Informationen untersuchen)
4. Entscheiden (Optionen aufzeigen)
5. Handeln (Einsetzen der BI nach Entscheidung)
2. Berichten (Informationen weitergeben)
3. Analysieren (Informationen untersuchen)
4. Entscheiden (Optionen aufzeigen)
5. Handeln (Einsetzen der BI nach Entscheidung)
Warum werden Data Warehouses benötigt?
- gewachsene Systemlandschaft im Unternehmen
- immer größere Datenmengen
- Volatile AUslastung von Systemen, unabsehbare Abfragen
- immer größere Datenmengen
- Volatile AUslastung von Systemen, unabsehbare Abfragen
Was ist ein Data Warehouse?
- Zentrales Datenbanksystem für Analysezwecke
- Extrahiert, Sammelt und Speichert Daten verschiedener Quellen
- Versorgt Systeme mit Informationen
- Extrahiert, Sammelt und Speichert Daten verschiedener Quellen
- Versorgt Systeme mit Informationen
Was sind die Vorteile eines DWH?
- Konsistenz durch unternehmensweite Integration
- Übernimmt Systemlast für analytische Anfragen
- Historisierte Datenhaltung
- Übernimmt Systemlast für analytische Anfragen
- Historisierte Datenhaltung
Welche 4 Eigenschaften hat ein DWH?
Subjektorientierung
zeitliche Varianz
Beständigkeit
Integration
zeitliche Varianz
Beständigkeit
Integration
Was bedeutet Subjektorientierung?
- Daten zu einem Subjekt in einer Tabelle speichern
- Weniger Zugriffe aber große DB, Redundanz
- Weniger Zugriffe aber große DB, Redundanz
Was bedeutet zeitliche Varianz?
- Speicherung historischer Daten
- Veränderung über Zeitraum darstellbar
- Veränderung über Zeitraum darstellbar
Was bedeutet Integration?
- Zusammenführen von Informationen verschiedener Bereiche/Silos
Was sind die Eigenschaften eines zentralen DWH?
- Organisationsweit
- Großes Datenvolumen
- Lange Histiorie der Daten
- Single Point of Truth
- Denormalisiert
- Aggregierte Daten
- Großes Datenvolumen
- Lange Histiorie der Daten
- Single Point of Truth
- Denormalisiert
- Aggregierte Daten
Was sind Data Marts?
- Auszüge an Daten nach Gruppierung (Fachlich, Technisch, Organisatorisch)
- Eher kleinere Datenmengen (GB)
- Für spezielle Analysebedürfnisse
- Auszüge aus DWH
- Eher kleinere Datenmengen (GB)
- Für spezielle Analysebedürfnisse
- Auszüge aus DWH
Was ist die Hub and Spoke Architektur?
Verbindung der Daten-Infrastruktur über mehrere Knoten
-> über DWH und Data Marts
- Dient zur zusammenführung von Datenquellen
-> über DWH und Data Marts
- Dient zur zusammenführung von Datenquellen
Welche Aufgaben hat das DWH in der Hub and Spoke Architektur?
- Integration von Daten
- Datenverteilung an Data Marts
- QUalitätssicherung
- Datenverteilung an Data Marts
- QUalitätssicherung
Welche Hub and Spoke Architekturen gibt es?
- Zentrales DWH zwischen Quellsystemen und DMs
- Unabhängige DMs ohne DWH
- DMs als Zwischenschicht vor DWH
- Data Mart Bus, teilweise direkt aus Quellsystemen zu DMs
- Unabhängige DMs ohne DWH
- DMs als Zwischenschicht vor DWH
- Data Mart Bus, teilweise direkt aus Quellsystemen zu DMs
Wie ist die Architektur innerhalb eines DWH aufgebaut?
Auswertebereich <->
||| DWH-Manager <-> Repository
Datenbeschaffungs- <->
brereich
|||
Datenquellsystem
||| DWH-Manager <-> Repository
Datenbeschaffungs- <->
brereich
|||
Datenquellsystem
Welche beiden Speichermethoden gibt es im DWH?
- Operational Data Store
- Multidimensional (OLAP-Cube)
- Multidimensional (OLAP-Cube)
Was ist die Operational Data Store Speichermethode?
- Normalisierte Daten
- Geringer zeitlicher Umfang (Aktuellere Daten)
- dafür hohe Detailtiefe
- Direkter Datenzugriff möglich
- Geringer zeitlicher Umfang (Aktuellere Daten)
- dafür hohe Detailtiefe
- Direkter Datenzugriff möglich
Was ist die OLAP-Cube-Speichermethode?
- x-dimensionale Würfelstruktur
- Daten nach Achsen/Dimensionen gegliedert
- Speicherung von Daten unterschiedlicher Aggregationsstufen
- verschiedene Sichten/Abfragen auf die Daten notwendig
- Daten nach Achsen/Dimensionen gegliedert
- Speicherung von Daten unterschiedlicher Aggregationsstufen
- verschiedene Sichten/Abfragen auf die Daten notwendig
Was ist OLAP?
- Software Technologie für schnelle, vielfältige Zugriffe
- Ermöglicht multidimensionale Analysen historischer Datenbestände
- Online Analytic Processing
- Ermöglicht multidimensionale Analysen historischer Datenbestände
- Online Analytic Processing
Vergleiche ODS und OLAP nach DB-Schema, Zeitbezug, Daten und Aktualität?
ODS / OLTP | OLAP | |
Daten | Operativ, Flüchtig, Detailiert | verdichtet/aggregiert |
Aktualität | nur aktuelle Daten | Daten nach Historie |
Zeitbezug | Aktuell, keine Zeitschlüssel | Historisch, mit Zeitschl. |
DB-Schema | Normalisiert | Multidimensional |
Nennen Sie 2 Anforderungen an OLAP-Systeme nach Codd?
- Unbegrenzte Anzahol an DImensionen und Konsolidierungsebenen möglich
- Unbeschränkt dimensionsübergreifende Operationen:
Automatische Berechungn unabhängig der Datendimension
- Unbeschränkt dimensionsübergreifende Operationen:
Automatische Berechungn unabhängig der Datendimension
Welche Operationen gibt es für OLAP-Systeme?
- Slicing
- Dicing
- Drill-Down / Drill-Up
- Drill-Through
- Dicing
- Drill-Down / Drill-Up
- Drill-Through
Was ist Slicing?
- Werteinschränkung auf einer Achse/Dimension
- Bsp: Zeit oder Produkt oder Geographie
- Bsp: Zeit oder Produkt oder Geographie
Was ist Drill-Down und Drill-Up?
DD: Von Grob bis Detailiert
DU: VOn Detailiert bis Grob
=> Zoom durch Detailstufen
DU: VOn Detailiert bis Grob
=> Zoom durch Detailstufen
Welche Speichermethoden gibt es für OLAP?
rOLAP: relational OLAP
mOLAP: Multidimensional OLAP
hOLAP: Hybrid OLAP
mOLAP: Multidimensional OLAP
hOLAP: Hybrid OLAP
Was sind die EIgenschaften von rOLAP?
Relationale Speicherung in Star, Snowflake und Galaxy Schema
Vorteile: Große Datenmengen schnell verarbeitbar
Nachteile: Langsame Abfragen, da viele JOINS
Vorteile: Große Datenmengen schnell verarbeitbar
Nachteile: Langsame Abfragen, da viele JOINS
Was sind die Eigenschaften des Galaxy-Schemas?
Dimensionen werden mehrfach verwendet (z.B. Zeit)
Was sind die Eigenschaften von mOLAP?
- Datenwürfel im Originalzustand abspeichern
- hochoptimierte Datenstruktur
- Schneller Zugriff
- ^Berechungnen einbauen die beim Beladen helfen
- hochoptimierte Datenstruktur
- Schneller Zugriff
- ^Berechungnen einbauen die beim Beladen helfen
Was ist hOLAP?
- Voteile von rOLAP und hOLAP vereint
- Multidimensionale Daten aggregiert in Cubes speichern
- bei detailierten Zugriffen erfolgen diese über die relationale DB
- nicht praktisch angewandt
- Multidimensionale Daten aggregiert in Cubes speichern
- bei detailierten Zugriffen erfolgen diese über die relationale DB
- nicht praktisch angewandt
Was ist Partitionierung?
- Zeilen/Spalten einer logischen Tabelle werden in mehrere physikalische Tabellen gespeichert
- Zur verkleinerung der Originaltabellengröße
- Zur steigerung der Performance durch parallele Verarbeitung
- Zur verkleinerung der Originaltabellengröße
- Zur steigerung der Performance durch parallele Verarbeitung
Was ist horizontale Partitionierung?
Aufteilung nach Wertebereich einer Spalte (<2000 und >2000)
Was ist vertikale Partitionierung?
- Aufteilung nach Spalten
- Schlüssel müssen in jeder Partition vorhanden sein
(Tabelle für Umsatz und Tabelle für Gewinn)
- Schlüssel müssen in jeder Partition vorhanden sein
(Tabelle für Umsatz und Tabelle für Gewinn)
Für was ist der ETL-Prozess zuständig?
Extract Transform Load
Daten aus Quellsystem in Data Marts speichern
Daten aus Quellsystem in Data Marts speichern
Was passiert in der Extract Phase?
- Laden der Daten aus Quellsystem
(event basiert, periodisch)
- Selektion der relevanten Daten
(nach timestamp, vergleich, festgelegt routine)
(event basiert, periodisch)
- Selektion der relevanten Daten
(nach timestamp, vergleich, festgelegt routine)
Was passiert in der Transform-Phase?
- Umwandlung der Daten in OLAP-Struktur
- Filtern, Vereinheitlichen, Zusammenfassen, ...
- Filtern, Vereinheitlichen, Zusammenfassen, ...
Was bezeichnet man als Historisierung?
- Festhalten der zeitlichen Entwicklung von Daten
- vergleichen von alten und neuen Daten -> Was ist wichtig
- vergleichen von alten und neuen Daten -> Was ist wichtig
Wie kann man Daten historisieren? (3 Möglichkeiten)
1. Neue Daten und transaktionale Daten Speichern
=> Ermitteln der alten Daten über rollback der Transaktionen
2. Nur neue oder alte Daten speichern
3. Alle Daten speichern mit zeitabhängigen Attributen
=> Ermitteln der alten Daten über rollback der Transaktionen
2. Nur neue oder alte Daten speichern
3. Alle Daten speichern mit zeitabhängigen Attributen
Welche Arten von Meta-Daten gibt es?
- Technisch: Beschreibgun der Objekte (Größe, Länge, Typ)
- Fachlich: Beschreibung der Daten und Zweck
- DWH-Betriebsdaten: Performance, Zeiten, Qualität bei Prozessausführung
- Fachlich: Beschreibung der Daten und Zweck
- DWH-Betriebsdaten: Performance, Zeiten, Qualität bei Prozessausführung
Welches sind die Nutzer der BI?
- Management
- Analysten
- Executives
- IT-Mitarbeiter
- externe Stakeholder
- Analysten
- Executives
- IT-Mitarbeiter
- externe Stakeholder
Welche Arten von Reporting gibt es?
- Dashboards
- Ad-Hoc-Reporting (Detailiert)
- Explorativ
- Enterprise Reporting (großer Zielkreis)
- Ad-Hoc-Reporting (Detailiert)
- Explorativ
- Enterprise Reporting (großer Zielkreis)
WAs ist das Enterprise Reporting?
- Berichte an große Kreise
- Gut aufbereitet/designet
- Beispielsweise für Management, Legal, ...
- Gut aufbereitet/designet
- Beispielsweise für Management, Legal, ...
Was ist das Dashboard-Reporting?
- High-Level über bestimmtes Geschäftsfeld
- Häufig interaktiv
- Häufig interaktiv
Was ist die Aufgabe des Informationsmanagement?
- Bereitstellung der Informationen zur richtigen Zeit in richtiger Form
- Personalisieren, Anpassen an Kundenvorgaben
- Personalisieren, Anpassen an Kundenvorgaben
Was sind die Ziele des Informationsmanagement?
- Unterstützung bei Entscheidungen
- Flexibler Datenzugriff?
- Flexibler Datenzugriff?
Welche beiden Personalisierungsarten für Informationen gibt es?
- Rollenbasiert (Nutzer in Gruppen)
- Individuell (Nutzer legt fest oder nach Sinnhaftigkeit)
- Individuell (Nutzer legt fest oder nach Sinnhaftigkeit)
Was ist Visualisierung?
Expressive oder effektive Darstellung der Daten und zugehöriger Informationen
Welche Arten von Visualisierung gibt es?
expressiv: Alle Daten darstellen, Vollständigkeit
effektiv: Nur die relevanten Daten auf ersten Blick zeigen
effektiv: Nur die relevanten Daten auf ersten Blick zeigen
Welche 5 Aufgaben hat die Visualisierung?
- Werte ermitteln
- Intervalle ermitteln
- Filtern
- Sortieren
- Extremwerte finden
- Intervalle ermitteln
- Filtern
- Sortieren
- Extremwerte finden
Was ist Informationsdesign?
- Selektion, Organisation und Präsentation von Informationen
Welches sind häufige Probleme analytischer Informationssysteme?
- Langsame Abfragen
- Komplexität bei Wartung, Nutzung
- Kosten
- Komplexität bei Wartung, Nutzung
- Kosten
Welche Technologien beschleunigen Datenbanken?
- in-Memory
- Partitionierung
- Clusterung
- Bessere Hardware lol (Da kann man gleich fragen: Was macht ein Auto schneller => besseres Auto kaufen)
- Partitionierung
- Clusterung
- Bessere Hardware lol (Da kann man gleich fragen: Was macht ein Auto schneller => besseres Auto kaufen)
Wie funktioniert das in-memory Prinzip?
- Daten nicht auf Platte sondern im RAM speichern
- schneller aber kostet mehr
- schneller aber kostet mehr
Welches sind SUCCESS-Prinzipien für Reporting?
S
Unify: Standardisieren
Condense: Infos Zusammenfassen
Check: Qualität prüfen
E
Structure: Inhalte gliedern
S
Unify: Standardisieren
Condense: Infos Zusammenfassen
Check: Qualität prüfen
E
Structure: Inhalte gliedern
S
Was sind die 5 Vs von Big Data?
Volume: Viele Geräte -> Viele Daten
Velocity: Schnelle Änderungsrate der Daten
Variety: Verschiedenste Datenquellen
Veracity: Unsicherheit -> Interpretation notwendig
Value: Nicht alle Daten sind viel wert (nur wenn sinnvoll)
Velocity: Schnelle Änderungsrate der Daten
Variety: Verschiedenste Datenquellen
Veracity: Unsicherheit -> Interpretation notwendig
Value: Nicht alle Daten sind viel wert (nur wenn sinnvoll)
Welche Quellen gibt es für Big Data?
- Menschen (Email, Texte, ...)
- Maschinen (Clicks, Audio, Video, Meta)
- UN-Systeme (ERP, ...)
- Maschinen (Clicks, Audio, Video, Meta)
- UN-Systeme (ERP, ...)
Was ist Ökosystemisierung?
Alles von einem Anbieter bringt Nutzervorteile
Anbieter bekommt mehr Daten
Anbieter bekommt mehr Daten
Was ist NoSQL?
Not only SQL
- Speicherung von Daten in nicht relationalen Datenbanken
- XML oder JSON
- Weniger Konsistenz aber bessere Verfügbarkeit
- Skalieren gut horizontal
- Speicherung von Daten in nicht relationalen Datenbanken
- XML oder JSON
- Weniger Konsistenz aber bessere Verfügbarkeit
- Skalieren gut horizontal
Vergleiche Big Data Systeme und traditionelle RDBMS nach Datenvolumen, Struktur, Skalierbarkeit, Integrität?
Big Data Systeme | Relational DB Management Systeme | |
Datenvolumen | Petabytes | Gigabytes |
Struktur | dynamische Schemata | statische Schemata |
Skalierbarkeit | Linear | nicht Linear (siehe SQL) |
Integrität | Gering | Hoch |
Wie können Big Data Systeme in konventionelle Landschaften integriert werden?
Data Hub /-Lake:
- Data Marts wählen Infosaus zentralem Big Data Speicher
Data Offloading:
- Big Data Systeme als SQL-fähiger Speicher
- Data Marts wählen Infosaus zentralem Big Data Speicher
Data Offloading:
- Big Data Systeme als SQL-fähiger Speicher
Welche Eigenschaften können Datenströme haben?
- Sortiert
- Schell
- Unbegrenzt
- Unvorhersehbar
- Push-Basiert
- Schell
- Unbegrenzt
- Unvorhersehbar
- Push-Basiert
Welche Arten/Fenster gibt es, um Datenströme lesen zu können?
- Sliding-Window: Fenster läuft mir Datenstrom
- Timebased-Window: Länge durch Zeitspanne festgelegt
- Tuple-Based-Window: Länge durch x Datenelemente festgelegt
- Timebased-Window: Länge durch Zeitspanne festgelegt
- Tuple-Based-Window: Länge durch x Datenelemente festgelegt
Wie sieht die Lambda-Architektur aus?
Datenquellen
->
Investigation Layter
->
(Speed Layer, Batch Layer)
->
Serving Layer
Kartensatzinfo:
Autor: Bennet208
Oberthema: Wirtschaftsinformatik
Thema: BI
Schule / Uni: DHBW Stuttgart
Veröffentlicht: 30.07.2019
Schlagwörter Karten:
Alle Karten (79)
keine Schlagwörter