Agile: Eine aus der Softwareentwicklung abgeleitete Methodik, die inzwischen in vielen Bereichen der Wirtschaft Anwendung findet. Agile Methoden sollen Teams dabei helfen, durch inkrementelle, iterative Arbeitsabläufe und verkürzte Feedbackschleifen auf Unvorhersehbarkeiten zu reagieren (z. B. durch kurze, tägliche Besprechungen, in denen die Projektmitarbeiter beschreiben, woran sie arbeiten). Agile Methoden sind eine Alternative zur Wasserfallmethode oder zur traditionellen sequenziellen Entwicklung.
Analyse-Dienste: Auch bekannt als Microsoft SQL Server Analysis Services, SSAS, und manchmal MSAS. Analysis Services ist eine Online-Analysedaten-Engine, die zur Entscheidungsunterstützung und Unternehmensanalyse eingesetzt wird. Sie liefern die analytischen Daten für Geschäftsberichte und Client-Anwendungen wie Power BI, Excel, Reporting Services-Berichte und andere Datenvisualisierungstools. Analysis Services werden von Unternehmen verwendet, um Informationen zu analysieren und sinnvoll zu nutzen, die über mehrere Datenbanken oder in unterschiedlichen Tabellen oder Dateien verteilt sein können.
Analytik: Die Entdeckung, Interpretation und Kommunikation von aussagekräftigen Mustern in Daten. Sie sind im Wesentlichen das Rückgrat jeder datengesteuerten Entscheidungsfindung.
Geschäftsanalyse (Business Analystics): Bezieht sich auf die Fähigkeiten, Technologien und Praktiken zur Untersuchung vergangener Unternehmensleistungen, um Erkenntnisse zu gewinnen und die Unternehmensplanung voranzutreiben. Sie konzentriert sich auf die Entwicklung neuer Erkenntnisse und das Verständnis der Unternehmensleistung auf der Grundlage von Daten und statistischen Methoden. Während sich Business Intelligence (BI) auf einen konsistenten Satz von Metriken konzentriert, um sowohl die vergangene Leistung zu messen als auch die Unternehmensplanung zu steuern, konzentriert sich Business Analytics auf die Entwicklung neuer Erkenntnisse und das Verständnis auf der Grundlage statistischer Methoden und prädiktiver Modellierung.
Darüber hinaus beantworten BI-Methoden wie Abfragen, Berichte, OLAP- und Alarm-Tools Fragen wie
- Was ist passiert?
- Wie viele?
- Wie oft?
- Wo liegt das Problem?
- Welche Massnahmen sind erforderlich?
Die Unternehmensanalyse kann Fragen beantworten wie
- Warum geschieht dies?
- Was passiert, wenn diese Trends anhalten?
- Was wird als nächstes passieren?
- Wie können wir optimieren?
Business Analyst: Jemand, der ein Unternehmen oder einen (realen oder hypothetischen) Geschäftsbereich analysiert und dessen Prozesse und Systeme dokumentiert, das Geschäftsmodell bewertet und die Integration mit der Technologie bestimmt. Ihre Lösungen können in der Verwendung von Technologiearchitekturen, Tools oder Softwareanwendungen bestehen. In einem BI-Projekt ist diese Person häufig für die Ermittlung der Geschäftsanforderungen und deren Umsetzung in architektonische Daten- und Anwendungsanforderungen verantwortlich.
Back-End: In der Software interagieren "Back-End"-Anwendungen oder -Programme direkt mit Ressourcen oder Datenbanken, ohne dass eine direkte Schnittstelle zum Endbenutzer besteht. Der Zugriff auf Back-End-Prozesse erfolgt in der Regel über eine Benutzeroberfläche, die sich auf dem "Front-End" befindet. Die Präsentationsschicht ist das "Front-End", während die Zugriffsschicht als "Back-End" bezeichnet wird.
BI Application Designer: Jemand, der für die Gestaltung der ersten Berichtsvorlagen und Dashboards in den Front-End-Anwendungen verantwortlich ist. Sie benötigen in der Regel eine kombinierte Begeisterung für Datenvisualisierung, User Experience Design und Anwendungsberichte. In der Regel werden BI-Anwendungsdesigner zur Quelle für den laufenden Support von Front-End-BI-Anwendungen.
BI-Projektsponsor: Idealerweise ist ein Projektsponsor eine Person auf Führungsebene, die die Bedeutung von BI-Projekten versteht, eine überzeugende geschäftliche Motivation hat und die Ergebnisse vorantreiben kann. Diese Person ist der eigentliche Kunde des Projekts und sein stärkster Fürsprecher. Er ist nicht in den Projektalltag involviert, sondern gibt die Aufsicht, die Richtung und den Schwung vor.
Big Data: Dieser Begriff erlangt schnell Buzzword-Status - umgangssprachlich bezieht er sich jedoch auf eine Datenmenge, die so gross ist, dass sie mit herkömmlichen Techniken nicht analysiert werden kann. Laut dem Marktforschungsunternehmen Gartner handelt es sich bei "Big Data" um hochvolumige, schnelle und/oder variantenreiche Informationsbestände, die kosteneffiziente, innovative Formen der Informationsverarbeitung erfordern, die verbesserte Einblicke, Entscheidungsfindung und Prozessautomatisierung ermöglichen.
Business Driver: Dieser Begriff kann sich entweder auf eine Ressource, einen Prozess oder eine Bedingung beziehen, die für das Wachstum und den anhaltenden Erfolg eines Unternehmens unerlässlich ist. Ein Beispiel für ein BI-Projekt: Wenn der Sponsor zu weit vom Projektteam entfernt ist, ist ein Business Driver hilfreich. Der Treiber übernimmt in der Regel die Verantwortung für die weniger strategischen BI-Aufgaben. Diese Rolle wird in der Regel von einem mittleren Manager ausgefüllt, der jedoch die gleichen Eigenschaften wie der Sponsor besitzt.
Business Intelligence (BI): Ein Sammelbegriff, der eine Vielzahl von Tools, Anwendungen und Methoden umfasst, die es Unternehmen ermöglichen, Daten aus internen Systemen und externen Quellen zu sammeln. BI kann verwendet werden, um Daten für die Analyse vorzubereiten, Abfragen zu entwickeln und auszuführen und Berichte, Dashboards und Visualisierungen mit dem Ziel zu erstellen, Entscheidungsträgern und Endnutzern Ergebnisse zur Verfügung zu stellen.
Business Owner: Die Rolle des Business Owners muss aus den Gruppen der Fachanwender mit begeisterten Fans des BI-Projekts besetzt werden, die auch Fachexperten auf ihrem Gebiet sind. Jede Gruppe von Geschäftsanwendern innerhalb der Organisation, die das BI-Tool nutzen wird (Finanzen, Betrieb, Personalwesen usw.), sollte einen Business Owner benennen. Die Einbeziehung der Geschäftsanwender ist von entscheidender Bedeutung, und es sollte darauf geachtet werden, dass sie von Anfang an in das Projekt einbezogen werden. Ohne Geschäftsinhaber und Benutzer ist ein BI-Projekt lediglich eine akademische technische Übung.
Business User: Ein Benutzer einer Dienstleistung oder eines Produkts, der nicht unbedingt mit dem Lieferanten/Anbieter in Kontakt steht und daher am Ende der Daten-"Lieferkette" steht, z. B. ein Endnutzer eines Content-Management-Systems (CMS) oder ein Buchhalter, der Bestellungen in ein ERP-System eingibt.
Collaborative Business Intelligence oder kollaborative BI: ist die Verbindung traditioneller Business-Intelligence-Taktiken mit Tools wie sozialen Netzwerken, Wikis oder Blogs, um den kollaborativen Problemlösungscharakter von BI zu verbessern. Microsoft SharePoint oder Teams ist ein Beispiel für ein beliebtes kollaboratives BI-Produkt.
Cubes (Datenwürfel): Mehrdimensionale Datenbereiche, die aus Tabellen und Feldern in Ihrer Datenbank aufgebaut sind. Cubes enthalten Berechnungen und Formeln und sind oft um bestimmte Geschäftsfunktionen gruppiert, z. B. Verkauf, Finanzen, Einkauf, Inventar usw. Jeder Cube enthält kontextbezogene, sachdienliche und nützliche Metriken für den jeweiligen Unternehmensbereich.
Dashboard: Bietet auf einen Blick statistische Analysen und historische Trends der wichtigsten Leistungsindikatoren (KPIs) einer Organisation, die in leicht verdaulichen, grafischen Darstellungen präsentiert werden. Ein Dashboard für die Personalabteilung kann zum Beispiel Zahlen zur Personalbeschaffung, -bindung und -zusammensetzung enthalten. Ein Marketing-Dashboard hingegen kann Zahlen zu eingehendem Webverkehr, Suchvolumen und Lead-Geschwindigkeit anzeigen.
Datenanalyse-Ausdrücke (DAX): Bietet eine spezielle Syntax für die Abfrage von Analysis Services. DAX enthält einige der Funktionen, die in Excel-Formeln verwendet werden, sowie zusätzliche Funktionen, die für die Arbeit mit relationalen Daten und die Durchführung dynamischer Aggregationen konzipiert sind. Mit DAX können Werte für sieben verschiedene Datentypen berechnet werden: Integer, Real, Currency, Date, Boolean, String und BLOB (binary large object). Bezieht sich auf den Prozess, durch den Daten
:- aus Quellen extrahiert-
transformiert oder standardisiert werden , um sie im richtigen heterogenen Format zu speichern- und in den endgültigen Speicher oder das Lager geladen werden. Der ETL-Prozess läuft in der Regel parallel zu den Transformationsprozessen, die während der Extraktion der Daten aus den Quellen ausgeführt werden. ETL-Systeme integrieren in der Regel Daten aus mehreren Anwendungen (Systemen), die von verschiedenen Mitarbeitern verwaltet und betrieben werden. So kann beispielsweise ein Kostenrechnungssystem Daten aus der Lohnbuchhaltung, dem Vertrieb und dem Einkauf kombinieren.
Datenarchitekt: Ein Fachmann für Datenarchitektur, eine Disziplin der Informationstechnologie, die sich mit dem Entwurf, der Erstellung, dem Einsatz und der Verwaltung der Datenarchitektur eines Unternehmens befasst. Diese Person ist in der Regel für den Entwurf des ETL-Prozesses (Extrahieren, Transformieren und Laden) und den Aufbau der Struktur (Dimensionsmodell) verantwortlich, in der sich die Daten nach dem ETL-Prozess befinden werden. Datenarchitekten stellen auch die erforderlichen technischen Funktionen für das BI-Projekt zusammen. Es werden mehrere Fähigkeiten benötigt: Fachkenntnisse in der dimensionalen Modellierung sind ebenso erforderlich wie ein tiefes Verständnis für die Anforderungen des Unternehmens. Unerlässlich sind auch Kenntnisse über ETL-Funktionen wie SQL Server Integration Services und Erfahrung in der Durchführung von ETL-Aufgaben. Darüber hinaus sind Kenntnisse der Hardware-Infrastruktur und der unterstützenden Software erforderlich.
Datenarchitektur: Eine Reihe von Regeln, Richtlinien, Standards und Modellen, die die Art der gesammelten Daten und deren Verwendung, Speicherung, Verwaltung und Integration innerhalb einer Organisation und ihrer Datenbanksysteme regeln und definieren.
Datenauswertung: Das Extrahieren von bisher unbekannten Daten aus Datenbanken und die Verwendung dieser Daten für wichtige Geschäftsentscheidungen, was in vielen Fällen zu neuen Erkenntnissen führt.
Datenbank: Im allgemeinsten Sinne ist eine Datenbank eine Sammlung von Informationen, die so organisiert sind, dass sie abgerufen, verwaltet und aktualisiert werden können. Die Daten werden in der Regel in einem Computer oder auf einem Server gespeichert und können Bilder, Zahlen, Skripte, Volltexte usw. sein, die fast alle Arten von Informationen enthalten. Im Zusammenhang mit Business Intelligence (BI) stehen Datenbanken für Systeme wie Microsoft Dynamics, Excel, CRM, Salesforce usw., in denen Datensätze oder Dateien wie Verkaufstransaktionen, Produktkataloge und -bestände sowie Kundenprofile zusammengefasst sind. Die Informationen werden in die Datenbank eingegeben und gespeichert, und eine BI-Lösung ist erforderlich, um diese Daten in einem sinnvollen, organisierten und informativen Format auszugeben. Siehe auch relationale Datenbank und multidimensionale Datenbank.
Datenbank-Management-System (DBMS): Eine Computersoftwareanwendung, die mit dem Benutzer, anderen Anwendungen und der Datenbank selbst interagiert, um Daten zu erfassen und zu analysieren. Ein universelles DBMS ist so konzipiert, dass es die Definition, Erstellung, Abfrage, Aktualisierung und Verwaltung von Datenbanken ermöglicht.
Datenbankverwalter (DBA): Diese Funktion umfasst Kapazitätsplanung, Installation, Konfiguration, Datenbankdesign, Migration, Leistungsüberwachung, Sicherheit, Fehlerbehebung sowie Backup und Datenwiederherstellung. Sie verwenden spezialisierte Software zum Speichern und Organisieren von Daten und stehen oft auf Abruf bereit, um dem BI-Bereitstellungsteam allgemeinen Datenbank-Support zu bieten.
Data Blending: Bietet eine schnelle und unkomplizierte Möglichkeit, Werte aus mehreren Datenquellen zu extrahieren, um Muster zu finden, ohne dass eine herkömmliche Data-Warehouse-Architektur eingesetzt werden muss.
Datenbereinigung: Der Prozess des Aufspürens und Korrigierens fehlerhafter Datensätze, der zu hochpräzisen BI-gestützten Entscheidungen führt, da riesige Datenbanken und die schnelle Erfassung von Daten zu ungenauen oder fehlerhaften Daten führen können, die sich auf die resultierenden BI und Analysen auswirken. Das Korrigieren von Tippfehlern, das Entfernen von Duplikaten und die Standardisierung der Syntax sind alles Beispiele für die Datenbereinigung.
Datendemokratisierung: Ermöglicht Benutzern im gesamten Unternehmen den Zugriff auf Daten, so dass sie jederzeit Analysen zur Beantwortung beliebiger Fragen durchführen können.
Datenentdeckung: Benutzergesteuerter Prozess der Suche nach Mustern in einem Datensatz, der Selbstbedienung und Datendemokratisierung ermöglicht. Data Discovery wurde von Gartner als "moderne Business Intelligence" bezeichnet.
Data Governance: Die Verwaltung der Verfügbarkeit, Nutzbarkeit, Integrität und Sicherheit der in einem Unternehmen gespeicherten Daten. Der Prozess, durch den Daten erfasst, validiert, gespeichert, geschützt und verarbeitet werden. Im Gegenzug wird ihre Zugänglichkeit, Zuverlässigkeit und Aktualität sichergestellt, um die Bedürfnisse der Datennutzer zu erfüllen. Das Datenmanagement überwacht den gesamten Lebenszyklus der Daten eines Unternehmens.
Datenintegration: Die Kombination von technischen und geschäftlichen Prozessen, die verwendet werden, um Daten aus unterschiedlichen Quellen zu aussagekräftigen Erkenntnissen zu kombinieren.
Datenintelligenz: Konzentriert sich auf interne Daten, die für zukünftige Vorhaben verwendet werden, und wird manchmal fälschlicherweise als Business Intelligence bezeichnet. Während es bei der Business Intelligence um die Organisation und nicht nur um das Sammeln von Daten geht, um sie für die Unternehmenspraktiken nützlich und anwendbar zu machen, konzentriert sich die Data Intelligence auf die Extrapolation von Daten zur Bewertung künftiger Dienstleistungen oder Investitionen.
Data Lake: Ein Speicher, in dem eine grosse Menge an Rohdaten in ihrem nativen Format gespeichert wird, bis sie benötigt wird.
Data Lineage: Bezeichnet den Lebenszyklus von Daten, der den Ursprung der Daten und ihre Entwicklung im Laufe der Zeit umfasst und beschreibt, was mit den Daten geschieht, wenn sie verschiedene Prozesse durchlaufen.
Data Mart: Eine Sammlung von Berichten, Metriken und anderen gespeicherten Daten zu einem bestimmten Thema. Stellen Sie sich dies als eine Organisation ähnlicher Informationen vor, die das Auffinden erleichtern.
Datenmanager: Jedes Team braucht ein Management, und ein Data-Science-Team ist nicht anders. In einem Data-Science- oder Analyse-Team fungiert der Datenmanager als Vermittler zwischen den technischen Teammitgliedern und dem strategischen Management. Aus diesem Grund ist es ideal, wenn der Datenmanager über einen technischen IT-Hintergrund mit strategischer Erfahrung verfügt.
Datenmigration: Der Prozess des Verschiebens von Daten zwischen zwei oder mehreren Speichersystemen, Datenformaten, Lagern oder Servern.
Data Mining: Bezieht sich auf den Prozess der Analyse grosser Datenmengen, um Muster und Fälle von statistischer Bedeutung zu finden. Durch den Einsatz von Software zur Suche nach Mustern in grossen Datenmengen können Unternehmen mehr über ihre Kunden erfahren und effektivere Strategien für die Kundenakquise entwickeln sowie den Umsatz steigern und die Gesamtkosten senken.
Datenmodell: Definiert, wie Daten strukturiert, verknüpft und standardisiert werden, um aussagekräftige Erkenntnisse zu gewinnen. Unternehmen können mehrere Datenmodelle verwenden (wie z. B. bei Power BI von Microsoft), um sicherzustellen, dass alle relevanten Daten enthalten sind.
Datenmodellierung: Bezieht sich auf den Prozess der Definition, Analyse und Strukturierung von Daten in Datenmodellen.
Datenquelle: Die Quelle der Daten. Sie kann eine Datei, eine bestimmte Datenbank in einem DBMS oder sogar ein Live-Datenfeed sein. Der Zweck einer Datenquelle besteht darin, alle technischen Informationen, die für den Zugriff auf die Daten erforderlich sind - Name des Treibers, Netzwerkadresse, Netzwerksoftware usw. -, an einem einzigen Ort zu sammeln und sie vor dem Geschäftsanwender zu verbergen. Der Benutzer sollte in der Lage sein, eine Liste mit Lohn- und Gehaltsabrechnung, Inventar und Personal zu betrachten, die Lohn- und Gehaltsabrechnung aus der Liste auszuwählen und die BI-Anwendung mit den Lohn- und Gehaltsdaten verbinden zu lassen. Dies geschieht, ohne dass der Benutzer weiss, wo sich die Abrechnungsdaten befinden oder wie die Anwendung zu ihnen gelangt ist.
Datenqualität: Bezieht sich auf die kontextbezogene Qualität der Datensammlung eines Unternehmens. Je relevanter, verfügbarer, vollständiger und genauer die Informationen sind, desto grösser ist die Chance, dass gewinnbringende Geschäftserkenntnisse gewonnen werden können.
Datenreplikation: Das häufige Kopieren von Daten aus einer Datenbank in eine andere, so dass alle Benutzer den gleichen Informationsstand nutzen können, was zu einer verteilten Datenbank führt, die es den Benutzern ermöglicht, auf Daten zuzugreifen, die für ihre eigenen spezifischen Aufgaben relevant sind.
Datenwissenschaft (Data Science): Ein Studienbereich, der sich mit den Prozessen und Systemen befasst, die zur Gewinnung von Erkenntnissen aus Daten in all ihren Formen verwendet werden. Das Fachgebiet wird als Fortsetzung anderer Bereiche der Datenanalyse, wie z. B. der Statistik, gesehen.
Data Staging: Ein temporärer Ort, an den alle Daten aus externen Ressourcen kopiert werden.
Data Warehouse: Ein System, das für die Datenanalyse verwendet wird. Es ist ein zentraler Ort, an dem integrierte Daten aus anderen, eher disparaten Quellen gespeichert werden, sowohl aktuelle (Echtzeit) als auch historische Daten, die dann zur Erstellung von Trendberichten verwendet werden können. In mehrdimensionalen Datensätzen ist Drilling der Prozess des Navigierens zwischen Datenebenen, die von den am meisten zusammengefassten (nach oben) bis hin zu den detailliertesten (nach unten) reichen.
Datenvisualisierung: Die Umwandlung von numerischen Daten in einen visuellen oder bildlichen Kontext, um den Benutzern ein besseres Verständnis der Daten zu ermöglichen.
Datenwürfel: Eine Datenbankstruktur mit mehreren Dimensionen, die gestapelt, kombiniert und manipuliert werden können, um das Durchsuchen zu ermöglichen.
Daten-Feed oder Live-Daten-Feed: Ein Mechanismus, mit dem Benutzer aktualisierte Daten aus Datenquellen erhalten können. Er wird üblicherweise von Echtzeitanwendungen in Punkt-zu-Punkt-Umgebungen sowie im Internet verwendet.
Datenvisualisierung: Die Praxis der Strukturierung und Anordnung von Daten in einem visuellen Kontext, um den Benutzern das Verständnis zu erleichtern. Muster und Trends, die für den Laien in textbasierten Daten nicht erkennbar sind, können von Endnutzern mit Hilfe von Datenvisualisierungssoftware leicht erkannt und verarbeitet werden.
Data Warehouse: Ein grosser Datenspeicher, der aus einer Vielzahl von Quellen stammt und verarbeitet, aufgeteilt und analysiert werden kann, um Erkenntnisse zu gewinnen, die als Grundlage für Managemententscheidungen dienen. Data Warehouses sind in der Regel relationale Datenbanken, die historische Daten enthalten und für Abfragen und Analysen konzipiert sind.
Data Warehousing: Der Prozess der Zusammenführung von Daten aus unterschiedlichen Quellen zum Zweck des Aufbaus eines Data Warehouse. Data Warehousing umfasst Design, Entwicklung, Tests, Bereitstellung, Betrieb, Auswirkungsanalyse und Änderungsmanagement.
Data-Warehouse-Automatisierung (DWA): Nutzt Technologie, um die Effizienz und Effektivität von Data-Warehousing-Prozessen zu verbessern. Die Idee hinter DWA ist es, jeden Teil des Data-Warehouse-Lebenszyklus zu automatisieren, der automatisiert werden kann, so dass sich das Projektteam auf die Teile konzentrieren kann, die mehr intellektuellen Input als rohe technologische Leistung erfordern. DWA kann dazu beitragen, die Zeit bis zur Implementierung von BI-Projekten zu verkürzen, die jährlichen Ausgaben für BI zu senken und die Erfolgsquote zu verbessern.
Data Warehouse-Entwickler: Ihre Hauptaufgabe ist die Entwicklung und Bereitstellung von Code. Sie erhalten Anweisungen vom ETL-Architekten und erstellen direkt ETL-Funktionen. Erforderlich sind Fachwissen und Erfahrung im Bereich ETL, die jedoch je nach verwendetem ETL-Tool variieren können.
Dimension: Eine Kategorie, die verwendet werden kann, um Daten nach Fakten und Massstäben zu gliedern, um sie zu gruppieren und zu filtern. Häufig verwendete Dimensionen sind Personen, Produkte, Orte und Zeit.
Dimensionstabelle: In einem Data Warehouse ist eine Dimensionstabelle eine Ergänzung zu einer Faktentabelle. Dimensionstabellen enthalten beschreibende Felder, die traditionell textuell sind. Dimensionstabellen sind mit Faktentabellen (die Kennzahlen enthalten) durch die Verwendung von Schlüsseln (z. B. Surrogatschlüssel) verbunden.
Drill-Through/Drill-Down: In der BI-Terminologie bezieht sich "Drilldown" auf den Übergang von übergeordneten zu detaillierten Transaktionsdaten, indem man sich auf etwas konzentriert (z. B. auf eine bestimmte Zahl in einem Bericht). In einer Visualisierungsumgebung (wie z. B. Jet Reports) kann "Drilldown" bedeuten, dass man auf eine bestimmte Darstellung klickt, um mehr Details zu sehen.
Ebene (Layer): Eine Gruppierung innerhalb einer Dimension. Kunden können zum Beispiel nach Stadt oder Land gruppiert werden. Wenn sie auf diese Weise gruppiert sind, werden Kunde, Stadt und Land als verschiedene Ebenen innerhalb eines Würfels kategorisiert. In ähnlicher Weise können Daten in einem BI-Würfel verschiedene Ebenen haben (Tag, Monat, Quartal, Jahr ist ein gängiges Beispiel).
Executive BI: Das Sammeln, Analysieren und Visualisieren von Daten, um der Führungsebene wichtige Erkenntnisse zu liefern, die den geschäftlichen Wandel fördern.
Dashboard für Führungskräfte: Ermöglicht dem Führungsteam einen sofortigen Einblick in das Gesamtbild des gesamten Unternehmens, von Finanzen und Betrieb bis hin zu Vertrieb und Marketing. Executive Dashboards sind vollständig anpassbar, um die Daten anzuzeigen, die für Ihr Führungsteam wichtig sind.
Extrahieren, Transformieren, Laden (ETL): Bezieht sich auf den Prozess, durch den Daten aus Quellen extrahiert und transformiert oder standardisiert werden
, um sie im richtigen heterogenen Format zu speichern -
und in den endgültigen Speicher oder das Lager geladen werden. Der ETL-Prozess läuft in der Regel parallel zu den Transformationsprozessen, die während der Extraktion der Daten aus den Quellen ausgeführt werden. ETL-Systeme integrieren in der Regel Daten aus mehreren Anwendungen (Systemen), die von verschiedenen Mitarbeitern verwaltet und betrieben werden. So kann beispielsweise ein Kostenrechnungssystem Daten aus der Lohnbuchhaltung, dem Vertrieb und dem Einkauf kombinieren.
Faktentabelle: Bestehen aus Messungen, Metriken oder Fakten eines Geschäftsprozesses. Sie befinden sich in der Mitte eines Stern- oder Schneeflockenschemas, das von Dimensionstabellen umgeben ist. Faktentabellen liefern die (in der Regel) additiven Werte, die als unabhängige Variablen fungieren, anhand derer die Dimensionsattribute analysiert werden. Faktentabellen werden oft durch ihre Struktur definiert. Die Struktur einer Faktentabelle stellt die atomarste Ebene dar, auf der die Fakten definiert werden können. Die Struktur einer Faktentabelle für Verkäufe könnte zum Beispiel wie folgt lauten: "Verkaufsvolumen nach Tag nach Produkt nach Geschäft".
Feldtransformation: Diese ermöglichen es einem Administrator, rohe Feldeingaben in standardisierte Werte umzuwandeln, die für eine Organisation aussagekräftiger sind. Umwandlungen werden durch Regeln gesteuert und können für die Verwendung in Abfragen konfiguriert werden. Wenn beispielsweise eine Messvariable nicht einer Normalverteilung entspricht oder in verschiedenen Gruppen stark unterschiedliche Standardabweichungen aufweist, kann eine Feldtransformation erforderlich sein - die Transformation von Daten auf Feldtyp-Ebene. Datentransformationen sind ein wichtiges Instrument für eine ordnungsgemässe statistische Analyse; für diejenigen, die nur über begrenzte Kenntnisse in Statistik verfügen, können sie jedoch als eine Art Spielerei mit Ihren Daten erscheinen, um die gewünschte Antwort zu erhalten. Daher ist es wichtig, dass Sie in der Lage sind, die Verwendung von Feld- und Datentransformationen zu rechtfertigen und zu dokumentieren.
Finanzielle Berichterstattung: Der Prozess der Erstellung von Berichten, die den Finanzstatus einer Organisation gegenüber der Geschäftsführung, Investoren und der Regierung offenlegen.
Front-End: Im Gegensatz zum "Back-End" ist das "Front-End" bei Software der Teil eines Programms oder Geräts, der über eine Benutzeroberfläche (UI) direkt mit dem Endbenutzer verbunden ist und mit dem Back-End kommuniziert.
Full Load oder Vollständiges Laden: Ein Mittel zum Lesen und Aktualisieren aller Datensätze in einer Datenquelle beim Laden des Data Warehouse. Für das Laden von Daten in ein Data Warehouse gibt es zwei Haupttechniken: das vollständige Laden und das inkrementelle Laden.
Governed Data (Verwaltete Daten): Informationen und Datenprozesse, die von einer leitenden Abteilung, in der Regel der IT-Abteilung, verwaltet, kontrolliert und gesichert werden, damit sie den Geschäftsregeln und -standards entsprechen, bevor die Benutzer darauf zugreifen können. Dies trägt dazu bei, die Datenintegrität zu gewährleisten; die Benutzer arbeiten nur mit vertrauenswürdigen, glaubwürdigen Daten.
Hierarchie: Bezieht sich auf ein Mittel zur Organisation verschiedener Ebenen einer Dimension nach Granularität; normalerweise von der grössten zur kleinsten. Für ein Datum würde eine typische Hierarchie nach Jahr, Quartal, Monat und Tag gegliedert sein. Land, Bundesland, Stadt und Kunde sind weitere Beispiele für Hierarchieebenen innerhalb eines Würfels.
Human Resources Dashboard (HR-Dashboard): Analysiert und präsentiert Unternehmensdaten mit dem Ziel, aussagekräftige HR-KPIs anzuzeigen. Der Mitarbeiterzufriedenheitsindex, die Anzahl der Vollzeitstellen, die Fluktuationsrate, die Inanspruchnahme von Sozialleistungen und die Kosten pro Mitarbeiter sind Beispiele für Datenpunkte, die über ein HR-Dashboard visualisiert und angezeigt werden können.
Inkrementelles Laden: Im Gegensatz zum vollständigen Laden ist das inkrementelle Laden eine Form des Data Warehouse-Ladens, bei der nur neue oder aktualisierte Datensätze geladen werden. Inkrementelle Ladevorgänge sind nützlich, da sie im Vergleich zu vollständigen Ladevorgängen sehr effizient ablaufen und eine häufigere Aktualisierung des Data Warehouse und der Cubes ermöglichen, insbesondere bei grossen Datensätzen.
Index: Eine Datenstruktur, die die Werte für eine bestimmte Spalte in einer Tabelle speichert. Die Indexierung ist eine Möglichkeit, eine Anzahl von Datensätzen nach mehreren Feldern zu sortieren. Wenn Sie zum Beispiel einen Index für ein Feld in einer Tabelle erstellen, wird eine weitere Datenstruktur angelegt, die den Feldwert und einen Zeiger auf den Datensatz enthält, auf den er sich bezieht. Diese Indexstruktur wird dann sortiert, so dass schnelle binäre Suchvorgänge darauf durchgeführt werden können.
In Memory: Ein Datenbankverwaltungssystem, das in erster Linie den Computerspeicher für die Datenspeicherung nutzt, im Gegensatz zu Datenbankverwaltungssystemen, die einen Plattenspeichermechanismus verwenden. Die Vorteile eines "In-Memory-Datenbanksystems" (oder IMDB - nicht zu verwechseln mit der "Internet Movie Database") bestehen darin, dass die Suchzeit bei der Abfrage der Daten entfällt. Dies sorgt für eine schnellere und besser vorhersehbare Leistung als bei Festplatten - ein grosser Vorteil bei der Berechnung und Analyse grosser Datenmengen.
In-Memory-Analytik: Bezeichnet den Prozess der Abfrage von Daten, die sich im Computerspeicher (z. B. RAM) und nicht auf einem physischen Speichermedium wie einer Festplatte befinden. In-Memory-Abfragen sind inkrementell schneller als die Alternativen, was zu schnelleren Geschäftsentscheidungen auf der Grundlage von Daten aus Business Intelligence-Anwendungen führt. Da die Kosten für Arbeitsspeicher immer weiter sinken, werden gross angelegte In-Memory-Analysen für viele Unternehmen immer mehr zu einer realistischen Option.
Inmom-Ansatz: Eine Top-Down-Methode für Data Warehousing. Sie besagt, dass das Data Warehouse anhand von Normalisierungsregeln modelliert werden sollte. Tabellen werden nach Themenbereichen gruppiert, die allgemeine Datenkategorien widerspiegeln (z. B. Daten über Kunden, Produkte, Finanzen usw.). Die normalisierte Struktur unterteilt die Daten in Entitäten, wodurch mehrere Tabellen in einer relationalen Datenbank entstehen. Bei der Anwendung in grossen Unternehmen entstehen so Dutzende von Tabellen, die durch ein Netz von Joins miteinander verbunden sind.
Joins Ein Mittel zum Kombinieren von Feldern aus zwei Tabellen unter Verwendung gemeinsamer Werte in beiden Tabellen. Es ist möglich, Felder zu kombinieren, indem man verschiedene Arten von Joins verwendet, wie z.B.
- Inner Join: Gibt alle Zeilen aus mehreren Tabellen zurück, bei denen die Join-Bedingung erfüllt ist.
- linke Verknüpfung: Gibt alle Zeilen aus der linken Tabelle und die übereinstimmenden Zeilen aus der rechten Tabelle zurück.
- rechte Verknüpfung: Gibt alle Zeilen aus der rechten Tabelle und die übereinstimmenden Zeilen aus der linken Tabelle zurück.
- Vollständige Verknüpfung: Gibt alle Zeilen zurück, wenn es eine Übereinstimmung in EINER der Tabellen gibt.
Kimball-Ansatz Eine Bottom-up-Methode für Data Warehousing (im Gegensatz zum Inmon-Ansatz, der Top-down ist). Beim Kimball-Ansatz werden zunächst dimensionale Data Marts erstellt, um Berichts- und Analysefunktionen für bestimmte Geschäftsbereiche wie "Vertrieb" oder "Produktion" bereitzustellen, die dann zu einem umfassenderen Data Warehouse kombiniert werden. Dies ist die am häufigsten verwendete Methode, insbesondere wenn Sie den Microsoft BI-Stack verwenden.
Leistungsindikator (KPI): Geschäftskennzahlen, die zur Bewertung von Faktoren verwendet werden, die für den Unternehmenserfolg entscheidend sind. KPIs unterscheiden sich von Unternehmen zu Unternehmen; Geschäfts-KPIs können der Nettoumsatz oder eine Kundenbindungskennzahl sein, während HR-KPIs die Fluktuationsrate, die Mitarbeiterzufriedenheit und die Mitarbeiterzahl betreffen können.
Lead and Lag (Vorlauf und Nachlauf): Analytische Funktionen, die zur Berechnung der Differenz zwischen Zeilen in einer Tabelle verwendet werden. LEAD berechnet die Differenz zwischen der aktuellen Zeile und der folgenden Zeile, während LAG die Differenz zwischen der aktuellen Zeile und der vorherigen Zeile berechnet.
Many-to-Many-Beziehungen: Bezieht sich auf eine Beziehung zwischen Tabellen in einer Datenbank, wenn eine übergeordnete Zeile in einer Tabelle mehrere untergeordnete Zeilen in der zweiten Tabelle enthält und umgekehrt. Many-to-many-Beziehungen sind oft schwierig darzustellen. Eine oder mehrere Zeilen in einer Tabelle können jedoch mit 0, 1 oder vielen Zeilen in einer anderen Tabelle verbunden sein. In einer Many-to-many-Beziehung zwischen Tabelle A und Tabelle B ist jede Zeile in Tabelle A mit 0, 1 oder vielen Zeilen in Tabelle B verknüpft und umgekehrt. Um eine solche Beziehung zu realisieren, ist eine dritte Tabelle, die so genannte Mapping-Tabelle, erforderlich.
Marketing-Dashboard: Analysiert und präsentiert Unternehmensdaten mit dem Ziel, aussagekräftige Marketing-KPIs darzustellen. Lead-Akquisition, Website-Konversionsrate, Kosten pro Lead, Web-Traffic und mehr sind Beispiele für Datenpunkte, die über ein Marketing-Dashboard visualisiert und angezeigt werden können.
Mehrdimensionale Ausdrücke (oder MDX): Eine Abfragesprache für OLAP oder relationale Datenbanken mit einer Syntax, die an Tabellenkalkulationsformeln erinnert. Aufgrund ihrer Einfachheit und unkomplizierten Syntax hat sie sich schnell als Standard für OLAP-Systeme gegenüber dem komplexeren SQL durchgesetzt.
Massnahme: Ein berechneter numerischer Wert. Es kann sich um eine Summe, eine Anzahl, einen Durchschnitt, einen Prozentsatz usw. handeln. Beispiele für Kennzahlen wären Bruttoumsatz, Gewinn, Gewinnanteil. In Cubes werden viele Kennzahlen vorberechnet, was eine extrem schnelle Leistung bei der Datenanalyse ermöglicht. Beispiele für Kennzahlen in einem Verkaufs-Cube sind Verkaufsbetrag, Gewinn YTD, durchschnittliche Stückkosten, Beleganzahl usw.
Mitglied(er): Benutzer mit vorkonfiguriertem Zugang zu einer Datenbank auf der Grundlage von Rollen.
Metadaten: Ein Satz von Daten, der Informationen über andere Daten enthält. Beispiele für Metadaten in relationalen Datenbanken sind:
- Tabellen mit allen Tabellen in einer Datenbank, ihren Namen, Grössen und der Anzahl der Zeilen in jeder Tabelle.
- Tabellen der Spalten in jeder Datenbank, in welchen Tabellen sie verwendet werden und welche Art von Daten in jeder Spalte gespeichert sind.
In der Datenbankterminologie wird dieser Satz von Metadaten als Katalog bezeichnet. Der SQL-Standard legt ein einheitliches Mittel für den Zugriff auf den Katalog fest, das so genannte Informationsschema, das jedoch nicht von allen Datenbanken implementiert wird, selbst wenn sie andere Aspekte des SQL-Standards implementieren.
Metriken: Quantifizierbare Messgrössen, die zur Verfolgung, Überwachung und Bewertung der Ergebnisse und des Erfolgs verschiedener Geschäftsprozesse verwendet werden. Metriken sollen den Fortschritt eines Unternehmens in Richtung bestimmter lang- und kurzfristiger Ziele vermitteln. Dazu ist es oft erforderlich, dass die wichtigsten Interessengruppen des Unternehmens angeben, welche Kennzahlen für sie wichtig sind.
Microsoft BI Stack: Microsofts Suite von Business-Intelligence-Tools, die je nach den Anforderungen des Unternehmens auf Einzel-, Team- und Unternehmensebene eingesetzt werden können. Dazu gehören SQL-Server, OLAP-Würfel, SharePoint, PerformancePoint, Excel und Dynamics. Diese Tools können miteinander kombiniert werden, um Daten zu sammeln, zu speichern, zu analysieren, zu segmentieren und zu visualisieren und so aussagekräftige Erkenntnisse zu gewinnen, die als Grundlage für Geschäftsentscheidungen dienen.
Mobile Analytik: Bezieht sich auf die Zugänglichkeit von aussagekräftigen und pointierten Daten, Dashboards und Berichten für Endnutzer auf mobilen Geräten wie Tablets und Smartphones.
Mobile Dashboards: Ein Business Intelligence Dashboard, auf das über ein mobiles Gerät zugegriffen werden kann. In Anbetracht der Tatsache, dass Unternehmen immer und überall erreichbar sind, setzen Führungskräfte auf mobile Dashboards und mobile Analysen, um effektiv auf Daten von mobilen Geräten aus zuzugreifen, sie zu analysieren und zu optimieren.
Mehrdimensionale Datenbank (MDB): Ein Datenbanktyp, der für Data Warehouses und analytische Online-Verarbeitung optimiert ist. Multidimensionale Datenlösungen nutzen Würfelstrukturen für die Analyse von Daten in zahlreichen Dimensionen. Sie bestehen aus Würfeln und Dimensionen, die mit Anmerkungen versehen und erweitert werden können, um komplexe Abfragekonstruktionen zu unterstützen. BI-Entwickler erstellen Cubes, um schnelle Antwortzeiten zu ermöglichen und eine einzige Datenquelle für Geschäftsberichte bereitzustellen.
Online-Analytische Verarbeitung (OLAP): Eine leistungsstarke Technologie für die Datenermittlung, die Funktionen für die unbegrenzte Anzeige von Berichten, komplexe analytische Berechnungen und die vorausschauende Planung von "Was-wäre-wenn"-Szenarien (Budget, Prognosen) bietet. OLAP führt eine multidimensionale Analyse von Geschäftsdaten durch und bietet die Möglichkeit für komplexe Berechnungen, Trendanalysen und anspruchsvolle Datenmodellierung. Typische Anwendungen von OLAP sind Geschäftsberichte für Vertrieb, Marketing, Managementberichte, Geschäftsprozessmanagement (BPM), Budgetierung und Prognosen sowie Finanzberichte.
OLAP-Würfel: Eine Methode zur Speicherung von Daten in multidimensionaler Form, im Allgemeinen zu Berichtszwecken. In OLAP-Würfeln werden die Daten nach Dimensionen kategorisiert. OLAP-Würfel werden oft über Dimensionen hinweg vorverdichtet, um die Abfragezeit und -genauigkeit von relationalen Datenbanken drastisch zu verbessern.
Operative Berichterstattung: Taktische Echtzeit-Berichterstattung, die das Tagesgeschäft auf Unternehmensebene widerspiegelt und unterstützt. Beispiele für operative Berichte sind Berichte über den Abgleich von Bankschaltern, tägliche Produktionsaufzeichnungen und Transaktionsprotokolle.
Power BI: Microsofts Flaggschiff-Tool für die Visualisierung von Geschäftsdaten. Power BI umfasst grafisch robuste Dashboards und fortschrittliche Analysen sowohl auf mobilen als auch auf Desktop-Geräten.
Projektleiter: Eine Person, die für die Planung, Organisation, das Ressourcenmanagement und die Disziplin in Bezug auf den erfolgreichen Abschluss eines bestimmten Projekts oder Ziels verantwortlich ist. Wir haben die Erfahrung gemacht, dass Projektmanager am effektivsten sind, wenn sie aus der IT-Organisation kommen - technische Fähigkeiten sind entscheidend für das Verständnis des Aufwands und der zeitlichen Anforderungen von Data-Warehousing-Aufgaben. Kommunikations- und PM-Fähigkeiten sind ebenso wichtig wie ein sicheres Auftreten im Umgang mit leitenden Angestellten.
Relationale Datenbank: Eine Datenbank, die so strukturiert ist, dass sie Beziehungen zwischen den gespeicherten Informationen erkennt. Microsoft Dynamics NAV, AX, GP und SQL sind alles Beispiele für relationale Datenbanken. Relationale Datenbanken enthalten Tabellen und Felder, die durch Schlüssel miteinander verbunden sind. Sie sind dafür optimiert, Informationen auf kohärente Weise in ein System zu übertragen; sie sind jedoch nicht dafür optimiert, die Informationen wieder herauszugeben.
Schema: Bezieht sich auf die Organisation von Daten als Entwurf dafür, wie Fakten- und Dimensionstabellen angeordnet und aufgebaut sind, um eine relationale Datenbank zu bilden. Ein Datenbankschema spezifiziert, basierend auf dem Wissen des Datenbankadministrators über mögliche Anwendungen, die Fakten, die in die Datenbank aufgenommen werden können, oder diejenigen, die für die möglichen Geschäftsanwender von Interesse sind.
Scorecard: Eine grafische Darstellung des Fortschritts eines Unternehmens, eines Mitarbeiters oder einer Geschäftseinheit im Hinblick auf ein bestimmtes Ziel oder bestimmte Ziele, wobei relevante Leistungsindikatoren (KPIs) hervorgehoben werden. Performance Scorecards sind in vielen Branchen im öffentlichen und privaten Sektor weit verbreitet.
Services Delivery Manager (BI-Bereitstellungsteam): Ist innerhalb eines BI-Bereitstellungsteams für den Gesamterfolg des BI-Projekts verantwortlich. Der Services Delivery Manager ist für die Personalbesetzung und das Management des Anbieterteams verantwortlich. Der SDM kümmert sich auch um die Kommunikation mit dem Unternehmen und arbeitet dabei in der Regel mit dem Produktsponsor und den Geschäftsverantwortlichen zusammen. Weitere Informationen zu den Rollen, die an einem BI-Projekt beteiligt sind, und wie sie sich auf die Gesamtdatenqualität auswirken, finden Sie in unserem Whitepaper "A New Twist on Data Governance from Jet".
Langsam wechselnde Dimensionen (SCD): Bezieht sich auf Datendimensionen, die sich langsam und unvorhersehbar ändern, anstatt nach einem statischen oder festen Zeitplan.
Schneeflocken-Schema: Eine Anordnung von Tabellen in einer multidimensionalen Datenbank, so dass das physische Modell der Form einer Schneeflocke ähnelt. Das Schneeflockenschema besteht aus zentralisierten Faktentabellen, die mit mehreren Dimensionen verbunden sind.
'Single version of the truth' oder SVOT: Ein technisches Konzept, das das Ideal der Unternehmensanalyse beschreibt, das darin besteht, entweder eine einzige zentrale Datenbank (Data Warehouse) oder zumindest eine verteilte, synchronisierte Datenbank zu haben, in der alle Daten eines Unternehmens in einer konsistenten und nicht redundanten Form gespeichert sind. Eine Kombination aus Software, Datenqualität und starker Datenführung kann Unternehmen und Organisationen helfen, SVOT zu erreichen.
SQL Server Analysis Services (SSAS): Microsoft SQL Server Analysis Services (oder SSAS) ist ein OLAP-Werkzeug zur Datenanalyse und Berichterstellung in Microsoft SQL Server. SSAS wird zur Analyse, zum Zugriff und zur Darstellung von Informationen verwendet, die über mehrere Datenbanken oder in unterschiedlichen Tabellen verteilt sind. Siehe auch Analysis Services.
SQL Server Integration Services (SSIS): Ein Tool zur Integration, Transformation und Migration von Unternehmensdaten, das in Microsoft SQL Server integriert ist. Es wird für eine Vielzahl von integrationsbezogenen Aufgaben verwendet, z. B. für die Analyse und Bereinigung von Daten oder die Ausführung von ETL-Prozessen zur Aktualisierung von Data Warehouses. SSIS kann Daten aus mehreren relationalen Datenbanken sowie aus Quellen wie XML-Datendateien und Flat Files konsolidieren.
Sternschema: Die einfachste Form des Data-Mart-Schemas und der häufigste Ansatz für die Entwicklung von Data Warehouses und dimensionalen Data Marts. Das Sternschema hat seinen Namen von der Ähnlichkeit des physischen Modells mit einer Sternform, in deren Zentrum eine Faktentabelle steht und die sie umgebenden Dimensionstabellen die Punkte des Sterns darstellen.
Saved Procedure: Ein Stapel von SQL-Anweisungen, die zur Ausführung einer bestimmten Aufgabe verwendet und von mehreren Clients mit unterschiedlichen Eingabedaten über ein Netzwerk gemeinsam genutzt werden können. Stored Procedures reduzieren den Netzwerkverkehr, erhöhen die Leistung und schützen vor SQL-Injections.
Surrogatschlüssel: Innerhalb einer Datenbank ist der Surrogatschlüssel ein systemweit eindeutiger Bezeichner. Der Wert eines Surrogatschlüssels hat in der Regel viele Eigenschaften, u. a. wird er nie von einem System oder einem Benutzer manipuliert, enthält keine semantische Bedeutung und besteht nicht aus mehreren Werten. Der Surrogatschlüssel wird nicht von Anwendungsdaten abgeleitet, im Gegensatz zu einem natürlichen (oder geschäftlichen) Schlüssel, der von Anwendungsdaten abgeleitet wird. Die Unabhängigkeit des Schlüssels von allen anderen Spalten isoliert die Datenbankbeziehungen von Änderungen der Datenwerte oder des Datenbankdesigns (wodurch die Datenbank flexibler wird) und garantiert die Einzigartigkeit.
Tabellenbeziehungen: Sie sind eine Schlüsselkomponente bei der Erstellung von Datensätzen, indem sie gemeinsame Felder in Tabellen, die miteinander in Beziehung stehen, abgleichen. Um die Datengenauigkeit zu gewährleisten und Redundanzen zu begrenzen, werden die Daten in themenbezogene Tabellen aufgeteilt, so dass jeder Sachverhalt nur einmal dargestellt wird. Anschliessend werden Tabellenbeziehungen definiert und gemeinsame Felder zugeordnet, um ein vollständiges Bild zu erstellen.
Verteilung des Berichts: Bezieht sich auf die Methode, mit der relevante Informationen auf manuelle oder automatisierte Weise an die entsprechenden Interessengruppen verteilt werden. Weitere Informationen darüber, wie Sie Ihren zeitaufwändigen Prozess der Berichtsverteilung automatisieren können, finden Sie in unserem Whitepaper "Intuitive Berichterstattung".
Vertriebs-Dashboard: Als eines der am häufigsten genutzten Beispiele für Business Intelligence sammeln und präsentieren Vertriebs-Dashboards relevante Vertriebsdaten wie Opportunities, Pipelines, Lead Funnels, Umsatz, Produktleistung, Prognosen, Kundenrentabilität und vieles mehr. Durch die kontinuierliche Anzeige von organisierten Vertriebsdaten können Unternehmen ihre notorisch wettbewerbsorientierten Vertriebsabteilungen bei der Kundenakquise unterstützen.
Visual Studio: Microsoft Visual Studio ist eine integrierte Entwicklungsumgebung (IDE). Es wird zur Entwicklung von Windows-Programmen sowie von Websites, Webanwendungen und Webdiensten verwendet. Es wird auch verwendet, um lokale Datenbankdateien für SQL zu erstellen.