Skip to main content

2024 | Buch

Schnelles und skalierbares Cloud-Datenmanagement

insite
SUCHEN

Über dieses Buch

Die enorme Datenmenge erfordert skalierbare Datenverwaltung für weltweiten Zugriff. Zahlreiche NoSQL-Systeme prägen die komplexe Landschaft. Dieses Buch bietet Überblick und Klassifikation im Cloud-Datenmanagement. Themen umfassen NoSQL-Speichersysteme, polyglotte Architekturen, verteilte Transaktionen, Web-Caching, Datenzugriff und Rendering-Performance. Die Klassifikation ermöglicht eine Betrachtung des Gesamtentwurfs und der Positionen jedes Systems. Ein anwendungsorientiertes Entscheidungshilfetool erleichtert die Auswahl geeigneter Systemkandidaten für bestimmte Anwendungsszenarien.

Inhaltsverzeichnis

Frontmatter
Kapitel 1. Einführung
Zusammenfassung
Heute wird die Web-Performance durch die Round-Trip-Latenzen zwischen Endgeräten und Cloud-Diensten bestimmt. Abhängig von ihrem Standort erleben Benutzer daher oft Latenz als Ladeverzögerungen beim Durchsuchen von Websites und Interagieren mit Inhalten aus Apps. Da die Latenz für die Ladezeiten von Seiten verantwortlich ist, beeinflusst sie stark die Benutzerzufriedenheit und zentrale Geschäftsmetriken wie Kundenbindungsquoten (customer retention rates) oder die auf einer Website verbrachte Zeit. Benutzer erwarten, dass Websites schnell laden und sofort reagieren. Allerdings sind Client-Geräte immer von Cloud-Backends durch ein physisches Netzwerk getrennt. Die Latenz für Daten, um zwischen Geräten und Cloud-Servern zu reisen, dominiert daher die wahrgenommene Leistung vieler aktueller Anwendungen.
Felix Gessert, Wolfram Wingerath, Norbert Ritter
Kapitel 2. Latenz in Cloud-basierten Anwendungen
Zusammenfassung
Der kontinuierliche Wandel hin zur Cloud-Computing hat zwei primäre Architekturen etabliert: Zwei-Schichten- und Drei-Schichten-Anwendungen. Beide Architekturen sind an verschiedenen Ebenen anfällig für Latenz. Die konkrete Realisierung kann auf verschiedenen Cloud-Modellen aufbauen, insbesondere Datenbank/Backend-as-a-Service, Plattform-as-a-Service und Infrastruktur-as-a-Service.
Felix Gessert, Wolfram Wingerath, Norbert Ritter
Kapitel 3. HTTP für global verteilte Anwendungen
Zusammenfassung
Für jede verteilte Anwendung spielt das Netzwerk eine bedeutende Rolle für die Leistung. Im Web ist das zentrale Protokoll HTTP (Hypertext Transfer Protocol), das bestimmt, wie Browser mit Webservern kommunizieren und das als Grundlage für REST-APIs (Representational State Transfer) verwendet wird. Für Cloud-Dienste über verschiedene Deployment- und Servicemodelle sind REST-APIs die Standard-Schnittstelle für den Zugriff auf Speicher- und Rechenressourcen sowie auf hochrangige Dienste. Die meisten DBaaS-, BaaS- und NoSQL-Systeme bieten native REST-APIs an, um ein hohes Maß an Interoperabilität zu erreichen und den Zugriff aus heterogenen Umgebungen zu ermöglichen. Dieses Kapitel überprüft relevante Grundlagen von HTTP und Netzwerk in Bezug auf Leistung und Latenz sowie ihre Rolle im Cloud-Datenmanagement. Insbesondere werden wir hervorheben, welche Herausforderungen das standardisierte Verhalten der Web-Caching-Infrastruktur für datenzentrierte Dienste darstellt.
Felix Gessert, Wolfram Wingerath, Norbert Ritter
Kapitel 4. Systeme für skalierbares Datenmanagement
Zusammenfassung
Unabhängig von der serverseitigen Architektur ist das skalierbare Datenmanagement die primäre Herausforderung für hohe Leistung. Geschäfts- und Präsentationslogik können durch zustandslose Verarbeitung oder durch Auslagern des Zustandsproblems auf einen gemeinsamen Datenspeicher skaliert werden. Daher hängen die Anforderungen an hohe Verfügbarkeit und elastische Skalierbarkeit von Datenbanksystemen ab.
Felix Gessert, Wolfram Wingerath, Norbert Ritter
Kapitel 5. Caching in Forschung und Industrie
Zusammenfassung
Caching-Technologie kann anhand mehrerer Dimensionen kategorisiert werden, wie in Abb. 5.1 dargestellt ist. Die erste Dimension ist der Standort des Caches. In diesem Buch konzentrieren wir uns auf für Cloud- und Datenbankanwendungen relevante Caches, insbesondere Server-seitiges und Datenbank-Caching, Reverse- und Forward-Proxy-Caching (Mid-Tier) und Client-Caching. Die zweite Dimension ist die Granularität der zwischengespeicherten Daten. Beispiele sind Dateien, Datenbanksätze und -seiten, Abfrageergebnisse und Seitenfragmente. Die dritte Dimension ist die Aktualisierungsstrategie, die das bereitgestellte Konsistenzniveau bestimmt.
Felix Gessert, Wolfram Wingerath, Norbert Ritter
Kapitel 6. Transaktionale Semantik für global verteilte Anwendungen
Zusammenfassung
In diesem Kapitel werden wir sowohl Konzepte als auch Systeme zur Transaktionsverarbeitung für Cloud-Datenmanagement und NoSQL-Datenbanken überprüfen. Wir werden eine kurze Diskussion zu jedem Ansatz führen und die Unterschiede zwischen ihnen zusammenfassen.
Felix Gessert, Wolfram Wingerath, Norbert Ritter
Kapitel 7. Polyglotte Persistenz im Datenmanagement
Zusammenfassung
Da Anwendungen immer datengetriebener und stark verteilt werden, wird es im Rahmen eines einzigen Datenbanksystems immer herausfordernder, immer mehr Benutzern niedrige Antwortzeiten zu bieten. Nicht nur die Vielfalt der Anwendungsfälle nimmt zu, sondern auch die Anforderungen werden heterogener: horizontale Skalierbarkeit, Schemaflexibilität und hohe Verfügbarkeit sind primäre Anliegen für moderne Anwendungen. Während RDBMS viele der funktionalen Anforderungen abdecken (z. B. ACID-Transaktionen und ausdrucksstarke Abfragen), können sie Skalierbarkeit, Leistung und Fehlertoleranz nicht auf die gleiche Weise abdecken wie spezialisierte Datenspeicher. Das explosive Wachstum verfügbarer Systeme durch die Big Data und NoSQL Bewegung hat die Idee entfacht, besonders gut geeignete Datenbanksysteme für Teilprobleme der Gesamtanwendung einzusetzen.
Felix Gessert, Wolfram Wingerath, Norbert Ritter
Kapitel 8. Die NoSQL-Toolbox: Die NoSQL-Landschaft im Überblick
Zusammenfassung
In diesem Kapitel beleuchten wir den Designraum von verteilten Datenbanksystemen, indem wir ihn nach den vier Dimensionen Sharding, Replikation, Speichermanagement und Anfrageverarbeitung unterteilen. Das Ziel ist es, einen umfassenden Satz von Datenmanagementanforderungen bereitzustellen, die bei der Gestaltung eines flexiblen Backends für global verteilte Webanwendungen berücksichtigt werden müssen. Daher untersuchen wir die Implementierungstechniken von Systemen und diskutieren, wie sie mit verschiedenen funktionalen und nicht-funktionalen Eigenschaften (Zielen) von Datenmanagementsystemen zusammenhängen.
Felix Gessert, Wolfram Wingerath, Norbert Ritter
Kapitel 9. Zusammenfassung und zukünftige Trends
Zusammenfassung
In diesem Buch haben wir zentrale Leistungsprobleme im gesamten Webanwendungs-Stack hervorgehoben: Die Leistung hängt vom Frontend-Rendering, von Netzwerk- und Caching-Infrastrukturen sowie der Datenspeicherung und der Geschäftslogik im Backend ab.
Felix Gessert, Wolfram Wingerath, Norbert Ritter
Metadaten
Titel
Schnelles und skalierbares Cloud-Datenmanagement
verfasst von
Felix Gessert
Wolfram Wingerath
Norbert Ritter
Copyright-Jahr
2024
Electronic ISBN
978-3-031-54388-3
Print ISBN
978-3-031-54387-6
DOI
https://doi.org/10.1007/978-3-031-54388-3

Premium Partner