Große Unternehmen stehen immer mehr vor der Herausforderung, ein effizientes Datenmanagement betreiben zu müssen; zum Teil müssen Petabyte an Daten organisiert werden. Daten kommen zudem aus verschiedenen Abteilungen und werden an diversen Stellen im Unternehmen benötigt. Darüber müssen die Daten vor unbefugten Zugriff bewahrt werden, aber dennoch erreichbar und auffindbar sein, wenn sie gebraucht werden.
An dieser Stelle kommt Amazon Datazone ins Spiel. Dieser Service steht seit Anfang Oktober 2023 in vielen AWS-Regionen zur Verfügung.
Amazon Datazone hilft dabei, die Daten von verschiedenen Datenquellen – die sowohl von innerhalb als auch außerhalb AWS kommen können – zu vereinen. Die Navigation zwischen den Daten wird erleichtert und sowohl robuste Governance als auch Zugriffsrechte können über diese Plattform eingehalten werden. Darüber hinaus ist eine Integration der AWS Tools für die Analyse wie Athena vorhanden.
Struktur von Amazon Datazone
Amazon Datazone bietet verschiedene Komponenten, um diese Ziele zu erreichen.
Zunächst kann man die Organisation in Domänen teilen. In jeder Domäne gibt es einen Datenkatalog, in dem die Metadaten gespeichert werden. Um Daten in einem Katalog hinzu zufügen, muss man sog. Datenprojekte anlegen. Diese Projekte verwalten, wer auf die Daten zugreifen kann. Als Producer kann man dort Datenquellen wie AWS-Glue-Tabellen einfügen, aber auch fremde Quellen wie Databricks und diese mit mehr Metadaten anreichern. Consumer können mit Hilfe der Projekte Daten analysieren.
Die meisten Funktionalitäten lassen sich über die AWS CLI steuern. Es wird mit jeder Datazone auch ein Web-Portal gehostet, welches dabei hilft, die Daten anhand von Metadaten oder Projektnamen zu finden.
Kurz und bündig
Amazon bringt mit Datazone ein neues Tool auf den Markt, das die Arbeit mit Daten unternehmensweit vereinfachen soll, ohne dass Zugriffsrechte zu offen oder zu restriktiv verteilt werden. Es sorgt dafür, das alle Datensätze in einem zentralen Ort erreichbar sind und bietet eine eigene Web-Platform, um Daten für alle auffindbar zu machen. Für größere Unternehmen ist es sicher einen Blick wert.
Schreibe einen Kommentar