Referenčná architektúra cloudového dátového skladu pre MS Azure
![](/data/att/508/9374.8eb013.jpg)
Dátové skladovanie v tradičnom on-premise svete je dobre prepracovaná a preštudovaná disciplína. So všetkými logickými a fyzickými architektúrami, technikami a metodológiami dátového modelovania, priemyselnými dátovými modelmi, obchodnými glosármi a princípmi správy dát možno nájsť množstvo návodov, ako správne zostaviť riešenie. Referenčná architektúra cloudového dátového skladu pre MS Azure
Dátové sklady v tradičnom on-premise svete sú dobre prepracovanou a študovanou disciplínou. So všetkými logickými a fyzickými architektúrami, technikami a metodológiami dátového modelovania, priemyselnými dátovými modelmi, obchodnými glosármi a princípmi správy dát je možné nájsť množstvo návodov, ako správne zostaviť riešenie.So vznikajúcimi cloudovými technológiami a rôznymi možnosťami však môže byť hľadanie osvedčených postupov a overenej architektúry pre cloud náročné. Preto je potrebné vyvážiť možnosti z hľadiska praktickosti, udržateľnosti a doby uvedenia na trh.
Zjednodušená referenčná architektúra
Nasledujúca schéma zobrazuje osvedčené postupy pre sadu nástrojov, ktoré zahŕňajú potrebné funkčné bloky.
- Príjem údajov zo zdrojov si zvyčajne vyžaduje rýchlu a spoľahlivú replikáciu pre nákladovo efektívne úložisko. Použitie Azure Data Factory a/alebo Pipelines na replikáciu údajov do úložiska Azure Data Lake je určite dobrá voľba
- Dátové kanály s väčšinou obchodnej logiky pre typické jadro dátového skladu vyžadujú implementáciu komplexnej logiky transformácie. Aj tu je použitie Azure Data Factory a/alebo Pipelines a ukladanie údajov buď v Azure Synapse alebo Azure SQL Database veľmi opodstatneným rozhodnutím.
- Na účely streamovania údajov, ak by bola potrebná integrácia v reálnom čase, je veľmi dobrou praxou pracovať s Azure Event Hub a Azure Stream Analytics a šíriť údaje do Azure Cosmos DB.
- Vytváranie prehľadov, veda o údajoch a strojové učenie sú zvyčajne záležitosťou vkusu. Azure ich však podporuje pomocou funkcií MS PowerBI a Azure Machine Learning
- V neposlednom rade sú možnosti správy údajov Azure väčšinou podporované službou Azure Purview
![Adele Adastra](/data/files/1468_adele-adastra.png)
Ako ADELE pomáha urýchliť migráciu?
Vyššie uvedený diagram popisuje referenčnú architektúru nielen pre dátový sklad, ktorý sa buduje od nuly. Rovnaké princípy architektúry možno použiť na migrovaný/replatformovaný starý dátový sklad. S dedičstvom sa však veci stávajú komplikovanejšími.
Čo robiť s existujúcimi historickými údajmi? Ako sa uistiť, že všetky funkcie, úlohy ETL a dátové kanály sú správne migrované s rovnakým správaním?
Tu je ADELE najužitočnejšia. Pochopenie staršieho dátového skladu, zber metadát a poskytovanie možností automatického generovania pre Azure Data Factory a/alebo Pipelines.
![Adele Adastra2](/data/files/1469_adele-adastra2.png)
Prihláste sa na Jesenná ITAPA 2024