A datová strukturaje architektura, která vytváří jednotnou, integrovanou vrstvu pro přístup k datům a jejich správu v rámci celé organizace, přičemž se zaměřuje na propojení a interoperabilitu.
Datová síť je naproti tomu decentralizovaný přístup, který s daty zachází jako s produktem a klade důraz na vlastnictví a správu jednotlivých týmů v závislosti na konkrétní doméně.
V tomto příspěvku si rozebereme základní koncepty, výhody, praktické aplikace a úvahy o každé metodice.
Na konci budete mít komplexní znalosti o těchto paradigmatech a budete vědět, jak činit informovaná rozhodnutí, abyste lépe využili sílu svých dat.
Pochopení datové sítě
Datová struktura je architektura a soubor datových služeb, které poskytují konzistentní funkce napříč spektrem koncových bodů v hybridních a multicloudových prostředích. Integruje různé procesy správy dat, včetně jejich vyhledávání, správy a orchestrace, přičemž s daty zachází jako s jedinou dostupnou vrstvou.
Jinými slovy, datová struktura je systém, který hladce propojuje a spravuje data, ať už jsou uložena uvnitř vlastních počítačů společnosti, nebo v různých cloudových službách. Zajišťuje, že bez ohledu na to, kde se vaše data nacházejí, k nim můžete snadno a spolehlivě přistupovat a používat je.
Základní principy Data Fabric
Základní principy datové struktury se soustředí na agilitu, flexibilitu a jednotný pohled na data v rámci celého podniku.
- Agilita: Datová struktura umožňuje rychlé přizpůsobení novým zdrojům dat a vyvíjejícím se obchodním potřebám.
- Flexibilita: Podporuje širokou škálu zdrojů dat, typů a úložišť.
- Jednotný pohled: Poskytuje holistický přístup ke správě dat a umožňuje přístup ke všem datům v rámci organizace.
Architektura Data Fabric
Architektura datové struktury je základem strategie s několika klíčovými prvky.
- Datové kanály: Automatizované kanály se starají o příjem, transformaci a přesun dat.
- Správa dat: Zásady zajišťují kvalitu dat, ochranu soukromí a dodržování předpisů.
- Orchestrace dat: Koordinovaný přístup spravuje data napříč systémy.
Příklad datové sítě
Vezměme si příklad nadnárodní společnosti poskytující finanční služby, která potřebuje integrovat, spravovat a zpřístupňovat data napříč několika globálními divizemi, včetně bankovnictví, investic a pojišťovacích služeb.
Tato společnost čelí výzvě přístupu k datům, jejich analýze a správě, která se nacházejí v různých systémech a platformách, včetně cloudových prostředí, lokálních datových center a datových služeb třetích stran. Pro řešení těchto problémů společnost implementuje architekturu datové struktury, která umožňuje:
- Bezproblémová integrace dat: Datová struktura integruje data z různých zdrojů, včetně transakčních databází, systémů CRM, zdrojů tržních dat a služeb cloudových úložišť. Tuto integraci usnadňuje virtualizace dat a technologie ETL (Extract, Transform, Load), které umožňují přístup k datům a manipulaci s nimi v reálném čase a v některých případech i bez nutnosti fyzického přesunu nebo replikace dat mezi systémy nebo datovými týmy.
- Jednotná správa a kvalita dat: Přístup založený na datové struktuře zahrnuje centralizovanou datovou architekturu, která uplatňuje konzistentní zásady kvality, ochrany soukromí a zabezpečení dat ve všech zdrojích dat. To může zahrnovat mechanismy pro klasifikaci dat, sledování datové linie a monitorování shody.
- Samoobslužný přístup k datům: Architektura poskytuje samoobslužnou datovou platformu a nástroje pro zjišťování dat pro podnikové uživatele, což snižuje překážky v IT a umožňuje rychlejší rozhodování. Uživatelé se mohou dotazovat a vizualizovat data v rámci celého podniku prostřednictvím jednotného rozhraní bez ohledu na to, kde se data fyzicky nacházejí.
Výsledek
Zavedením datové struktury může společnost poskytující finanční služby získat ucelený pohled na svá datová aktiva, zlepšit provozní efektivitu a posílit možnosti rozhodování.
Architektura umožňuje společnosti efektivněji řídit rizika, poskytovat zákazníkům personalizované služby a podporovat inovace, a to vše při zachování vysokých standardů správy dat a dodržování předpisů.
Porozumění datové síti
Přístup datové sítě získává na popularitě jako decentralizovaný sociotechnický rámec pro správu analytických dat ve velkém měřítku. Datová síť uznává data jako produkt a zdůrazňuje význam decentralizovaného vlastnictví dat a architektury orientované na doménu.
V tomto rámci je každá doména v rámci organizace zodpovědná za poskytování a údržbu svých dat jako produktu, čímž se doménové týmy stávají odpovědnými za kvalitu a dostupnost dat.
Zásady datové sítě
- Vlastnictví a architektura dat orientovaná na doménu: Datová síť prosazuje návrh, v němž jsou data spravována týmy pro konkrétní doménu, což podporuje jasnější pochopení kontextu a využití dat.
- Samoobslužná datová infrastruktura jako platforma: Cílem je vytvořit samoobslužnou datovou platformu, která umožní doménovým týmům snadno vytvářet vlastní datové produkty a usnadní zjišťování dat bez hlubokých technických znalostí v oblasti distribuovaných datových systémů.
- Interoperabilita a standardní komunikace: Datová síť obvykle prosazuje standardizované protokoly, aby bylo zajištěno, že různé datové produkty spolu mohou bezproblémově komunikovat a integrovat se.
- Správa prostřednictvím pozorovatelnosti: Datová síť bude mít obecně decentralizovanou správu dat, která bude využívat globální pohled na všechny domény, aby zajistila soulad, standardizaci a kvalitu.
Organizační aspekty datové sítě
Zavedení datové sítě vyžaduje, aby organizace přijala kulturní změnu směrem k demokratizaci dat a přehodnotila tradiční role a odpovědnosti.
- Zplnomocnění k odbornosti v dané oblasti: Týmy musí mít dovednosti a znalosti, aby mohly samostatně spravovat své datové produkty.
- Technické investice: Základem pro zavedení datové sítě je infrastruktura, která podporuje samoobslužné funkce.
- Řízení změn: Organizace se musí připravit na změny v řízení a procesech, které provázejí přechod na přístup založený na datové síti.
Příklad datové sítě
Vezměme si za příklad velkou společnost zabývající se elektronickým obchodem, která působí celosvětově a má několik produktových řad, včetně elektroniky, domácího zboží, oblečení a potravin. Tato společnost se potýká s datovými silami v různých odděleních, což vede k neefektivitě, nekonzistentní analýze dat a problémům s rychlými inovacemi, které mají uspokojit potřeby zákazníků.
Aby tyto problémy překonala, přijala společnost architekturu datové sítě, která klade důraz na decentralizované vlastnictví dat a doménově orientovanou datovou architekturu.
Scénář provádění
Každá produktová řada je považována za samostatnou oblast s vlastními datovými produkty, které vlastní a spravují multifunkční týmy složené z členů IT, datové vědy, provozu a obchodních jednotek.
- Vlastnictví dat podle domén: Divize elektroniky, domácího zboží, oděvů a potravin přebírají odpovědnost za svá data, včetně jejich kvality, správy a řízení životního cyklu. Tento posun umožňuje týmům činit rychlá a informovaná rozhodnutí na základě jejich datových poznatků.
- Samoobslužná datová infrastruktura: Společnost investuje do vybudování samoobslužné datové platformy, která umožňuje každému týmu v dané oblasti přistupovat k datům, zpracovávat je a analyzovat bez velké závislosti na centrálních zdrojích IT. Tato platforma zahrnuje nástroje pro příjem, zpracování, ukládání a analýzu dat, které jsou přizpůsobeny potřebám jednotlivých oblastí.
- Interoperabilita a standardizovaná komunikace: Navzdory decentralizaci společnost zavádí společné standardy pro datové formáty, rozhraní API a protokoly, aby zajistila interoperabilitu mezi datovými produkty různých domén. To umožňuje bezproblémové sdílení a integraci dat, což usnadňuje analýzu a získávání poznatků napříč oblastmi.
- Data jako produkt: Každá oblast přistupuje ke svým datům jako k produktu, přičemž se zaměřuje na potřeby uživatelů, použitelnost a hodnotu. To zahrnuje definování jasných specifikací datových produktů, vedení dokumentace a zajištění toho, aby byly datové produkty zjistitelné a přístupné ostatním oblastem a zúčastněným stranám ve společnosti.
- Řízení prostřednictvím pozorovatelnosti: Společnost zavádí federativní model řízení, který vyvažuje autonomii a odpovědnost. Každá doména je odpovědná za dodržování celopodnikových standardů správy dat, zatímco centralizovaný rámec sledovatelnosti monitoruje soulad, kvalitu dat a jejich používání ve všech datových produktech.
Výsledek
Zavedení datové sítě umožňuje společnosti zabývající se elektronickým obchodem odbourat datová sila a zlepšit spolupráci a inovace napříč různými produktovými řadami. Tím, že společnost umožňuje týmům v jednotlivých doménách spravovat svá data nezávisle, dosahuje rychlejšího uvádění nových funkcí a služeb na trh, lepší personalizace pro zákazníky a pružnější reakce na změny na trhu.
Standardy interoperability a federativní model správy zároveň zajišťují, že data zůstávají jednotným strategickým aktivem v rámci celé společnosti.
Srovnání datové sítě Data Fabric a Data Mesh
Podobnosti:
- Cílem obou je zlepšit dostupnost a použitelnost dat v celém podniku.
- Podporují architektonický přístup ke správě dat.
- Nejsou vázány na konkrétní technologii, ale představují koncepční rámce.
Rozdíly
Volba mezi datovou sítí a datovou sítí: stručný průvodce
Rozhodování mezi datovou strukturou a datovou sítí závisí na konkrétních potřebách, výzvách a stávajících možnostech správy dat ve vaší organizaci.
Zde je několik úvah, které vám pomohou určit, který přístup by mohl být vhodnější.
Zvažte datovou strukturu, pokud vaše organizace:
- Má komplexní, distribuované datové prostředí s potřebou bezproblémového přístupu a integrace dat z různých zdrojů, prostředí (cloud, on-premises, edge) a platforem.
- Upřednostňuje jednotný pohled na data v rámci celé organizace, aby podpořil analytické úsilí, datovou vědu a business intelligence, aniž by bylo nutné přepracovávat stávající infrastrukturu.
- Čelí problémům se správou a kvalitou dat v různých systémech a potřebuje centralizovaný mechanismus k zajištění konzistence, shody a kontroly.
- Hledá škálovatelnost a flexibilitu při správě dat a zároveň minimalizuje složitost pro koncové uživatele, včetně netechnických zainteresovaných stran.
Zvažte datovou síť, pokud vaše organizace:
- Pracuje v doménově orientovaném prostředí, kde různé obchodní jednotky nebo týmy mají odlišné datové potřeby a mohly by mít prospěch z vlastnictví a správy svých datových produktů.
- Naráží na úzká místa v přístupu k datům a jejich využívání v důsledku centralizované správy dat, což zpomaluje inovace a rozhodování.
- Cílem je podpořit kulturu demokratizace dat a odpovědnosti a umožnit týmům inovovat a rozhodovat se na základě svých místních datových poznatků.
- Vyspěl ve svých digitálních a datových schopnostech a má týmy, které jsou schopny zvládnout technologické a provozní povinnosti, které jsou spojeny s decentralizovaným vlastnictvím dat.
Obecné pokyny
- Velikost a složitost organizace: Větší a složitější organizace s různými zdroji dat a přísnými požadavky na správu se mohou přiklonit k datové struktuře kvůli jejím integračním a centralizovaným funkcím správy. Naopak pro organizace se silnou kulturou autonomie a agility, kde obchodní jednotky fungují nezávisleji, může být datová síť přitažlivější.
- Vyspělost správy dat: Pokud vaše organizace stále vyvíjí své postupy správy dat, může začít s datovou strukturou, která poskytne základní vrstvu integrace a správy. S rostoucí vyspělostí může začlenění principů datové sítě dále posílit autonomii a inovace.
Podtrženo, sečteno
Srovnejte výběr se svými strategickými cíli. Pokud je cílem zvýšit efektivitu, omezit provozní sila a zlepšit správu dat ve velkém měřítku, je datová struktura pravděpodobně nejlepší volbou. Pokud je cílem zvýšit inovace, urychlit rozhodování a posílit autonomii týmů v oblasti dat, zvažte datovou síť.
Bloor Spotlight:
Data Fabric Overview (Přehled datové sítě)
Podrobnější technická srovnání
Přístup k datům a jejich správa
Datová struktura je navržena tak, aby poskytovala jednotnou a konzistentní vrstvu přístupu k datům a jejich správy napříč různými zdroji dat, včetně lokálních databází, cloudových úložišť a dokonce i okrajových zařízení.
Využívá technologie, jako je virtualizace dat a federativní zpracování dotazů, aby umožnila přístup k datům z těchto různorodých zdrojů v reálném čase a jejich integraci, aniž by bylo nutné data replikovat do centralizovaného umístění.
Řešení datové struktury často využívají pokročilé techniky správy metadat a inteligentní vyhledávací funkce, které usnadňují vyhledávání a správu dat v rámci celé organizace.
Datová síť naopak decentralizuje správu dat tím, že k datům přistupuje jako k produktu, přičemž týmy v jednotlivých doménách vlastní a spravují svá data.
Každý tým je zodpovědný za životní cyklus svých dat, včetně jejich ukládání, kvality a dostupnosti, přičemž využívá technologie, které nejlépe odpovídají jeho doméně. Datová struktura je navržena tak, aby poskytovala jednotnou a konzistentní vrstvu přístupu k datům a jejich správy napříč různými zdroji dat, včetně lokálních databází, cloudových úložišť a dokonce i okrajových zařízení.
Ukládání a zpracování dat
Architektury datových sítí často využívají datové jezero, více datových skladů a řešení pro ukládání dat ve více cloudech, integrovaná prostřednictvím jednotné datové vrstvy.
Toto nastavení podporuje dávkové zpracování dat i zpracování dat v reálném čase, analytické postupy a strojové učení, což organizacím umožňuje získávat poznatky ze svých dat bez ohledu na to, kde se nacházejí.
Přístupdatových sítí obvykle nepředepisuje konkrétní technologie ukládání nebo zpracování dat.
Místo toho se zaměřuje na to, aby si každá doména mohla vybrat nástroje a infrastrukturu, které nejlépe vyhovují jejím potřebám, ať už jde o tradiční relační databázi, databázi NoSQL pro nestrukturovaná data nebo stroje pro zpracování dat v reálném čase, jako je Apache Kafka nebo Apache Spark.
Důraz je kladen na to, aby doménové týmy mohly vytvářet a spravovat své datové produkty nezávisle, se zaměřením na požadavky specifické pro danou doménu, nikoli na univerzální řešení.
Technické výzvy v oblasti interoperability
Interoperabilita je kritickým aspektem jak pro systémy datových struktur, tak pro systémy datových sítí, i když se k nim přistupuje z různých úhlů pohledu.
Datové struktury řeší interoperabilitu prostřednictvím implementace standardizovaných rozhraní API, datových modelů a protokolů v rámci své integrované vrstvy pro správu dat.
To vyžaduje značné počáteční plánování a průběžnou správu, aby bylo zajištěno, že nové a stávající zdroje dat lze bezproblémově integrovat a přistupovat k nim prostřednictvím struktury.
Datové sítě řeší interoperabilitu přijetím zásad návrhu řízeného doménou, což podporuje používání společných datových formátů, rozhraní API a protokolů pro datové produkty.
Tato decentralizovaná datová architektura vyžaduje silný organizační závazek ke standardizaci a správě, aby se zabránilo vzniku datových sil a zajistilo se, že datové produkty lze snadno sdílet a integrovat přes hranice domén.
Obě architektury f
InterSystems a inteligentní datové sítě: umožnění pokročilé správy dat
Řešení InterSystems IRIS a Data Fabric Studio představují komplexní řešení navržená tak, aby uvolnila skutečný potenciál dat pro podniky, které se potýkají s rostoucím objemem, rozmanitostí a složitostí svých datových aktiv.
Řešením převládajících problémů datových a aplikačních sil tato řešení usnadňují integrovanější, efektivnější a operativnější přístup k datům v rámci organizací.
InterSystems a Data Fabric
Společnost InterSystems nabízí dvě výkonná řešení pro implementaci architektur datových tkanin:
InterSystems IRIS
InterSystems IRIS slouží jako základní technologie v rámci architektury datové struktury díky svým komplexním možnostem správy dat. Klíčové vlastnosti:
Integrace a správa dat
InterSystems IRIS poskytuje robustní možnosti integrace dat z různých zdrojů, takže se výborně hodí pro jednotnou vrstvu přístupu k datům a jejich správy, která je pro Data Fabric klíčová. Její schopnost pracovat s datovými modely SQL i NoSQL a podpora transakcí a souběžné analytiky dobře odpovídá potřebám flexibility a škálovatelnosti datové struktury.
Analytika v reálném čase a strojové učení
Díky integrované podpoře analytiky v reálném čase, business intelligence a strojového učení může InterSystems IRIS začlenit pokročilé analytické funkce přímo do datové struktury, což umožňuje rychlejší vhled a rozhodování v rámci celé organizace.
Interoperabilita a konektivita
Silné funkce interoperability platformy umožňují snadné propojení mezi různými systémy a zdroji dat, což je kritický požadavek pro vytvoření bezproblémové datové struktury. To zahrnuje podporu různých datových standardů a protokolů, což usnadňuje komunikaci v různých prostředích a aplikacích.
InterSystems Data Fabric Studio
InterSystems Data Fabric Studio je specializované řešení, které zjednodušuje implementaci a správu architektur datových sítí. Nabízí:
Jednotný přístup k datům
Poskytuje jediný přístupový bod ke všem podnikovým datům bez ohledu na jejich umístění nebo formát, což umožňuje bezproblémovou integraci a správu dat v rámci celé organizace.
Vizuální vývojové prostředí
Nabízí intuitivní rozhraní pro navrhování a implementaci řešení datové struktury, což snižuje složitost a zrychluje dobu vývoje.
Pokročilé datové služby
Poskytuje vestavěné funkce pro transformaci dat, správu kvality a řízení, čímž zajišťuje konzistentní a spolehlivá data v rámci celého podniku.
Škálovatelná architektura
Podporuje rostoucí objemy dat a vyvíjející se obchodní potřeby díky vysoce škálovatelné a flexibilní architektuře.
Zpracování v reálném čase
Umožňuje zpracování a analýzu dat v reálném čase, podporuje
InterSystems a Data Mesh
Zatímco Data Mesh klade důraz na decentralizované vlastnictví dat a návrh řízený doménou, řešení InterSystems mohou hrát podpůrnou roli, zejména v těchto aspektech:
Datové služby specifické pro doménu
K vývoji a správě datových služeb specifických pro doménu lze využít jak možnosti InterSystems IRIS, tak Data Fabric Studio, které podporují autonomii doménových týmů při správě jejich datových produktů. Jejich škálovatelnost a výkonnost mohou sloužit vysokým nárokům doménově orientovaných operací.
Správa dat a pozorovatelnost
Ačkoli Data Mesh prosazuje decentralizovanou správu, řešení InterSystems tento model podporují tím, že poskytují nástroje pro kvalitu dat, zabezpečení a dodržování předpisů, které mohou využívat jednotlivé domény, a také funkce pozorovatelnosti pro sledování stavu a využívání datových produktů v celé síti.
Další kroky
Komplexní řešení společnosti InterSystems pro správu dat ztělesňují budoucnost správy dat, úzce se shodují s principy Smart Data Fabrics a nabízejí potenciální cesty k implementaci architektur datových sítí.
Díky důrazu na integraci analytiky, kompatibilitu se staršími systémy a vysoce výkonné funkce tato řešení otevírají organizacím cestu k dosažení nové úrovně efektivity, přehledu a hodnoty jejich datových aktiv.