O data fabric é uma arquitetura que cria uma camada unificada e integrada para acessar e gerenciar dados em toda a empresa, com foco na conetividade e interoperabilidade.
Um data mesh, por outro lado, é uma abordagem descentralizada que trata os dados como um produto, enfatizando a propriedade e a governança específicas do domínio por equipes individuais.
Neste post, vamos analisar os principais conceitos, vantagens, aplicações práticas e considerações de cada metodologia.
No final, você terá uma compreensão abrangente desses paradigmas e saberá como tomar decisões informadas para aproveitar melhor o poder dos seus dados.
Entendendo o Data Fabric
Um data fabric é uma arquitetura e um conjunto de serviços de dados que fornecem capacidades consistentes num espectro de pontos finais em ambientes híbridos e multi-nuvem. Ele integra diferentes processos de gestão de dados, incluindo a descoberta de dados e a governança, tratando os dados como uma camada única e acessível.
Em outras palavras, um data fabric é um sistema que liga e gere os dados, estejam eles armazenados nos computadores da própria empresa ou em diferentes serviços na nuvem. Garante que, independentemente do local onde se encontrem os seus dados, você consiga acessa-los de forma fácil e confiável.
Princípios fundamentais do Data Fabric
Os princípios fundamentais de um data fabric centram-se na agilidade, flexibilidade e numa visão unificada dos dados em toda a empresa.
- Agilidade: O data fabric permite uma rápida adaptação a novas fontes de dados e à evolução das necessidades da empresa.
- Flexibilidade: suporta uma vasta gama de fontes de dados, tipos e locais de armazenamento.
- Visão unificada: Proporciona uma abordagem holística à gestão de dados, permitindo o acesso a todos os dados de uma organização.
Arquitetura do Data Fabric
O data fabric sustenta a estratégia com vários componentes-chave.
- Pipelines de dados: Os pipelines automatizados tratam da ingestão, transformação e movimentação de dados.
- Governança de dados: As políticas garantem a qualidade, a privacidade e a conformidade dos dados.
- Orquestração de dados: Uma abordagem coordenada gere os dados entre sistemas.
Exemplo de data fabric
Considere o exemplo de uma empresa multinacional de serviços financeiros que precisa integrar, gerir e acessar a dados em várias divisões globais, incluindo serviços bancários, investimentos e seguros.
Esta empresa enfrenta o desafio de acessar, analisar e gerir dados que residem em diferentes sistemas e plataformas, incluindo ambientes de nuvem, centros de dados locais e serviços de dados de terceiros. Para enfrentar estes desafios, a empresa implementa uma arquitetura de data fabric que permite:
- Integração perfeita de dados: O data fabric integra dados de várias fontes, incluindo bases de dados transacionais, sistemas CRM, feeds de dados de mercado e serviços de armazenamento na nuvem. Esta integração é facilitada pelas tecnologias de virtualização de dados e ETL (Extract, Transform, Load), permitindo o acesso e a manipulação de dados em tempo real e, em alguns casos, sem necessidade de mover ou replicar fisicamente os dados entre sistemas ou equipas de dados.
- Governança e qualidade unificadas dos dados: A abordagem do data fabric incorpora uma arquitetura de dados centralizada que aplica políticas consistentes de qualidade, privacidade e segurança dos dados em todas as fontes de dados. Isto pode incluir mecanismos de classificação de dados, rastreio da linhagem de dados e monitoramento da conformidade.
- Acesso aos dados self-service: A arquitetura fornece uma plataforma de dados self-service e ferramentas de descoberta para os usuários empresariais, reduzindo possiveis dificuldades do time de TI e permitindo tomadas de decisões mais rápidas. Os usuários podem consultar e visualizar dados em toda a empresa através de uma interface unificada, independentemente do local onde os dados residem fisicamente.
Resultado
Ao implementar um data fabric, a empresa de serviços financeiros pode obter uma visão holística dos seus ativos de dados, melhorar a eficiência operacional e melhorar as capacidades de tomada de decisões.
A arquitetura permite à empresa gerir o risco de forma mais eficaz, fornecer serviços personalizados aos clientes e impulsionar a inovação, mantendo simultaneamente elevados padrões de governança e conformidade dos dados.
Entendendo o Data Mesh
A abordagem do data mesh está ganhando força como uma estrutura sociotécnica descentralizada para gerir dados analíticos em escala. Um data mesh reconhece os dados como um produto, realçando a importância da propriedade e da arquitetura descentralizadas dos dados orientadas para a equipe.
Nesta estrutura, cada equipe de uma organização é responsável por fornecer e manter os seus dados como um produto, tornando-as responsáveis pela qualidade e acessibilidade dos dados.
Princípios do Data Mesh
- Propriedade e arquitetura de dados orientadas para a equipe: Um data mesh defende que os dados são geridos por equipes específicas de uma única área, promovendo uma compreensão mais clara do contexto e da utilização dos dados.
- Infraestrutura de dados self-service como plataforma: O objetivo é estabelecer uma plataforma de dados self-service que permita às equipes construir facilmente os seus próprios produtos de dados e facilitar a descoberta de dados sem conhecimentos técnicos profundos em sistemas de dados distribuídos.
- Interoperabilidade e comunicação normalizada: Um data mesh aplica normalmente protocolos normalizados para garantir que diferentes produtos de dados possam comunicar e integrar-se uns com os outros sem problemas.
- Governança através da observabilidade: Um data mesh terá geralmente uma governança de dados descentralizada, empregando uma visão global de todos os times para garantir a conformidade, a normalização e a qualidade.
Considerações organizacionais sobre o data mesh
A implementação de um data mesh exige que uma organização adote uma mudança cultural no sentido da democratização dos dados e de uma reformulação das funções e responsabilidades tradicionais.
- Capacitação de especialistas na equipe: As equipes devem ter as competências e os conhecimentos necessários para gerir os seus produtos de dados de forma autônoma.
- Investimento técnico: Uma infraestrutura que suporte capacidades de autosserviço é fundamental para a implementação de um data mesh.
- Gestão da mudança: As organizações devem preparar-se para as mudanças de governança e de processos que acompanham a transição para uma abordagem de um data mesh.
Exemplo de data mesh
Considere o exemplo de uma grande empresa de comércio eletrônico que opera globalmente com várias linhas de produtos, incluindo eletrônica, artigos para o lar, vestuário e mercearias. Esta empresa tem dificuldades com reservatórios de dados em diferentes departamentos, o que leva a ineficiências, análises de dados inconsistentes e desafios na inovação rápida para satisfazer as necessidades dos clientes.
Para superar estes desafios, a empresa adota uma arquitetura de data mesh, enfatizando a propriedade descentralizada de dados e a arquitetura de dados orientada para o domínio.
Cenário de implementação
Cada linha de produtos é tratada como um domínio distinto com os seus próprios produtos de dados, detidos e geridos por equipes multifuncionais que incluem membros de TI, cientistas de dados, operações e unidades de negócio.
- Propriedade de dados orientada para o domínio: As divisões de eletrônica, artigos para o lar, vestuário e mercearias são responsáveis pelos seus dados, incluindo a sua qualidade, governança e gestão do ciclo de vida. Esta mudança permite que as equipes tomem decisões rápidas e informadas com base nas informações dos seus dados.
- Infraestrutura de dados de auto-atendimento: A empresa investe na criação de uma plataforma de dados de auto-atendimento que permite a cada equipe acessar, processar e analisar dados sem depender de recursos de TI centrais. Esta plataforma inclui ferramentas para ingestão, processamento, armazenamento e análise de dados, adaptadas às necessidades de cada time.
- Interoperabilidade e comunicação padronizada: Apesar da descentralização, a empresa estabelece padrões comuns para formatos de dados, APIs e protocolos para garantir a interoperabilidade entre produtos de dados de diferentes domínios. Isto permite o compartilhamento e a integração de dados sem descontinuidades, facilitando a análise e o compartilhamento de conhecimento entre equipes.
- Dados como um produto: Cada equipe trata os seus dados como um produto, centrando-se nas necessidades dos usuários, na usabilidade e no valor. Isto inclui a definição de especificações claras dos produtos de dados, a manutenção da documentação e a garantia de que os produtos de dados são detectáveis e acessíveis a outros times e partes interessadas da empresa.
- Governança através da observabilidade: A empresa implementa um modelo de governança que equilibra a autonomia com a responsabilidade. Cada equipe é responsável pela adesão às normas de governança de dados de toda a empresa, enquanto uma estrutura de observabilidade centralizada monitora a conformidade, a qualidade dos dados e a utilização em todos os produtos de dados.
Resultado
A adoção de um data mesh permite que a empresa de comércio eletrônico elimine os repositórios de dados, melhorando a colaboração e a inovação nas suas diversas linhas de produtos. Ao capacitar as equipes de áreas específicas para gerirem os seus dados de forma independente, a empresa consegue um tempo de colocação no mercado mais rápido para novas funcionalidades e serviços, uma melhor personalização dos clientes e respostas mais ágeis às mudanças do mercado.
Ao mesmo tempo, as normas de interoperabilidade e o modelo de governança garantem que os dados permaneçam um ativo coeso e estratégico em toda a empresa.
Comparação entre Data Fabric e Data Mesh
Semelhanças:
- Ambos têm como objetivo melhorar a acessibilidade e a facilidade de utilização dos dados em toda a empresa.
- Incentivam uma abordagem arquitetônica da gestão de dados.
- Não estão ligados a uma tecnologia específica, mas são quadros conceituais.
Diferenças
Escolher entre Data Fabric ou Data Mesh: um guia rápido
Decidir entre um data fabric e um data mesh depende das necessidades específicas da sua organização, dos desafios e das capacidades de gestão de dados existentes.
Aqui estão algumas considerações para ajudar a determinar qual a abordagem mais adequada.
Considere o data fabric se a sua empresa:
- Tem um cenário de dados complexo e distribuído com a necessidade de acessar e integrar dados em várias fontes, ambientes (nuvem e local) e plataformas sem problemas.
- Dá prioridade a uma visão unificada dos dados em toda a organização para apoiar os esforços de análise, ciência de dados e business intelligence sem querer reformular a infraestrutura existente.
- Enfrenta desafios na governança e qualidade dos dados em sistemas diferentes e necessita de um mecanismo centralizado para garantir a consistência, conformidade e controle.
- Procura escalabilidade e flexibilidade na gestão de dados, minimizando a complexidade para os usuários finais, incluindo as partes interessadas não técnicas.
Considere a possibilidade de data mesh se a sua organização:
- Funciona num ambiente orientado por equipes em que diferentes unidades de negócio ou times têm necessidades de dados distintas e beneficiariam da propriedade e gestão dos seus produtos de dados.
- Encontra dificuldades no acesso e utilização de dados devido a práticas de gestão de dados centralizadas, atrasando a inovação e a tomada de decisões.
- Visa promover uma cultura de democratização dos dados e de responsabilização, dando às equipes a possibilidade de inovar e tomar decisões com base nos seus dados locais.
- Amadureceu as suas capacidades digitais e de dados, com equipes capazes de lidar com as responsabilidades tecnológicas e operacionais decorrentes da propriedade descentralizada de dados.
Orientações gerais
- Tamanho e complexidade da organização: Organizações maiores e mais complexas com diversas fontes de dados e requisitos de governação rigorosos podem inclinar-se para um data fabric pelas suas caraterísticas de gestão integradora e centralizada. Por outro lado, as organizações com uma forte cultura de autonomia e agilidade, em que as unidades de negócio operam de forma mais independente, podem considerar o data mesh uma escolha mais atrativa.
- Maturidade na gestão de dados: Se a sua organização ainda está a desenvolver as suas práticas de gestão de dados, começar com um data fabric pode fornecer a camada fundamental de integração e governação necessária. À medida que a maturidade aumenta, a incorporação de princípios de data mesh pode reforçar ainda mais a autonomia e a inovação.
A conclusão
Alinhe a escolha com os seus objetivos estratégicos. Se o objetivo é melhorar a eficiência, reduzir os silos operacionais e melhorar a governação dos dados em grande escala, um data fabric é provavelmente a sua melhor aposta. Se o objetivo é aumentar a inovação, acelerar a tomada de decisões e capacitar as equipes com autonomia de dados, considere um data mesh.
Bloor Spotlight:
Visão geral do Data Fabric
Comparações técnicas mais aprofundadas
Acesso e gestão de dados
Um data fabric foi concebido para fornecer uma camada unificada e consistente de acesso e gestão de dados em diversas fontes de dados, incluindo bases de dados no local, armazenamento na nuvem e até dispositivos de ponta.
Aproveita tecnologias como a virtualização de dados e o processamento de consultas para permitir o acesso em tempo real e a integração de dados a partir destas fontes variadas, sem necessidade de replicar os dados numa localização centralizada.
As soluções de data fabric utilizam frequentemente técnicas avançadas de gestão de metadados e capacidades de pesquisa inteligente para facilitar a descoberta e a governança de dados em toda a organização.
m contrapartida, um data mesh descentraliza a gestão de dados, tratando-os como um produto, com equipes específicas que possuem e gerem os seus dados.
Cada equipe é responsável pelo ciclo de vida dos seus dados, incluindo o seu armazenamento, qualidade e acessibilidade, utilizando tecnologias que melhor se adequam às suas necessidades.
Armazenamento e processamento de dados
As arquiteturas de data fabric empregam frequentemente um data lake, vários armazéns de dados e soluções de armazenamento multi-nuvem, integrados através de uma camada de dados unificada.
Esta configuração suporta fluxos de trabalho de processamento de dados em lote e em tempo real, análise e aprendizagem automática, permitindo às organizações obter informações dos seus dados, independentemente do local onde residem.
Uma abordagem de data mesh normalmente não prescreve tecnologias específicas de armazenamento ou processamento.
Em vez disso, concentram-se em permitir que cada time escolha as ferramentas e a infraestrutura que melhor satisfazem as suas necessidades, quer seja uma base de dados relacional tradicional, uma base de dados NoSQL para dados não estruturados ou motores de processamento em tempo real como o Apache Kafka ou o Apache Spark.
A ênfase está em capacitar as equipes para criar e gerir os seus produtos de dados de forma independente, com foco em requisitos específicos de domínio em vez de uma solução única.
Desafios de interoperabilidade técnica
A interoperabilidade é uma consideração crítica para os sistemas de data mesh e de data fabric, embora abordada de formas diferentes.
Os data fabrics abordam a interoperabilidade através da implementação de APIs, modelos de dados e protocolos padronizados em toda a sua camada de gestão de dados integrada.
Isto requer um planejamento inicial significativo e uma gestão contínua para garantir que as fontes de dados novas e existentes possam ser integradas e acessadas sem problemas através do tecido.
Os data meshs abordam a interoperabilidade através da adoção de princípios de concessão orientados para a equipe, incentivando a utilização de formatos de dados, APIs e protocolos comuns para produtos de dados.
Esta arquitetura de dados descentralizada necessita de um forte compromisso organizacional com a normalização e a governação para evitar silos de dados e garantir que os produtos de dados possam ser facilmente partilhados e integrados através dos limites do time responsável.
InterSystems e Smart Data Fabrics/Data Meshes: Possibilitando a gestão avançada de dados
O InterSystems IRIS e o Data Fabric Studio representam soluções abrangentes concebidas para desbloquear o verdadeiro potencial dos dados para as empresas que se debatem com o crescente volume, variedade e complexidade dos seus ativos de dados.
Ao abordar as questões prevalecentes dos silos de dados e aplicações, estas soluções facilitam uma abordagem mais integrada, eficiente e acionável aos dados nas organizações.
InterSystems e Data Fabric
A InterSystems oferece duas soluções poderosas para a implementação de arquiteturas de estruturas de dados:
InterSystems IRIS
O InterSystems IRIS funciona como uma tecnologia central dentro de uma arquitetura de tecido de dados devido às suas capacidades abrangentes de gestão de dados. As principais caraterísticas incluem:
Integração e gestão de dados.
O InterSystems IRIS fornece capacidades robustas para integrar dados de várias fontes, o que o torna uma excelente opção para o acesso unificado aos dados e para a camada de gestão central do Data Fabric. A sua capacidade de lidar com modelos de dados SQL e NoSQL e o suporte para transações e análises simultâneas alinham-se bem com as necessidades de flexibilidade e escalabilidade de um Data Fabric.
Análise em tempo real e aprendizagem automática
Com suporte integrado para análise em tempo real, business intelligence e aprendizagem automática, o InterSystems IRIS pode incorporar capacidades analíticas avançadas diretamente no Data Fabric, permitindo percepções e tomadas de decisão mais rápidas em toda a organização.
Interoperabilidade e conetividade
As fortes caraterísticas de interoperabilidade da plataforma permitem uma ligação fácil entre sistemas e fontes de dados distintos, um requisito essencial para a criação de um Data Fabric sem descontinuidades. Isto inclui o suporte de várias normas e protocolos de dados, facilitando a comunicação entre diferentes ambientes e aplicações.
InterSystems Data Fabric Studio
O InterSystems Data Fabric Studio é uma solução especializada que simplifica a implementação e a gestão de arquitecturas de estruturas de dados. Oferece:
Acesso unificado aos dados
Fornece um ponto único de acesso a todos os dados da empresa, independentemente da localização ou do formato, permitindo a integração e a gestão de dados em toda a organização.
Ambiente de desenvolvimento visual
Apresenta uma interface intuitiva para a concessão e implementação de soluções de tecido de dados, reduzindo a complexidade e acelerando o tempo de desenvolvimento.
Serviços de dados avançados
Fornece capacidades integradas para a transformação de dados, gestão da qualidade e governação, garantindo dados consistentes e fiáveis em toda a empresa.
Arquitetura escalável
Suporta volumes de dados crescentes e necessidades comerciais em evolução com uma arquitetura altamente escalável e flexível.
Processamento em tempo real
Permite o processamento e a análise de dados em tempo real, apoiando
InterSystems e Data Mesh
Enquanto o Data Mesh enfatiza a propriedade descentralizada dos dados e o design orientado para a equipe, as soluções da InterSystems podem desempenhar um papel de apoio, especialmente em aspectos como:
Serviços de dados específicos da equipe
As capacidades do InterSystems IRIS e do Data Fabric Studio podem ser utilizadas para desenvolver e gerir serviços de dados específicos da equipe, apoiando a autonomia dos times na gestão dos seus produtos de dados. Sua escalabilidade e desempenho podem atender às altas demandas de operações centradas em times específicos.
Governança de dados e observabilidade
Embora o Data Mesh defenda a governança descentralizada, as soluções da InterSystems suportam esse modelo fornecendo ferramentas para qualidade, segurança e conformidade de dados que podem ser aproveitadas por domínios individuais, bem como recursos de observabilidade para monitorar a integridade e o uso de produtos de dados em toda a malha.
Próximos passos
As soluções abrangentes de gestão de dados da InterSystems incorporam o futuro da gestão de dados, alinhando-se estreitamente com os princípios de Smart Data Fabrics e oferecendo potenciais caminhos para a implementação de arquiteturas de data mesh.
Através da sua ênfase na integração analítica, compatibilidade com sistemas legados e capacidades de elevado desempenho, estas soluções abrem caminho para que as organizações atinjam um novo nível de eficiência e percepção de valor dos seus ativos de dados.