Guia Arquitetura

O que é Data Mesh

Data Mesh distribui responsabilidade por domínio, mas só funciona quando autonomia local, plataforma e governança evoluem juntas.

Vinícius Coimbra
LinkedIn X

Data Mesh costuma entrar na conversa como promessa de autonomia. Na prática, ele redistribui responsabilidade.

O conceito foi formulado por Zhamak Dehghani no texto How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh. A tese central é simples: quem está mais perto do contexto de negócio deveria assumir mais responsabilidade pelos dados do próprio domínio. O problema é que muita empresa tenta adotar Mesh como se estivesse apenas trocando organograma ou stack.

Não é isso que está em jogo. Data Mesh mexe com responsabilidade por domínio, governança, plataforma, capacidade local e custo de coordenação.

A ideia central

Data Mesh costuma ser explicado a partir de quatro princípios:

  1. responsabilidade por domínio;
  2. dados tratados como produto;
  3. plataforma self-service;
  4. governança federada.

Esses quatro princípios precisam funcionar juntos. Distribuir responsabilidade sem plataforma só espalha fila. Plataforma sem responsabilidade mantém o gargalo central. Autonomia sem governança cria várias verdades incompatíveis.

O ponto importante é este: Data Mesh não substitui uma área central por caos distribuído. Ele reorganiza quem responde por quê.

O que muda no dia a dia

Em um modelo centralizado, a área de dados recebe praticamente toda demanda relevante, interpreta o contexto do domínio do melhor jeito que consegue e devolve artefatos para o negócio consumir. Esse desenho funciona até a complexidade crescer demais.

Quando a empresa passa a ter vários produtos, unidades de negócio, mercados e fontes de dado críticas, a fila central vira gargalo. O domínio reclama de lentidão. O time de dados reclama de pedido mal formulado. Cada lado tem parte da razão.

Data Mesh tenta corrigir isso aproximando contexto, responsabilidade e entrega. O domínio deixa de ser apenas solicitante e passa a responder pelos próprios produtos de dados, enquanto a plataforma oferece capacidades comuns e a governança decide o que precisa permanecer comparável.

Plataforma self-service não é detalhe

O princípio mais subestimado de Mesh costuma ser a plataforma.

Se o domínio continua precisando abrir ticket para publicar dado, criar pipeline, configurar observabilidade, revisar acesso ou versionar contrato, a autonomia é mais retórica do que real. A experiência relatada pela Thoughtworks mostra exatamente isso: a plataforma precisa oferecer as capacidades que sustentam o ciclo de vida dos produtos de dados, do provisionamento à observabilidade.

Self-service, nesse contexto, não significa cada área improvisando sua própria infraestrutura. Significa ter caminho pavimentado para o domínio operar com menos dependência do centro e sem sacrificar interoperabilidade.

Onde Data Mesh costuma quebrar

O conceito quebra quando a empresa distribui trabalho sem preparar o sistema que sustenta essa distribuição.

Os sinais aparecem cedo:

A própria Thoughtworks recomenda desenvolver operating model, governança e plataforma em conjunto. Quando esses três fluxos andam separados, a empresa costuma produzir documentação bonita e pouca mudança real.

O ponto político

Data Mesh redistribui poder, não apenas tecnologia.

Quando um domínio passa a ser dono dos seus dados, ele também passa a responder por qualidade, documentação, disponibilidade, definição e impacto. Isso muda fronteira de orçamento, prioridade e exposição.

É por isso que a parte mais difícil de Mesh raramente está no diagrama. Ela está na disposição de assumir consequência. Um domínio quer autonomia de verdade ou só quer escapar da fila central? Uma liderança quer responsabilidade distribuída ou apenas mais velocidade local sem responsabilidade adicional?

Se essa conversa não estiver madura, Mesh vira um nome sofisticado para transferência de problema.

O que isso tem a ver com Data Product

Mesh depende de data product bem definido. No texto original de Dehghani, o domínio precisa oferecer dados como produto, com responsabilidade contínua sobre qualidade, descoberta e experiência de consumo. Na prática, isso significa sair da lógica de tabela publicada e entrar na lógica de ativo com usuário, responsável, contrato e ciclo de vida.

Quando a empresa tenta fazer Mesh sem essa disciplina, qualquer dataset compartilhado vira "produto" no discurso e passivo operacional no cotidiano.

Onde o Data Translator entra

Quanto mais responsabilidade é distribuída, maior fica a necessidade de tradução entre domínios.

O Data Translator ajuda a separar autonomia legítima de fragmentação perigosa. Ele consegue perguntar onde uma definição local faz sentido, onde precisa existir padrão executivo, que produto merece responsabilidade própria e que decisão será prejudicada se cada área operar com a sua versão da verdade.

Por isso Mesh conversa direto com Governança e Qualidade e com o eixo Arquitetura de Dados. Sem essa camada de coordenação, o desenho técnico pode até ficar moderno, mas a organização continua sem critério comum para decidir.

Quando Data Mesh faz sentido

Data Mesh tende a fazer mais sentido quando a empresa já tem domínios relativamente maduros, autonomia local com responsabilidade real, plataforma minimamente estável e clareza sobre quais métricas precisam continuar comparáveis em nível executivo.

Quando esses pré-requisitos não existem, o mais comum é a empresa precisar primeiro de modelagem melhor, responsabilidade básica, contratos, catálogo utilizável e qualidade operacional mais previsível. Chamar isso de Mesh antes da hora costuma antecipar uma complexidade que a organização ainda não consegue sustentar.

Critério operacional

Antes de discutir Data Mesh, vale responder uma pergunta mais simples: sua empresa quer distribuir responsabilidade ou só quer tirar demanda da fila central?

Se a resposta real for a segunda, o risco é alto. Mesh só cria valor quando autonomia local vem acompanhada de capacidade, contrato, governança e responsabilidade.

Se quiser aprofundar, leia também O que é Data Product, Data Product vs Projeto de Dados e o módulo Leitura Sistêmica.

Referências

  1. How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh
  2. Data mesh
  3. 10 recommendations for a successful enterprise data mesh implementation
  4. Data Mesh in practice: Technology and the architecture
Fazer diagnóstico →