Os assistentes de codificação de IA podem ter facilitado a geração de software, mas fazer com que esse código seja executado de maneira confiável – empacotando-o, implantando-o, dimensionando a infraestrutura, coletando logs e corrigindo falhas quando elas ocorrem – é onde reside o verdadeiro desafio.
Essa lacuna é o que Torreuma startup alemã fundada por ex-engenheiros da Snowflake, está tentando resolver. A empresa está construindo uma plataforma projetada para executar pipelines de dados Python e aplicativos de dados baseados em IA em ambientes de produção – algo que o cofundador e CEO Serhii Sokolenko chama de “última milha” da engenharia de dados moderna.
“Enviar a primeira versão de um aplicativo de dados para produção ainda é muito difícil”, diz Sokolenko A nova pilha. “Imagine que você acabou de trabalhar com Claude no código do seu pipeline de dados. A próxima etapa é muito mais difícil: você precisa empacotar o código, implantá-lo em algum ambiente de nuvem, provisionar vários recursos da AWS ou comprar e aprender ferramentas como Spark ou Kubernetes. Você também precisa instrumentar o aplicativo para que ele emita logs e métricas, garantir que os segredos não sejam armazenados no Git e aumentar ou diminuir os recursos dependendo da quantidade de dados que estão chegando.”
O problema também não termina quando o código é enviado. As falhas de produção devem ser rastreadas até o código, traduzidas em correções e submetidas à revisão antes que o sistema possa ser reimplantado.
A abordagem da Tower é manter esse ciclo de feedback dentro da própria plataforma, integrando-se com assistentes de codificação para que os desenvolvedores possam enviar aplicativos de dados Python em um tempo de execução gerenciado, observar como eles se comportam na produção e usar esses sinais para melhorar o código.
A história até agora
Fundada em Berlim no final de 2024, a Tower é obra de dois fundadores com longos currículos nas esferas de infraestrutura de dados e nuvem.
Sokolenko ocupou cargos seniores de produtos em empresas, incluindo Microsoft, AWS, Google, Snowflake e Databricks, onde trabalhou em mecanismos de banco de dados, análise de streaming e sistemas de processamento de dados em grande escala.
Brad HellerCTO da empresa, passou grande parte de sua carreira construindo plataformas de infraestrutura como engenheiro e fundador. Antes da Tower, ele foi gerente sênior de engenharia na Snowflake e anteriormente foi cofundador da startup de visualização de dados Reflect Technologies, que foi adquirido pela Puppet em 2018.
A dupla se conheceu enquanto trabalhava na Snowflake, onde colaboraram em melhorias de desempenho na plataforma de dados da empresa. A Tower surgiu de sua visão compartilhada de que o cenário atual da infraestrutura de dados deixa muitas equipes escolhendo entre construir elas próprias sistemas complexos ou adotar plataformas de grandes fornecedores.
Operar uma pilha de dados moderna não é algo que as equipes configuram uma vez e esquecem. Requer manutenção contínua.
A situação pode ser resumida de forma simples: operar uma pilha de dados moderna não é algo que as equipes configuram uma vez e esquecem. Requer manutenção contínua – correção de imagens do sistema, rotação de credenciais, manutenção da integridade dos clusters e resposta quando os trabalhos falham no meio da noite. O trabalho árduo envolvido em manter esses sistemas funcionando é frequentemente subestimado.
Fundadores da Torre: Brad Heller e Serhii Sokolenko
É claro que as grandes plataformas de dados comerciais prometem eliminar esse fardo. Mas a compensação pode ser dispendiosa e levar a um aprisionamento contratual que as equipas mais pequenas têm dificuldade em justificar.
“Hoje não existe um meio-termo real – ou você mesmo constrói e mantém a infraestrutura de dados ou entrega seu orçamento (e flexibilidade) a um fornecedor de peso”, Sokolenko escreveu em uma postagem no blog ano passado.
A proposta da Tower é oferecer uma alternativa mais simples entre esses dois extremos. Em vez de forçar as equipes a montar sua própria infraestrutura ou se comprometer com uma grande plataforma de dados, o Tower fornece um ambiente gerenciado onde os desenvolvedores podem executar pipelines de dados e aplicativos Python diretamente.
Isso reflete uma mudança mais ampla no ecossistema de dados: a maioria das ferramentas modernas de processamento de dados e IA são construídas como bibliotecas Python. Estruturas como DBT, polar, dlte LangChain todos são executados no mesmo tempo de execução e geralmente combinados em um único aplicativo Python.
“Mas os usuários não precisam pensar em nada disso. Eles apenas iniciam a execução do aplicativo e nós cuidamos do resto.”
Tower se baseia nessa realidade. Os desenvolvedores podem executar o código Python existente praticamente inalterado — geralmente com nada mais do que um arquivo de configuração que descreve o aplicativo e seus parâmetros. Nos bastidores, o Tower cria um ambiente virtual para o código, empacota-o em um contêiner e executa-o dentro de um cluster Kubernetes.
“Mas os usuários não precisam pensar em nada disso”, diz Sokolenko. “Eles apenas iniciam a execução do aplicativo e nós cuidamos do resto.”
Tower lançou um alfa inicial em janeiro de 2025, seguido por um lançamento beta em agosto do mesmo ano. Ao longo do caminho, a Tower diz que começou a atrair os primeiros usuários, incluindo equipes da Ford, Pyne e CosmoLaser.
A startup também anunciou hoje que levantou US$ 6,4 milhões em financiamento antecipado, de investidores como Speedinvest e DIG Ventures, enquanto prepara a plataforma para disponibilidade geral.
Encontre-me no meio
O tipo de cliente que a Tower tem como alvo provavelmente fica em algum lugar entre a experimentação em estágio inicial e a infraestrutura de dados em grande escala. Um exemplo típico, diz Sokolenko, pode ser um fabricante de médio porte executando software empresarial legado e contando com uma pequena equipe interna de dados.
Nessa fase, as empresas enfrentam um dilema: modernizar elas próprias a sua pilha de análise – montando ferramentas de orquestração, clusters de computação e camadas de armazenamento – ou adotar uma grande plataforma construída para organizações de engenharia muito maiores.
“Este é um tipo real de empresa com a qual trabalhamos”, explicou ele. “Em algum momento, você precisará fazer uma escolha séria: modernizar suas análises para poder competir mais rapidamente ou correr o risco de se tornar irrelevante.”
“Em algum momento, você precisará fazer uma escolha séria: modernizar suas análises para poder competir mais rapidamente ou correr o risco de se tornar irrelevante.”
Para essas equipes, a questão é se devem construir uma plataforma de dados complexa que possam ter dificuldades para operar ou adotar algo mais simples que ainda lhes permita modernizar seus fluxos de trabalho analíticos.
“Talvez você tenha apenas uma pessoa na empresa que seja realmente um cientista de dados”, continuou Sokolenko. “Você ainda compra uma enorme plataforma de dados com análise de streaming, processamento de eventos em tempo real e grandes clusters Spark, só para se sentir ‘moderno’?”
A aposta da Tower é que muitas organizações fiquem nesse meio-termo – além de scripts ad-hoc, mas sem pessoal de engenharia para executar grandes sistemas de dados distribuídos.
“Eles já passaram da fase de scripts aleatórios, mas também não têm uma equipe de engenheiros Java Spark de 2015”, diz Sokolenko.
Executando cargas de trabalho de dados
Em vez de exigir que as próprias equipes gerenciem clusters Spark ou infraestrutura Kubernetes, o Tower permite que os desenvolvedores executem cargas de trabalho Python sem gerenciar a infraestrutura subjacente. Um arquivo de configuração simples define como um aplicativo é executado, enquanto a plataforma cuida do empacotamento do código, do provisionamento do ambiente de tempo de execução e do dimensionamento da infraestrutura nos bastidores.
O sistema também oferece suporte ao Apache Iceberg como base de armazenamento, permitindo que os clientes mantenham seus dados em um formato open lakehouse compatível com os principais mecanismos de análise. Isso significa que os pipelines executados no Tower ainda podem alimentar plataformas como Snowflake ou Databricks, em vez de prender os usuários em uma camada de armazenamento proprietária.
É importante notar que o Tower se sobrepõe um pouco a várias categorias existentes de ferramentas. Orquestradores de fluxo de trabalho, como Apache Airflow e Dias ajudam a coordenar pipelines de dados em sistemas distribuídos. No outro extremo do mercado, plataformas como Databricks e outros ambientes baseados em Spark fornecem infraestrutura em grande escala para cargas de trabalho analíticas.
A Tower se posiciona em algum lugar entre esses dois campos. Em vez de definir pipelines por meio de gráficos de fluxo de trabalho externos, os desenvolvedores podem escrever lógica de orquestração diretamente em Python, com o Tower executando essas cargas de trabalho dentro de seu ambiente de tempo de execução.
Simplificando, é uma alternativa moderna e que prioriza o código aos orquestradores legados.
Seja como for, há poucas dúvidas de que a IA está mudando a forma como os sistemas de dados são construídos – e, por sua vez, os tipos de problemas operacionais que as equipes enfrentam quando o código chega à produção. Gerar um pipeline é fácil, mas executá-lo de maneira confiável é outra questão.
“Quando você executa o pipeline em produção e ele falha, você precisa voltar ao assistente de IA, corrigir o problema, revisar as alterações e implantar novamente”, diz Sokolenko.
Ao mesmo tempo, argumenta ele, o desenvolvimento assistido por IA está a expandir o conjunto de pessoas que experimentam sistemas de dados – desde gestores de produtos a profissionais de marketing – criando novas dinâmicas de colaboração dentro das equipas de engenharia.
“Estamos vendo mais usuários não técnicos ‘curiosos por tecnologia’ experimentando a construção de sistemas de dados”, continuou Sokolenko. “Mas isso é mais complexo do que gerar um Adorável site. Este código administrará o seu negócio.”
Isso significa que engenheiros experientes ainda desempenham um papel central na supervisão e no refinamento do código produzido pelas ferramentas de IA – um fluxo de trabalho que a Tower está tentando apoiar, alimentando logs de tempo de execução, métricas e sinais de produção de volta ao processo de desenvolvimento.
Tração inicial e o que vem a seguir
Os primeiros números de uso da Tower sugerem que a ideia está ganhando força. A empresa afirma que seu SDK Python agora recebe cerca de 70 mil downloads por mês, enquanto a plataforma processa mais de 200 mil trabalhos em cerca de 30 mil aplicativos.
Muitos desses usuários são empresas de software que criam seus próprios produtos baseados em dados. As APIs da Tower permitem incorporar a plataforma em seus próprios serviços, usando-a efetivamente como camada de execução para pipelines analíticos, trabalhos e aplicativos de dados voltados para o cliente.
Outras equipes usam o Tower como plataforma de dados primária, executando fluxos de trabalho de integração e transformação sem montar uma colcha de retalhos de ferramentas de orquestração, clusters de computação e sistemas de armazenamento. Hoje, essas cargas de trabalho variam de pipelines em lote tradicionais a trabalhos de curta duração no estilo sem servidor e aplicativos interativos, como notebooks, painéis e endpoints de API.
Com novos US$ 6,4 milhões no banco, a empresa agora está preparando o Tower para disponibilidade geral enquanto continua a expandir a plataforma.
“Nosso objetivo é tornar muito mais fácil para as empresas de médio porte – e para os fornecedores de software que criam para elas – operar uma plataforma de dados completa na Torre: computação, armazenamento e orquestração”, diz Sokolenko. “E para conectá-lo ao seu agente de IA favorito.”
YOUTUBE.COM/THENEWSTACK
A tecnologia avança rápido, não perca um episódio. Inscreva-se em nosso canal no YouTube para transmitir todos os nossos podcasts, entrevistas, demonstrações e muito mais.
ASSINAR
Deseja saber mais sobre Programação e Desenvolvimento Clique Aqui!
