Luby logo

Profissional Engenheiro(a) de Dados (GenAI) - Remoto | CLT

Luby
2 days ago
Remote
Brazil
Web Development

#VemPraLuby💙

Aqui você terá a oportunidade de:

  • Evoluir em um ambiente de alta performance: Uma cultura onde o desenvolvimento é contínuo, com autonomia e envolvimento em projetos nacionais e internacionais que realmente testam suas habilidades e impulsionam seu potencial.
  • Integrar um time apaixonado por tecnologia: Aqui, você vai trabalhar ao lado de talentos experientes em um ambiente colaborativo e disruptivo, utilizando as tecnologias mais avançadas do mercado.
  • Deixar sua marca no mundo: Nossas soluções digitais impactam diretamente a vida de milhares de pessoas, e é a sua chance de ser parte ativa na construção de um futuro mais digital e conectado.
  • Trabalhar de forma remota e com flexibilidade: Seja qual for o seu lugar, estamos prontos para te receber no nosso time!

Sua Missão:

Buscamos um(a) Data Engineer para se juntar à nossa equipe, atuando alocado em um dos nossos clientes e apoiar na construção de plataformas modernas de dados voltadas para aplicações de Inteligência Artificial e iniciativas de migração de dados em larga escala.

Principais Atividades:

  • Projetar, desenvolver e manter pipelines de dados escaláveis utilizando Python, PySpark, dbt e ferramentas modernas de transformação de dados.
  • Desenvolver pipelines de ingestão e processamento de dados voltados para workloads de GenAI, incluindo processamento de documentos, chunking e fluxos de embeddings.
  • Orquestrar workflows e pipelines de dados utilizando ferramentas como Airflow, Dagster ou soluções cloud-native.
  • Apoiar iniciativas de migração de dados, realizando análise de fontes, mapeamento de schemas, validação e estratégias de rollback.
  • Implementar e manter frameworks de qualidade de dados, com validações automatizadas e monitoramento de pipelines.
  • Colaborar com engenheiros de AI e times de produto para suportar pipelines de RAG e aplicações baseadas em IA.
  • Aplicar boas práticas de governança, segurança e conformidade de dados, garantindo o tratamento adequado de informações sensíveis (PII).
  • Contribuir para arquiteturas de dados modernas utilizando event-driven architecture e integrações entre serviços e plataformas.

Requisitos essenciais:

  • Experiência prática na construção e manutenção de pipelines de dados em ambientes de produção.
  • Proficiência em Python, PySpark e SQL avançado, incluindo uso de CTEs, window functions e otimização de queries.
  • Experiência com plataformas de nuvem como AWS, Azure ou GCP.
  • Experiência com ferramentas de processamento e transformação de dados como dbt, Spark ou serviços gerenciados de dados em cloud.
  • Experiência com data warehouses modernos como Snowflake, BigQuery, Redshift ou Databricks.
  • Conhecimento em bancos de dados relacionais (PostgreSQL, MySQL) e NoSQL (MongoDB, DynamoDB).
  • Experiência com orquestração de workflows e pipelines de dados.
  • Familiaridade com Infraestrutura como Código (Terraform, Docker) e pipelines de CI/CD.
  • Conhecimento em modelagem de dados, incluindo conceitos como Star Schema, Dimensional Modeling ou Data Vault.
  • Inglês avançado/fluente para atuar com gestores internacionais.

Será um diferencial:

  • Experiência com projetos de migração de dados em larga escala.
  • Experiência com implementação de Change Data Capture (CDC).
  • Conhecimento em tecnologias de streaming de dados, como Kafka ou Kinesis.
  • Experiência ou exposição a pipelines de RAG e aplicações baseadas em GenAI.
  • Familiaridade com arquiteturas orientadas a eventos e integração entre microsserviços.

O que oferecemos:

Oportunidade no modelo CLT:

  • Trabalho Remoto: Desfrute da flexibilidade de trabalhar de qualquer lugar do Brasil, com total autonomia e organização.
  • Saúde e Bem estar: Plano de Saúde e Odontológico, Seguro de Vida e Wellhub (Gympass).
  • +Educação: Descontos em cursos da FIAP e MBA USP Esalq para você continuar aprendendo e se desenvolvendo.
  • Ajuda de Custo: Vale refeição (Caju) e Auxílio Home Office.
  • Diferenciais exclusivos: Descontos em lojas Multilaser, bonificação por indicação de profissionais e negócios.

Saiba mais sobre cultura, diferenciais e como é ser um #Luber em nossa Página de Carreiras!