← Episódios
Ep. 013·11 abr 2022·55 min

Dados, Open Source e Mulheres founders

com Fabiana Clemente, YData

Ouvir em Apple Podcasts

Sobre esta conversa

Fabiana Clemente é matemática aplicada de formação, passou por data science e arquitetura de dados em empresas, e é hoje Chief Data Officer e founder da YData. Criou a startup para atacar um problema que vivia no dia a dia: projetos de dados atrasavam sistematicamente porque faltavam dados de qualidade ou porque não havia acesso a eles — uma dor que era comum em equipas técnicas e também nos negócios que geria.

A YData começou como uma ideia testada num pitch na Collision Conference em Toronto, em 2018. Sem MVP, sem código. Apenas um PowerPoint para validar se o problema era real e se o mercado o sentia. A resposta foi imediata: todas as empresas presentes falavam da mesma dor — dados insuficientes, qualidade baixa, silos internos. Isso levou ao primeiro MVP: um pacote Python simples, uma API que rodava dados reais e gerava amostras sintéticas, com um mini-relatório a medir qualidade. Nada de plataforma visual, apenas ferramentas diretas.

O synthesizer de dados sintéticos é hoje o coração do produto, mas Fabiana insiste que não é solução única. O maior aprendizado foi perceber que data scientists precisam de um ecossistema inteiro — não apenas gerar dados sintéticos, mas também profiling, detecção de inconsistências, mitigação de bias. Por isso a YData evoluiu de uma API isolada para uma plataforma integrada. Um exemplo concreto: dados sintéticos podem amplificar viés se usados sem cuidado, replicando enviesamentos dos dados originais. A YData valida isso durante todo o processo, tanto no treino como no output, para dar segurança ao utilizador.

Fabiana criou também a Synthetic Data Community para aproximar developers e data scientists da tecnologia, removendo barreiras financeiras. O open source educacional foi uma escolha deliberada: quanto mais próxima a comunidade estiver, melhor o feedback sobre casos de uso reais. A empresa hoje abre ferramentas públicas enquanto mantém a plataforma paga; a estratégia é semelhante à de outras empresas (Great Expectations, Databricks), em que a comunidade constrói confiança no produto.

Sobre ser mulher em tecnologia e empreendedorismo, Fabiana é clara: o problema não é intencional, é cultural. Num evento técnico, com o co-fundador ao lado, as perguntas sobre arquitetura chegaram a ele, não a ela — embora fosse a Chief Data Officer. É o estigma invisível. Para mudar, propõe investimento na educação desde cedo, palestras nas escolas, representatividade de mulheres em áreas STEM, e até cuidado na redação de ofertas de emprego (job descriptions inflacionadas afastam candidatas que exigem fit total, enquanto homens apostam em aprender na prática).

O conselho final para fundadores: tempo é o bem mais valioso. Não compra-se, não se recupera. Delega o que consegues. E lança rápido — um produto nunca fica perfeito, mas só melhora com feedback real do mercado.


O episódio desta semana é de certa forma especial, uma vez que temos connosco a primeira convidada do podcast, a Fabiana Clemente, founder da YData. A YData é uma startup ligada a data science e machine learning que disponibiliza aos seus utilizadores um set de ferramentas cruciais no tratamento de dados. que entre outras tem a capacidade de gerar dados sintéticos de alta qualidade para ajudar no desenvolvimento dos modelos de inteligência artificial, resolvendo um grande problema destes utilizadores, que é a falta de dados. Para além de cofounder, A Fabiana assume o cargo de Chief Data Officer depois de um percurso sempre ligado aos dados e à data science e machine learning e mostra ser muito ativa na missão de tornar o mundo mais data-driven. Fiquem connosco para ouvir a Fabiana falar da YData, a sua comunidade open-source e sobre os mairoes desafios para as mulheres na ciência, tecnologia e mais especificamente no empreendedorismo. Links  LinkedIn: https://www.linkedin.com/in/fabiana-clemente/ YData: https://ydata.ai Álvaro Samagaio: https://www.linkedin.com/in/alvarosamagaio/   Diogo Malafaya: https://www.linkedin.com/in/diogomalafaya/   Founder Tales LinkedIn: https://www.linkedin.com/company/foundertales/   Founder Tales Instagram: https://www.instagram.com/foundertalespodcast/   Founder Tales Twitter: https://twitter.com/FounderTalesPod