Dados e Analytics

Projetos, análises e aplicações em dados com foco em simplicidade, clareza e impacto.

Posts mais recentes

Ver todos os posts

Similaridade entre strings e fuzzy matching

Como encontrar correspondências entre dados imperfeitos usando fuzzy matching aplicado a joins e deduplicação, melhorando a qualidade de bases sem depender de match exato.

Análise exploratória de dados do dataset público de comércio eletrônico brasileiro, por Olist

Análise exploratória do dataset público da Olist com foco em comportamento de vendas e operação de e-commerce, transformando dados brutos em insights relevantes para o negócio.

Modelos pré-treinados para tarefas de ciência de dados

Como utilizar modelos pré-treinados em problemas reais de ciência de dados, entendendo quando aplicar, limitações e ganhos de produtividade em tarefas como NLP.

Usando o DVC para versionamento de arquivos em projetos

Versionamento de dados e experimentos com DVC aplicado à organização de projetos de data science, garantindo reprodutibilidade e controle eficiente de pipelines.

Livro "Essencialismo: A disciplinada busca por menos", de Greg McKeown

Resenha do livro Essencialismo, de Greg McKeown, com os principais conceitos sobre foco, priorização e execução do que realmente importa.

Projetos em destaque

Casos com mais profundidade, cobrindo contexto, abordagem analítica, modelagem e resultados.

Ver todos os projetos
Projeto24 de dezembro de 2024

Análise exploratória de dados do dataset público de comércio eletrônico brasileiro, por Olist

Stack
PythonSQLPlotlyNLP
Resultados
  • A região sudeste concentra os maiores volumes de pedidos e valores pagos, com destaque para SP, RJ e MG
  • A base indica baixa recorrência de compra, com 61,1% dos clientes inativos e quase 97% realizando apenas um pedido
  • A receita total por cliente é concentrada em valores baixos, com 78% acumulando até R$ 200 em compras
  • Avaliações sem comentário são mais frequentes em notas altas e diminuem conforme a nota cai
  • Comentários positivos aumentam com notas maiores, enquanto os negativos se concentram nas notas baixas