SOBRE MIM

Prazer, meu nome é Jefferson Henrique Candido.

Bacharel e Mestre em Matemática Pura de formação, eu me destaco por ter uma forte capacidade analítica para ótimas tomadas de decisão com o foco em produção de resultados, uma vez fornecidas as informações e o problema a ser resolvido. Com o objetivo de migrar e atuar na carreira de Ciências de Dados, essas habilidades serão muito bem aproveitadas na empresa para a geração de insights, maximização de lucros, minimização de custos e otimização de processos.

Com o próposito de migrar para a área de Dados, no momento atual, eu me dedico exclusivamente ao estudo da Ciência de Dados por meio de projetos que solucionam problemas de negócios que, no dia a dia, um Cientista de Dados lida.

Logo abaixo, você encontrará as habilidades e ferramentas que uso para solucionar os problemas de negócio e os projetos pessoais de Ciências de Dados desenvolvidos para aprimorar essas habilidades, desenvolver novas técnicas, dominar novas ferramentas e adquirir experiência na resolução de problemas de negócios e ganhar domínio sobre as ferramentas de Ciência.

Dessa forma, estou em busca de uma oportunidade para atuar na área de dados profissionalmente como Cientista de Dados ou Analista de Dados, sendo que o meu foco principal é atuar com Cientista de Dados.

HABILIDADES E FERRAMENTAS

LINGUAGEM DE PROGRAMAÇÃO

  • Python com foco em análise de dados.
  • Python para Webscraping.
  • SQL.
  • Flask.

ESTATÍSTICA E MACHINE LEARNING

  • Regressão Linear, Regressão não-linear e Modelos Preditivos.
  • Regressão Logística e Modelos de Classificação.
  • Aprendizado de Máquina Supervisionado e Não-Supervisionado.
  • Agrupamentos e Técnicas de Clusterização.
  • Estátistica Descritiva.
  • Teste A/B e Inferências Estatísticas.

VISUALIZAÇÃO DE DADOS E DASHBOARDS

  • Matplotlib e Seaborn.
  • Streamlit.
  • Tableau, MetaBase.

ENGENHARIA DE SOFTWARE

  • Git, Github.
  • Cloud Computing: Heroku, Render e AWS.

EXPERIÊNCIAS PROFISSIONAIS

8 PROJETOS COMPLETOS DE CIÊNCIA DE DADOS

Construção de soluções de dados para problemas de negócios próximo da realidade do dia a dia das empresas, utilizando dados públicos de competições de Ciências de Dados e de página das internet, onde esses problemas foram abordados desde a concepção do projeto até o deploy modelo em produção utilizando ferramentas de Cloud Computing.

1 ANO E 8 MESES COMO VENDEDOR INTERNO

Estudo e seleção de potenciais clientes baseados na localidade, logística e tipo de negócio. Fidelização de clientes antigos, prospecção de novos clientes, maximização de lucro sobre cada venda e negociação, criação de vínculos com esses clientes e pós-venda.

6 MESES COMO ESTOQUISTA NO SETOR LOGÍSTICO

Organização de estoque, conferência de pedidos e carregamento dos pedidos.

5 MESES COMO ESTAGIÁRIO DOCENTE

Correção de provas, planejamento de aulas e ministração dessas aulas, planejamento de trabalhos/pesquisas e correção. Além disso, monitorias com horários agendados.

PROJETOS DE CIÊNCIAS DE DADOS

Identificação de compra e revenda de imóveis a fim de maximizar o lucro para a empresa House Rocket.

Nesse projeto, para ajudar o CEO da Imobiliária House Rocket a encontrar ótimas oportunidades de negócio, foi desenvolvido uma Análise Exploratória e realizada uma Inteligência de Dados com o objetivo de obter os melhores imóveis para compra e determinar os melhores preços para revenda desses imóveis comprados de acordo com a sazonalidade.

O custo estimado de Aquisição foi de US$ 4.094.212.008,00, o faturamento das vendas foi estimado em US$ 5.276.791.316,98 e, com isso, o lucro estimado é de US$ 1.182.579.308,98. Além disso, para otimizar o processo de consulta a esses dados, criei um Dashboard com todas informações que está disponível na nuvem para ser consultado bastando apenas ter um dispositivo móvel em mãos e Internet.

Ferramentas e Bibliotecas Utilizadas

  • Python, Pandas, Numpy.
  • Seaborn.
  • Jupyter Notebook, PyCharm.
  • Git, Github.
  • Streamlit.
  • Render.

Consultoria de Ciência de Dados para a E-commerce StarJeans! Store.

Nesse projeto, com o propósito de ajudar os donos da e-commerce de moda masculina StarJeans!Store a tomarem a decisão de quais preços deviam ser estipulados, quais matérias-primas deviam ser adquiridas e quais os melhores estilos deviam ser produzidos para as calças que desejam vender, foi desenvolvido dois scripts de Webscraping para extrair informações das suas duas principais concorrentes, que são a H&M e a Macy's e, a partir dessas informações, tomarem as melhores decisões.

Além desses scripts, foi elaborado uma Análise Exploratória e uma Inteligência de Dados dessas informações extraídas com o foco de dar mais apoio na tomada de decisão de negócio. Para otimizar o processo de consulta a esses dados, criei um Dashboard com todas informações que está disponível na nuvem para ser consultado bastando apenas ter um dispositivo móvel em mãos e Internet.

Ferramentas e Bibliotecas Utilizadas

  • Python, Pandas, Numpy.
  • Selenium, Beautiful Soup.
  • Seaborn.
  • Jupyter Notebook, Pycharm.
  • Git, Github.
  • Streamlit.
  • Render.

Previsão de Vendas das Lojas da Rede Rossmann.

Nesse projeto, desenvolvi um modelo de previsão de vendas para a rede de Drogarias Rossmann que retorna o valor estimado das vendas das próximas 6 semanas das lojas da rede, sendo que o propósito final desse modelo é ajudar o CFO a montar o orçamento da reforma de cada uma dessas lojas tendo o conhecimento de quanto dinheiro terá em caixa. O retorno financeiro estimado para a rede com esse modelo ficou em torno de US$ 286.474.432,00 de faturamento com um margem de erro de US$ 1.000,00.

Para isso, utilizei o aprendizado de máquina sobre modelos preditivos, técnicas de análise exploratória e habilidade de extração e limpeza de dados. Além disso, para otimizar o processo de consulta a essas previsões construi um BOT no Telegram que, colocando apenas o número de identificação da loja é possível saber a previsão de vendas desses estabelecimentos. Logo, todas essas informações estão de fácil acesso bastando apenas ter um dispositivo móvel, internet e o Telegram instalado no dispositivo.

Ferramentas Utilizadas

  • Python.
  • Análises Preditivas, Modelos Preditivos e Aprendizagem de Máquina Supervisionado.
  • Jupyter Notebook.
  • Git, Github.
  • Render.

Classificação de Potenciais Clientes da Insurance All.

Ajudei a equipe de vendas da Empresa Insurance All com a otimização do processo de prospecção de novos clientes para um novo produto que a empresa está oferecendo. A solução foi o desenvolvimento de um modelo de classificação rankeada que determina quais seriam os clientes com maior propensão de adquirir esse novo produto que a empresa estava introduzindo no seu portfólio de seguros. Com o modelo de classificação tendo um Recall at k de 99%, um Precision at k de 23% e uma equipe de vendas com uma capacidade de 20.000 ligações, estimou-se que 900 clientes interessados seriam atingidos gerando um faturamento de Rs(Rublos) 4.500.000

Além disso, para otimizar o processo de prospecção de novos clientes, criei um botão no AppScript da Planilha Sheets em que, uma vez passados os dados dos clientes corretamente para essa Planilha, basta um clique nesse botão para a planilha realizar uma requisição ao modelo via API para que ele retorne os clientes ranqueados na planilha e esteja pronto para a equipe de vendas usar.

Ferramentas Utilizadas

  • Python.
  • Regressão Logística, Aprendizado de Máquina Supervisionado, Técnicas de "Learning to rank".
  • Jupyter Notebook.
  • Git, Github.
  • Render.
  • GoogleSheets.

Agrupamento dos melhores clientes para a Empresa All in One Place.

Nesse projeto, ajudei o time de negócios da empresa All In One Place(Outlet de Multimarcas) a determinar quem são os melhores clientes elegíveis para participar do programa Insiders(programa de mimos e benefícios para os melhores clientes), pois após um ano de funcionamento, a equipe de marketing percebeu que alguns de seus clientes de sua base compravam produtos mais caros e com uma certa alta frequência, e consequentemente, acabavam contribuindo com uma parcela significativa do faturamento da empresa.

A solução foi o desenvolvimento de um modelo de clusterização utilizando técnicas de espaços de embedding para determinar o grupo de melhores cliente. Por fim, com esse modelo, descobriu-se um grupo de melhores clientes que são responsáveis por 57% do faturamento da empresa, que é aproximadamente R$ 5.757.000,00.

Para estar monitorando esse grupo de melhores clientes(Clientes Insiders), os outros grupos de clientes e ter essas e outras informações de fácil acesso para montar estratégia de marketing e negócios, foi desenvolvido uma infraestrutura na AWS de ponta a ponta desde a ligação de uma EC2 passando pela criação de uma S3 até a elaboração Banco de Dados Postgres na RDS da Amazon para que os dados fossem consumidos em um Dashboard no MetaBase. Além disso, para que as informações se mantenham atualizadas, foi agendado a execução do modelo de clusterização a cada 15 dias de todo mês na EC2 pelo CronJob.

Ferramentas Utilizadas

  • Python, SQL.
  • Análise de Agrupamentos,
  • Aprendizagem de Máquina Não-Supervisionado e Modelos Clusterização(K-Means, Hierarchical Clustering, Gaussian Mixture Model).
  • Técnicas de Embedding de Espaços de Dados.
  • Jupyter Notebook.
  • Git, Github.
  • AWS.
  • Linux.
  • Metabase.

Análise no Banco de Dados da Olist

Nesse projeto, O objetivo foi realizar uma análise exploratória do Banco de Dados da empresa OList com o intuito de responder as rodas de perguntas do CEO e gerar alguns insights.

Ferramentas Utilizadas

  • SQL, SQLite.
  • Jupyter Notebook.
  • Git, Github.

Relatórios com o Tableau

Nessa seção você vai encontrar um projeto de estudo de visualizações de dados utilizando o Tableau e seus recursos.

Ferramentas Utilizadas

  • Tableau

Efetividade de Conversão da Página de Vendas

Nesse projeto, o objetivo do Product Manager da e-commerce de eletrônicos Eletronic House era aumentar as vendas de Teclados Bluetooth. Assim, a equipe de desing desenvolveu uma nova página de vendas. Para determinar se valia a pena trocar a antiga página de vendas da empresa essa nova página sem ocorrer muitas perdas no faturamento foi desenvovlido um experimento estatístico utilizando técnicas de teste A/B.

A conclusão do teste foi que a nova página de vendas era melhor que a antiga com uma taxa de conversão de 0.8%, acarretando, um aumento estimado de R$ 3.600.000,00 no faturamento da empresa.

Ferramentas Utilizadas

  • Python, Pandas, Scipy, StatsModels
  • Jupyter Notebook
  • Git, GitHub
  • Técnicas de Teste A/B e Inferência Estatística

Efetividade do Preenchimento Automático de Formulário de Pagamento

Dessa vez, na empresa Eletronic House, auxiliei o Head de Designers a medir a efetividade de um novo dispositivo que realiza o preenchimento automático do formulário de pagamento. O objetivo final é determinar se o preenchimento automático interfere no aumento das compras. Para que esse problema fosse resolvido sem gerar grandes prejuízos para a empresa, nós utilizamos técnicas de teste A/B para trazer um solução.

Ferramentas Utilizadas

  • Python, Pandas, Scipy, StatsModels
  • Jupyter Notebook
  • Git, GitHub
  • Técnicas de Teste A/B e Inferência Estatística

Efetividade de Cliques da Página da Universidade de Montana

A Universidade de Montana possui vários serviços ao aluno, incluindo o serviço de biblioteca que oferece alocação de salas de estudos, livros, computadores e entre outros. Para facilitar esse processo, a Universidade colocou um botão com o nome "Interact" em sua página que encaminha o aluno para uma webpage em que ele solicita esses serviço, assim, evitando a sobrecarga dos funcionários da Biblioteca. Entretanto, o time de TI percebeu, depois de um tempo, que a taxa de cliques do botão "Interact" estava baixa.

Portanto, com objetivo de aumentar a taxa de cliques desse botão, o time de TI sugeriu 4 possíveis novos títulos para o botão "Interact" que são "Connect", "Help", "Services", "Learn".

Logo, para verificar a efetividade desses títulos e resolver o problema da taxa de cliques, utilizei técnicas de teste A/B/n e Inferências Estatísticas para solucionar esse problema.

Ferramentas Utilizadas

  • Python, Pandas, Scipy, StatsModels
  • Jupyter Notebook
  • Git, GitHub
  • Técnicas de Teste A/B/n e Inferência Estatística

Sinta-se à vontade para entrar em contato.

  • jefferson_datascience@outlook.com
  • LinkedIn