Palavras-chave: Clustering, Segmentação de Preços, Netshoes, Web Scraping, K-means, Ciência de Dados, Análise Exploratória, Machine Learning, E-commerce, Python.
Este projeto foi desenvolvido com o objetivo de segmentar os preços dos produtos disponíveis na página da Netshoes. Utilizando técnicas de web scraping, os dados foram extraídos diretamente do site, proporcionando uma base de dados realista para a análise. A ideia principal foi aplicar algoritmos de clustering para identificar diferentes grupos de produtos com base em suas faixas de preços. O trabalho foi realizado para fins de aprendizado e aprimoramento das habilidades em ciência de dados e técnicas de mineração de dados.
A pergunta que buscamos responder neste projeto é: "Quais são os principais segmentos de preços dos produtos na Netshoes e quais características definem cada grupo?"
- Extração dos dados dos produtos da Netshoes utilizando técnicas de web scraping com Selenium e BeautifulSoup.
- Tratamento dos dados coletados, incluindo remoção de valores ausentes e correção de formatos inconsistentes.
- Visualização e descrição dos dados para entender melhor a distribuição e variabilidade dos preços.
- Normalização e padronização das variáveis para garantir que todos os atributos contribuam igualmente no algoritmo de clustering
- Utilização do algoritmo K-means para segmentar os produtos em clusters baseados em seus preços.
- Interpretação dos clusters gerados, identificando características comuns entre os grupos de produtos.
- Classificação dos produtos em diferentes segmentos de preços, facilitando a identificação de faixas de valores.
- Discussão sobre os resultados obtidos e insights alcançados através da segmentação dos preços.
Este projeto foi realizado com fins educativos e exploratórios, proporcionando uma experiência prática na coleta de dados, preparação e análise utilizando técnicas de aprendizado de máquina.