Análise da precisão de métodos de análise de sentimentos para estimar o grau de insatisfação nas reclamações recebidas pelos órgãos do Gov Federal via ReclameAqui.
Há três fontes de dados para o projeto:
- Um conjunto conteúdos de reclamações raspados do ReclameAqui,
- Avaliações do grau de insatisfação feitas por voluntários, e
- Estimativas da instatisfação derivadas de métodos de análise de sentimento.
data/
- Todos os dados do projetodata/0-reclamacoes-raw
- Conteúdos de reclamações raspados do ReclameAquidata/1-reclamacoes-selecionadas
- Reclamações selecionadas dentre as raspadas, com colunas úteis para o experimentodata/2-avaliacao-humana-preliminar
- Avaliação da insatisfação feita por um grupo de voluntários em um conjunto pequeno de reclamações para verificar se há concordância.data/3-avaliacao-humana
- Avaliação da insatisfação feita por humanos no conjunto de reclamações emdata/1-reclamacoes-selecionadas
data/4-estimativa-automatica
- Estimativa via algoritmos da insatisfação nas reclamações emdata/1-reclamacoes-selecionadas
code/
- Código que não é análisecode/coleta_reclamacoes.R
- Raspa os dados do ReclameAquicode/raspados_para_selecionados.R
- Escolhe dentro dos dados raspados aqueles que analisaremos e cria dados emdata/1-reclamacoes-selecionadas
.
resultados/
- Relatórios com as análises de fatoresultados/0-avaliacao-concordancia.\*
- Análise se há concordância quando voluntários estimam o grau de insatisfação de uma reclamação.
O código é em R. Abra reclamacoes-gf.Rproj
e rode no terminal do RStudio:
deps = c("tidyverse", "rvest", "stringr", "here")
install.packages(deps)