Skip to content

prefeitura-rio/emd-desafio-junior-data-scientist

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

48 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Desafio Técnico - Cientista de Dados Júnior

Descrição

Bem-vindo ao desafio técnico para a vaga de Cientista de Dados Júnior no campo de soluções de tecnologia e de Governo Digital para área pública no Rio de Janeiro! A data limite do seu último commit no repositório é de 01/09/2024 às 23:59 UTC-3.

Objetivo

O objetivo deste desafio é avaliar suas habilidades técnicas em manipulação de dados, análises exploratórias, integração com APIs, consulta SQL no Big Query, análise e visualização de dados.

Observação

É esperado que você possa não ter tido contato prévio com algumas das tecnologias solicitadas no desafio, e isso é intencional. Parte da avaliação consiste em verificar se você é capaz de aprender rapidamente e produzir resultados após estudar as tecnologias por algum tempo. Por essa razão, o desafio tem uma duração de 13 dias, permitindo que você tenha tempo para estudar e aprender antes de enviar suas respostas.

Conjunto de Dados

Os conjuntos de dados que serão utilizados neste desafio são:

  • Chamados do 1746: Dados relacionados a chamados de serviços públicos na cidade do Rio de Janeiro. O caminho da tabela é : datario.adm_central_atendimento_1746.chamado
  • Bairros do Rio de Janeiro: Dados sobre os bairros da cidade do Rio de Janeiro - RJ. O caminho da tabela é: datario.dados_mestres.bairro
  • Ocupação Hoteleira em Grandes Eventos no Rio: Dados contendo o período de duração de alguns grandes eventos que ocorreram no Rio de Janeiro em 2022 e 2023 e a taxa de ocupação hoteleira da cidade nesses períodos. O caminho da tabela é: datario.turismo_fluxo_visitantes.rede_hoteleira_ocupacao_eventos

Ferramentas e Recursos

Você precisará de acesso ao Google Cloud Platform (GCP) para utilizar o BigQuery e consultar os dados públicos disponíveis no projeto datario. Além disso, vamos utilizar a biblioteca basedosdados em Python para acessar os dados do BigQuery.

  • Tutorial para acessar dados no BigQuery, desde a criação da conta no GCP até consultar os dados utilizando SQL e Python: Como acessar dados no BigQuery

Todas as APIs utilizadas no desafio são públicas e possuem documentações com exemplos.

Perguntas do Desafio

As perguntas do desafio estão detalhadas nos arquivos perguntas_sql.md e perguntas_api.md.

Etapas

  1. Siga o tutorial acima para criar sua conta no GCP e aprender como utilizar o BigQuery para consultar os dados.
  2. Faça um fork desse repositório.
  3. Utilize SQL para resolver todas as questões contidas no arquivo perguntas_sql.md no BigQuery. Salve suas respostas em um arquivo analise_sql.sql.
  4. Utilize Python e pandas para resolver todas as questões contidas no arquivo perguntas_sql.md. Salve suas respostas em um arquivo analise_python.py ou analise_python.ipynb. Para acessar os dados do BigQuery no python, siga o tutorial acima e utilize a biblioteca basedosdados.
  5. Utilize Python para resolver todas as questões contidas no arquivo perguntas_api.md. Salve suas respostas em um arquivo analise_api.py ou analise_api.ipynb.
  6. Utilize o LookerStudio, Power BI, StreamLit, Tableau ou qualquer outra ferramenta de visualização de sua preferência para criar visualizações informativas dos dados das tabelas e APIs. Suas visualizações não precisam se limitar apenas aos resultados das análises; é encorajado que você explore os dados e crie visualizações interessantes sobre eles.
  7. Faça commits incrementais à medida que trabalha no desafio e, finalmente, faça push do seu código para o seu repositório no GitHub. Seu repositório deve conter um README com todos os passos necessários para rodar seu código e ver a visualização de dados que você criou.

Avaliação

Você será avaliado em cada uma das categorias abaixo, com seus respectivos pesos:

  • SQL: peso 1
  • Python: peso 2
  • Visualização de Dados: peso 1

Uma média ponderada será calculada e os melhores candidatos serão chamados para a etapa de entrevistas.

Dica: procure fazer algo diferente! Devido à grande quantia de candidatos, é possível que uma boa média não seja suficiente para te garantir uma entrevista. Tente se destacar!

Dúvidas

Se tiver alguma dúvida ou precisar de esclarecimentos adicionais sobre o desafio, entre em contato pelo email [email protected].

Boa sorte e estamos ansiosos para ver suas soluções!


Escritório de Dados
Prefeitura da Cidade do Rio de Janeiro

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published