Este repositório armazena os trabalhos feitos no ano de 2021 por mim na disciplina de Competições de Ciências de Dados. Neles são respondidas algumas perguntas (que aparecem nos notebooks) de forma objetiva.
Fora realmente uma jornada, como pode-se observar, o nível de detalhamento/proffisionalismo/familiaridade com as bibliotecas e modelos fora crescendo ao longo dos trabalhos:
-
Houve uma ampla fase de testes, porém a integração com estruturas de pipeline já existentes não fora muito proveitosa, e o preprocessamento se mostrou pouco efetivo, embora pudesse fazer sentido.
-
Devido a restrições de tempo e problemas com a execução no collab (RAM esgotada), além de alguns erros na geração de algumas respostas finais o trabalho não pode ser finalizado em sua totalidade, mas creio que o aprendizado fora o suficiente a ponto de poder avançar mais em direção a algo mais proveitoso.
-
Neste trabalho optou-se por uma abordagem mais sucinta, porém mais correta e organizada, devido à restrições de tempo e limitações de processamento em RAM do collab. Mesmo assim mais abordagens do que as mostradas ao final foram testadas, porém por simplicidade e clareza a entrega final mostrou menos modelos, e apenas aqueles com tempo de treino/validação viável.
Num geral, apesar das dificuldades, creio que fora extremamente proveitoso!