Caros alunos sejam bem vindos à disciplina ILE. Será um prazer falar para vocês sobre Python e R.
Aqui neste repositório deixarei disponível todo o material que utilizaremos em nossas aulas: os dados e o enunciado do trabalho final da disciplina e outros itens que eu achar interessante. Estejam sempre atentos a este arquivo pois aqui deixarei atualizações sobre mudanças no conteúdo desta pasta.
- 03/10/2017 - Inserção do material para o trabalho final e do 10 minutes to pandas
- 21/09/2017 - Atualização do repo com o material da segunda oferta da disciplina
- 22/05/2017 - Atualização dos slides, do arquivo
Exercício Python.ipynb
e deste arquivo com link para artigo com os principais módulos Python para DS em 2017 - 19/05/2017 - Adicionados os arquivos necessários para a realização do trabalho final da disciplina
- 16/05/2017 - Adicionados arquivos iris.data, python-wikipedia.txt e RealEstate.csv para exercícios e exemplos de E/S em arquivos.
- 30/04/2017 - Este arquivo foi adicionado
- 23/04/2017 - Criação do curso com o plano de ensino, exercícios e slides utilizados em sala de aula
- Engenheiro Eletricista graduado em 2002
- Pós graduado em Gestão Empresarial em 2004
- Pós graduado em Estatística Empresarial em 2009
- Cursando Pós Graduação em Ciência de Dados e Big Data
- Trabalhando com ciência de dados e mineração de dados desde 2010
Todos esses links estão nos slides e também no arquivo Exercícios Python.ipynb mas resolvi deixar aqui para facilitar a vida de vocês ;)
- https://wiki.python.org/moin/PortugueseLanguage (Esse está em Português)
- https://python.nilo.pro.br/ (Livro muito bom de programação com Python)
- https://wiki.python.org/moin/BeginnersGuide
- http://pandas.pydata.org/pandas-docs/version/0.18.1/10min.html
- https://sites.google.com/site/undergraduateguidetor/manual-files/undergradguidetoR.pdf
- https://cran.r-project.org/doc/contrib/Verzani-SimpleR.pdf
- https://www.tutorialspoint.com/r/
https://m.facebook.com/groups/138322456272633?view=permalink&id=1064175937020609
-
Introdução à Ciência da Computação com Python Parte 1 (USP) https://www.coursera.org/learn/ciencia-computacao-python-conceitos
-
Python Fundamentos para Análise de Dados http://www.datascienceacademy.com.br/pages/curso-python-fundamentos-para-analise-de-dados
-
Python Básico https://solyd.com.br/treinamentos/python-basico
-
Aulas Python https://www.youtube.com/playlist?list=PLfCKf0-awunOu2WyLe2pSD2fXUo795xRe
-
Python para Zumbis https://www.youtube.com/playlist?list=PLUukMN0DTKCtbzhbYe2jdF4cr8MOWClXc
-
Curso Python 300 https://www.youtube.com/playlist?list=PL8eBmR3QtPL0j3QLEjQ6rcx8rVB8Ir893
-
Python Programming: A Concise Introduction (Wesleyan University) https://www.coursera.org/learn/python-programming-introduction
-
Data Analysis and Interpretation Specialization (Wesleyan University) https://www.coursera.org/specializations/data-analysis (Este item é uma especialização composta por 4 cursos + 1 projeto. Pode se aprender Python ou SAS.)
-
Data Management and Visualization https://pt.coursera.org/learn/data-visualization
-
Data Analysis Tools https://pt.coursera.org/learn/data-analysis-tools
-
Regression Modeling in Practice https://pt.coursera.org/learn/regression-modeling-practice
-
Machine Learning for Data Analysis https://pt.coursera.org/learn/machine-learning-data-analysis
-
Data Analysis and Interpretation Capstone https://pt.coursera.org/learn/data-analysis-capstone
-
-
Introduction to Computer Science and Programming Using Python (MIT) https://www.edx.org/course/introduction-computer-science-mitx-6-00-1x-9
-
Using Python for Research (Harvard) https://www.edx.org/course/using-python-research-harvardx-ph526x
-
Intro to Python for Data Science https://www.datacamp.com/courses/intro-to-python-for-data-science
-
Introduction To Python Programming https://www.udemy.com/pythonforbeginnersintro/
-
Learn Python: Python for Beginners https://www.udemy.com/learn-python/
-
Python for Beginners with Examples https://www.udemy.com/ardit-sulce-python-for-beginners/
-
Python for Absolute Beginners https://www.udemy.com/python-for-absolute-beginners-u/
-
Learn Python, it's CAKE (Beginners) https://www.udemy.com/learning-python-not-the-snake/
-
Deep Learning Prerequisites: The Numpy Stack in Python https://www.udemy.com/deep-learning-prerequisites-the-numpy-stack-in-python/
-
Start Programming Today with Python! https://www.udemy.com/free-python/
-
Making Graphs in Python using Matplotlib for Beginners https://www.udemy.com/making-graphs-in-python-using-matplotlib-for-beginners/
-
Python Object Oriented Full Guide https://www.udemy.com/python-object-oriented-from-scratch/
-
Google's Python Class https://developers.google.com/edu/python/
Bons estudos!
Gartner e Forrester data science platforms 2017
- http://www.kdnuggets.com/2017/04/forrester-gartner-data-science-platforms-machine-learning.html
- http://www.kdnuggets.com/2017/02/gartner-2017-mq-data-science-platforms-gainers-losers.html
Linguagens solicitadas nas vagas de emprego para cientista de dados
- http://www.kdnuggets.com/2017/01/most-popular-language-machine-learning-data-science.html
- https://www.indeed.com/jobtrends/q-python-and-(%22machine-learning%22-or-%22data-science%22)-q-R-and-(%22machine-learning%22-or-%22data-science%22)-q-Java-and-(%22machine-learning%22-or-%22data-science%22)-q-Javascript-and-(%22machine-learning%22-or-%22data-science%22)-q-C-and-(%22machine-learning%22-or-%22data-science%22)-q-C++-and-(%22machine-learning%22-or-%22data-science%22)-q-Julia-and-(%22machine-learning%22-or-%22data-science%22)-q-scala-and-(%22machine-learning%22-or-%22data-science%22).html
- http://r4stats.com/2017/02/28/r-passes-sas/
Recorde mundial cubo 3x3x3: 4.73s Feliks Zemdegs 11/12/2016
Documentação Python
- Tipos de dados: https://docs.python.org/3/library/stdtypes.html
- Precedência de operadores: https://docs.python.org/3/reference/expressions.html#operator-precedence
- Tutorial: https://docs.python.org/3/tutorial/index.html
- Configuração e uso do Python: https://docs.python.org/3/using/index.html
- Download do Python: https://www.python.org/
- Recomendo o Anaconda: https://www.continuum.io/downloads
- Recomendo ainda mais o miniconda: https://conda.io/miniconda.html
- Faça parte da comunidade!
- Folha de colas do anaconda: https://conda.io/docs/_downloads/conda-cheatsheet.pdf
- Gestão de ambientes conda: https://conda.io/docs/using/envs.html
- Criação de ambientes em Python: https://docs.python.org/3/library/venv.html
- Instalando módulos: https://docs.python.org/3/installing/index.html
- Jupyter:
- Boas práticas do uso do Jupyter: https://www.svds.com/jupyter-notebook-best-practices-for-data-science/
- Acesso remoto ao Jupyter: http://jupyter-notebook.readthedocs.io/en/latest/public_server.html
- Dicas de uso do Jupyter: https://medium.com/towards-data-science/jupyter-notebook-hints-1f26b08429ad
- IDEs para Python: IDEs para Python: https://wiki.python.org/moin/IntegratedDevelopmentEnvironments e https://wiki.python.org.br/IdesPython
- Baterias inclusas: https://docs.python.org/3/py-modindex.html e https://docs.python.org/3/library/index.html
- Modelo de dados: https://docs.python.org/3/reference/datamodel.html#objects-values-and-types
- Operadores de comparação: https://docs.python.org/3/library/stdtypes.html#comparisons
- Operadores lógicos: https://docs.python.org/3/library/stdtypes.html#boolean-operations-and-or-not
- Strings: https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str
- Métodos das strings: https://docs.python.org/3/library/stdtypes.html#string-methods
- Formatação de strings: https://docs.python.org/3/library/string.html#custom-string-formatting
- Condicionais: https://docs.python.org/3/reference/compound_stmts.html#the-if-statement
- Repetição com While: https://docs.python.org/3/reference/compound_stmts.html#the-while-statement
- Repetições com for, range e outras estruturas:
- Estruturas de dados (Listas, tuplas, dicionários): https://docs.python.org/3/tutorial/datastructures.html
- Listas: https://docs.python.org/3/library/stdtypes.html#list
- Dicts: https://docs.python.org/3/library/stdtypes.html#mapping-types-dict
- Tuplas: https://docs.python.org/3/library/stdtypes.html#tuple
- Definições de funções: https://docs.python.org/3/reference/compound_stmts.html#function-definitions
- Mais sobre funções: https://docs.python.org/3/library/functions.html#sorted e https://docs.python.org/3/tutorial/controlflow.html#more-on-defining-functions
- Acessando arquivos: https://docs.python.org/3/library/io.html#module-io e https://docs.python.org/3/library/functions.html#open
- Módulo csv: https://docs.python.org/3/library/csv.html
- Módulo sqlite3 para banco de dados SQLite: https://docs.python.org/3/library/sqlite3.html
- Principais módulos para ciência de dados:
- Os principais módulos em 2017: https://medium.com/activewizards-machine-learning-company/top-15-python-libraries-for-data-science-in-in-2017-ab61b4f9b4a7
- Statsmodels: http://statsmodels.sourceforge.net/
- scikit-learn: http://scikit-learn.org/stable/
- NumPy: http://www.numpy.org/
- Matplotlib: http://matplotlib.org/
- pandas: http://pandas.pydata.org/
- Folha de colas oficial: https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf
- Outra folha de colas: https://s3.amazonaws.com/assets.datacamp.com/blog_assets/PandasPythonForDataScience+(1).pdf