MC-EA02
Análise de dados com Python

Professor: Grupo PET-CC (UFRN)
  1. Acsa Laiane Arcanjo Augusto
  2. Anny Klarice Fernandes Souza
  3. Gabriel Martins Spínola
  4. Kevin Wallacy de Souza Maciel


Horarios: Terça 22 e Quinta 24 de 11:30h às 13:00h

Objetivo: Espera-se que, ao final do curso, o aluno tenha adquirido conhecimentos sobre o funcionamento da linguagem de programação Python, incluindo: utilização de listas e dicionários, estruturas condicionais, comandos de iteração e criação de funções.
Além disso, os alunos também irão conhecer as bibliotecas:
  1. Pandas: uma ferramenta poderosa, fácil e flexível de manipulação e análise de dados;
  2. Numpy: uma biblioteca que suporta o processamento de grandes, multi-dimensionais arranjos e matrizes, juntamente com uma grande coleção de funções matemáticas de alto nível para operar sobre estas matrizes.
  3. Matplotlib: uma biblioteca para criação de gráficos e visualizações de dados, sendo eles estáticos, animados ou interativos;
  4. Seaborne: outra biblioteca para visualização de dados, baseada em matplotlib. Provê uma interface de alto nível para criar gráficos estáticos atrativos e informativos.
Essas bibliotecas são amplamente utilizadas em aplicações de ciência de dados.
Teremos, então, a demonstração de aplicações do Pandas com o auxílio dos seguintes datasets: base de dados de animes, doenças cardíacas, dados sobre o tempo ocioso de uma rede de trens, dados de incêndio na floresta amazônica e das notas do ENEM. A partir disso, será possível importá-los para um notebook e com isso realizar diversas análises de dados e demonstrar diferentes formas de exibi-los.

Requisitos: Conta no Google Drive para desenvolver as atividades e acessar os notebooks.
Desejável: Conhecimentos básicos de lógica de programação imperativa.

Ementa: O curso abordará a linguagem python, a sintaxe da linguagem, abordando as variáveis; estruturas de dados (List, Set...); indentação; tipagem dinâmica; estruturas condicionais; estruturas de repetição; funções; importação de bibliotecas/arquivos de código fonte; biblioteca Numpy; biblioteca Pandas; visualização de dados; biblioteca Matplotlib; biblioteca Seaborn.

Metodología:O curso será disposto em quatro aulas: duas síncronas e duas assíncronas. Nas aulas assíncronas, abordaremos boa parte dos aspectos teóricos da linguagem Python, explicando seu funcionamento com conteúdos disponibilizados via notebook (Colab) e vídeos disponibilizados através da plataforma do YouTube. Além disso, também serão apresentadas as famosas bibliotecas NumPy e Pandas. Já nas aulas síncronas, trabalharemos com aplicações implementadas, utilizando os recursos abordados nas aulas assíncronas. Após essa breve apresentação, exploraremos então as bibliotecas para visualização de dados e criação de gráficos: Matplotlib e Seaborn; com isso seremos capazes de desenvolver, de uma forma mais visual, os assuntos estudados até então. Também nestes momentos síncronos, teremos a elucidação das dúvidas.