Xarray, estruturas para dados multidimensionais

Resumo

Tutorial introdutório para Xarray, um pacote Python de código aberto que é capaz de tornar o trabalho com arranjos de dados multidimensionais e catalogados uma tarefa simples e eficiente. Destaca-se a sua sinergia com outras ferramentas para I/O, plotagem e computação paralela.

Data
Aug 11, 2020 3:00 PM — 6:00 PM
Local
Online

Introdução

Desejo boas-vindas ao tutorial Xarray.

Xarray é um pacote Python de código aberto que visa tornar o trabalho com arranjos de dados catalogados uma tarefa simples, eficiente e até mesmo divertida!

Xarray introduz labels (mapeamento, rótulo, catálogo) como forma de expressar dimensões, coordenadas e atributos construidos acima de arranjos brutos do tipo NumPy, o que permite um fluxo de trabalho e desenvolvimento mais intuitivo, conciso e a prova de erros. O pacote inclui uma biblioteca grande e crescente de funções aplicadas para análises e visualização com essas estruturas de dados.

Xarray é inspirado e inclusive toma várias funcionalidades emprestadas do pandas, o popular pacote para manipulação de dados tabelados. Também é especialmente adaptado para funcionar com arquivos netCDF, que foram a fonte do modelo de dados em Xarray, além de integrar-se perfeitamente com Dask para computação paralela.

Configurando o Tutorial

Esse tutorial foi projetado para rodar no Binder. O serviço permite executar totalmente na nuvem, nenhuma instalação extra é necessária. Para tanto, basta clicar aqui: Binder

Se você prefere instalar o tutorial localmente, siga os seguintes passos:

  1. Clone o repositório:

    git clone https://github.com/fschuch/xarray-tutorial-python-brasil
    
  2. Instale o ambiente. O repositório inclui um arquivo environment.yaml no subdiretório .binder que contém uma lista de todos os pacotes necessários para executar esse tutorial. Para instalá-los usando conda, use o comando:

    conda env create -f .binder/environment.yml
    conda activate xarray
    
  3. Inicie uma seção Jupyter:

    jupyter lab
    

Material complementar

  1. Referências

  2. Peça ajuda:

Estrutura do Tutorial

O material é composto por múltiplos Jupyter Notebooks. Eles, por sua vez, são compostos por uma mistura de código, texto, visualizações e exercícios.

Se essa é sua primeira experiência com JupyterLab, não se preocupe, ele é bastante simular com o Jupyter Notebook clássico. Se essa é a sua primeira vez com um Notebook, aqui vai uma introdução rápida:

  1. Existem células em dois modos: comando e edição;
  2. A partir do modo de comando, precione Enter para editar uma célular (assim como essa célula em Markdown);
  3. Do modo de edição, precione Esc para retornar ao modo de comando;
  4. Precione Shift + Enter para executar a célula e mover o cursor para a célula seguinte;
  5. A barra de ferramentas contém botões para executar, converter, criar, quebrar e mesclar células.

O conteúdo abordado será o seguinte:

  1. Introdução + Estruturas para dados Multidimensionais
  2. Trabalhando com dados mapeados
  3. Computação com Xarray
  4. Gráficos e Visualização
  5. Introdução ao Dask
  6. Dask e Xarray para computação paralela
Felipe N. Schuch
Felipe N. Schuch
Application Engineer

Possuo experiência na aplicação e também no desenvolvimento de ferramentas computacionais capazes de resolver problemas complexos, além de realizar o processamento, visualização e comunicação dos dados produzidos por essas soluções.

Próximo
Anterior