Tutorial introdutório para Xarray, um pacote Python de código aberto que é capaz de tornar o trabalho com arranjos de dados multidimensionais e catalogados uma tarefa simples e eficiente. Destaca-se a sua sinergia com outras ferramentas para I/O, plotagem e computação paralela.
Desejo boas-vindas ao tutorial Xarray.
Xarray é um pacote Python de código aberto que visa tornar o trabalho com arranjos de dados catalogados uma tarefa simples, eficiente e até mesmo divertida!
Xarray introduz labels (mapeamento, rótulo, catálogo) como forma de expressar dimensões, coordenadas e atributos construidos acima de arranjos brutos do tipo NumPy, o que permite um fluxo de trabalho e desenvolvimento mais intuitivo, conciso e a prova de erros. O pacote inclui uma biblioteca grande e crescente de funções aplicadas para análises e visualização com essas estruturas de dados.
Xarray é inspirado e inclusive toma várias funcionalidades emprestadas do pandas, o popular pacote para manipulação de dados tabelados. Também é especialmente adaptado para funcionar com arquivos netCDF, que foram a fonte do modelo de dados em Xarray, além de integrar-se perfeitamente com Dask para computação paralela.
Esse tutorial foi projetado para rodar no Binder. O serviço permite executar totalmente na nuvem, nenhuma instalação extra é necessária. Para tanto, basta clicar aqui:
Se você prefere instalar o tutorial localmente, siga os seguintes passos:
Clone o repositório:
git clone https://github.com/fschuch/xarray-tutorial-python-brasil
Instale o ambiente. O repositório inclui um arquivo environment.yaml
no subdiretório .binder
que contém uma lista de todos os pacotes necessários para executar esse tutorial.
Para instalá-los usando conda, use o comando:
conda env create -f .binder/environment.yml
conda activate xarray
Inicie uma seção Jupyter:
jupyter lab
Referências
Peça ajuda:
O material é composto por múltiplos Jupyter Notebooks. Eles, por sua vez, são compostos por uma mistura de código, texto, visualizações e exercícios.
Se essa é sua primeira experiência com JupyterLab, não se preocupe, ele é bastante simular com o Jupyter Notebook clássico. Se essa é a sua primeira vez com um Notebook, aqui vai uma introdução rápida:
Enter
para editar uma célular (assim como essa célula em Markdown);Esc
para retornar ao modo de comando;Shift + Enter
para executar a célula e mover o cursor para a célula seguinte;O conteúdo abordado será o seguinte: