O SAS é uma importante ferramenta de análise de dados muito utilizada no mundo empresarial. Seu uso no ambiente doméstico não é tão trivial quanto o Python ou R, que além de gratuitos estão a um download de distância.
No caso do SAS é disponibilizado uma versão para uso acadêmico, chamada de SAS University Edition, essa versão brevemente será substituída pelo SAS OnDemand for Academics. Essas versões podem ser a porta de entrada se você quer aprender a linguagem.
Escrevi 5 códigos que fazem alguns tratamentos comuns de dados, utilizando os famosos datasets Airpassagers e Iris. A ideia não é dar um curso de SAS, mas sim servir como uma referência para quem já tem alguma noção da linguagem ou ao menos entende de SQL e precisa fazer alguma coisa básica em SAS (ou nem tão básica, já que entramos em Macros).
- Exemplo 1: ARIMA:
- Renomeamos colunas em um dataset;
- Ordenamos um dataset (PROC SORT);
- Removemos linhas duplicadas (PROC SORT);
- Comparamos dois datasets (PROC COMPARE);
- Utilizamos um modelo ARIMA (PROC ARIMA);
- Criamos média móveis e alisamento exponencial (PROC EXPAND);
- Cruzamento de bases com DATA STEP (PROC MERGE);
- Exemplo 2: IRIS:
- Importamos um CSV (PROC IMPORT);
- Verificamos as colunas e tipos da base (PROC CONTENTS);
- Utilizamos comandos DATA STEP para tratar o dataset;
- IF e ELSE IF (equivale ao case when no SQL);
- Dividimos os dados em conjunto de treinamento e teste (PROC SURVEYSELECT);
- Treinamos um modelo (PROC REG);
- Escoramos o modelo (PROC SCORE);
- Criação de queries em SQL (PROC SQL);
- Modelo de árvore (PROC HPSPLIT);
- Exemplo 3: Datas:
- Criamos um dataset com dados escritos no próprio DATA utilizando o parâmetro “infile”;
- Mostramos como as datas são armazenadas no SAS;
- Formatamos as datas;
- Filtramos as datas;
- Calculamos intervalos entre datas;
- Convertemos texto para número;
- Deixamos em maiúsculo ou minúsculo o texto;
- Exemplo 4: Macros:
- Definição de macro variáveis;
- “Print” de texto no “console”;
- Criação de macro variáveis com PROC SQL;
- Criação de macros;
- Uso de controle de fluxo (if, else);
- Uso de loop;
- Uso de loop para escrita de SQL;
- Truques para macros;
- Exemplo 5: Gráficos:
- Plota gráfico de série temporal (PROC SGPLOT);
- Esboça scatter plot com dataset Iris (PROC SGPLOT).