Como (e por que) usar a função Outliers no Excel


0

Um valor discrepante é um valor significativamente maior ou menor que a maioria dos valores em seus dados. Ao usar o Excel para analisar dados, os valores discrepantes podem distorcer os resultados. Por exemplo, a média média de um conjunto de dados pode realmente refletir seus valores. O Excel fornece algumas funções úteis para ajudar a gerenciar seus valores discrepantes, então vamos dar uma olhada.

Um Exemplo Rápido

Na imagem abaixo, os valores discrepantes são razoavelmente fáceis de identificar – o valor de dois atribuídos a Eric e o valor de 173 atribuído a Ryan. Em um conjunto de dados como esse, é fácil identificar e lidar com esses discrepantes manualmente.

Faixa de valores que contêm valores discrepantes

Em um conjunto maior de dados, esse não será o caso. Conseguir identificar os discrepantes e removê-los dos cálculos estatísticos é importante – e é isso que veremos como fazer neste artigo.

Como encontrar discrepâncias em seus dados

Para encontrar os outliers em um conjunto de dados, usamos as seguintes etapas:

  1. Calcule o primeiro e o terceiro quartis (falaremos sobre o que esses são daqui a pouco).
  2. Avalie o intervalo interquartil (também explicaremos isso um pouco mais abaixo).
  3. Retorne os limites superior e inferior do nosso intervalo de dados.
  4. Use esses limites para identificar os pontos de dados externos.

O intervalo de células à direita do conjunto de dados visto na imagem abaixo será usado para armazenar esses valores.

Gama para quartis

Vamos começar.

Etapa 1: Calcular os quartis

Se você dividir seus dados em quartos, cada um desses conjuntos será chamado de quartil. Os 25% mais baixos do intervalo compõem o 1º quartil, os próximos 25% o 2º quartil e assim por diante. Demos esse passo primeiro porque a definição mais amplamente usada de um outlier é um ponto de dados que é mais do que 1,5 intervalos interquartis (IQRs) abaixo do 1º quartil e 1,5 intervalos interquartis acima do 3º quartil. Para determinar esses valores, primeiro precisamos descobrir quais são os quartis.

O Excel fornece uma função QUARTIL para calcular quartis. Requer duas informações: a matriz e o quart.

=QUARTILE(array, quart)

o matriz é o intervalo de valores que você está avaliando. E a quart é um número que representa o quartil que você deseja devolver (por exemplo, 1 para o 1st quartil, 2 para o 2º quartil e assim por diante).

Nota: No Excel 2010, a Microsoft lançou as funções QUARTILE.INC e QUARTILE.EXC como aprimoramentos na função QUARTILE. QUARTILE é mais compatível com versões anteriores ao trabalhar com várias versões do Excel.

Vamos voltar à nossa tabela de exemplos.

Gama para quartis

Para calcular o 1st Quartil, podemos usar a seguinte fórmula na célula F2.

=QUARTILE(B2:B14,1)

Quando você insere a fórmula, o Excel fornece uma lista de opções para o argumento quart.

Para calcular os 3rd quartil, podemos inserir uma fórmula como a anterior na célula F3, mas usando um três em vez de um.

=QUARTILE(B2:B14,3)

Agora, temos os pontos de dados do quartil exibidos nas células.

Valores do 1º e 3º quartil

Etapa 2: avaliar o intervalo interquartil

O intervalo interquartil (ou IQR) é o 50% médio dos valores em seus dados. É calculado como a diferença entre o valor do 1º quartil e o valor do 3º quartil.

Vamos usar uma fórmula simples na célula F4 que subtrai a 1st quartil dos 3rd quartil:

=F3-F2

Agora, podemos ver nosso intervalo interquartil exibido.

Valor interquartil

Etapa três: retornar os limites inferior e superior

Os limites inferior e superior são os menores e maiores valores do intervalo de dados que queremos usar. Quaisquer valores menores ou maiores que esses valores vinculados são os valores discrepantes.

Vamos calcular o limite inferior da célula F5 multiplicando o valor de IQR por 1,5 e subtraindo-o do ponto de dados Q1:

=F2-(1.5*F4)

Fórmula do Excel para o valor limite mais baixo

Nota: Os colchetes nesta fórmula não são necessários porque a parte de multiplicação será calculada antes da parte de subtração, mas eles facilitam a leitura da fórmula.

Para calcular o limite superior na célula F6, multiplicaremos o IQR por 1,5 novamente, mas desta vez adicionar no ponto de dados Q3:

=F3+(1.5*F4)

Valores limite inferior e superior

Etapa quatro: identificar os outliers

Agora que temos todos os dados subjacentes configurados, é hora de identificar nossos pontos de dados externos – aqueles que são inferiores ao valor limite inferior ou superior ao valor limite superior.

Usaremos a função OR para executar esse teste lógico e mostrar os valores que atendem a esses critérios inserindo a seguinte fórmula na célula C2:

=OR(B2<$F$5,B2>$F$6)

Função OR para identificar valores discrepantes

Em seguida, copiaremos esse valor em nossas células C3-C14. Um valor VERDADEIRO indica um erro externo e, como você pode ver, temos dois em nossos dados.

Ignorando os outliers ao calcular a média média

Usando a função QUARTIL, vamos calcular o IQR e trabalhar com a definição mais amplamente usada de um outlier. No entanto, ao calcular a média média de uma faixa de valores e ignorar valores extremos, há uma função mais rápida e fácil de usar. Essa técnica não identificará um discrepante como antes, mas nos permitirá ser flexíveis com o que poderíamos considerar nossa porção discrepante.

A função que precisamos é chamada TRIMMEAN, e você pode ver a sintaxe abaixo:

=TRIMMEAN(array, percent)

o matriz é o intervalo de valores que você deseja calcular a média. o por cento é a porcentagem de pontos de dados a serem excluídos da parte superior e inferior do conjunto de dados (você pode inseri-lo como uma porcentagem ou um valor decimal).

Introduzimos a fórmula abaixo na célula D3 em nosso exemplo para calcular a média e excluir 20% dos valores discrepantes.

=TRIMMEAN(B2:B14, 20%)

Fórmula TRIMMEAN para média excluindo valores extremos


Lá você tem duas funções diferentes para lidar com outliers. Se você deseja identificá-los para algumas necessidades de relatório ou excluí-los de cálculos, como médias, o Excel tem uma função para atender às suas necessidades.


Like it? Share with your friends!

0

0 Comments

Your email address will not be published. Required fields are marked *