Este artigo irá explicar o que é Gaussian pyramid e como usar Gaussian pyramid.
Pirâmide gaussiana
A pirâmide gaussiana é uma técnica de processamento de imagem que divide uma imagem em grupos sucessivamente menores de pixels para desfocá-la. Recebeu o nome do matemático alemão Johann Carl Friederich Gauss. Esse tipo de embaçamento matemático preciso é amplamente usado na visão computacional artificialmente inteligente como uma etapa de pré-processamento. Por exemplo, quando uma fotografia digital é desfocada dessa forma, as bordas dos objetos são mais fáceis de detectar, permitindo que um computador os identifique automaticamente.
Como funciona?
A “pirâmide” é construída calculando repetidamente uma média ponderada dos pixels vizinhos de uma imagem de origem e diminuindo a escala da imagem. Pode ser visualizado empilhando versões progressivamente menores da imagem umas sobre as outras. Este processo cria uma forma de pirâmide com a base como a imagem original e a ponta um único pixel representando o valor médio de toda a imagem.
0 Comments