Análise de componente principal multilinear - Multilinear principal component analysis

A análise de componente principal multilinear ( MPCA ) é uma extensão multilinear da análise de componente principal (PCA). MPCA é empregado na análise de matrizes de n-way, ou seja, um cubo ou hipercubo de números, também denominado informalmente de "tensor de dados". Matrizes de N-way podem ser decompostas, analisadas ou modeladas por

  • modelos de tensores lineares, como CANDECOMP / Parafac, ou
  • modelos de tensor multilinear, como análise de componente principal multilinear (MPCA) ou análise de componente independente multilinear (MICA), etc.

A origem do MPCA pode ser rastreada até a decomposição de Tucker e o trabalho de "PCA modo M / PCA de 3 modos" de Peter Kroonenberg. Em 2000, De Lathauwer et al. reafirmou o trabalho de Tucker e Kroonenberg em termos computacionais numéricos claros e concisos em seu artigo SIAM intitulado " Multilinear Singular Value Decomposition ", (HOSVD) e em seu artigo "On the Best Rank-1 and Rank- (R 1 , R 2 , .. ., R N ) Aproximação de tensores de ordem superior ".

Por volta de 2001, Vasilescu reformulou os problemas de análise, reconhecimento e síntese de dados como problemas de tensor multilinear com base no insight de que a maioria dos dados observados são a consequência de composição de vários fatores causais de formação de dados e são adequados para análise de tensores de dados multimodais. O poder do framework tensor foi demonstrado analisando ângulos articulares de movimento humano, imagens faciais ou texturas em termos de seus fatores causais de formação de dados nas seguintes obras: Assinaturas de movimento humano (CVPR 2001, ICPR 2002), reconhecimento facial - TensorFaces , ( ECCV 2002, CVPR 2003, etc.) e computação gráfica - TensorTextures (Siggraph 2004).

Historicamente, MPCA tem sido referido como "modo M PCA", uma terminologia que foi cunhada por Peter Kroonenberg em 1980. Em 2005, Vasilescu e Terzopoulos introduziram a terminologia Multilinear PCA como uma maneira de diferenciar melhor entre a decomposição tensorial linear e multilinear, bem como, para diferenciar melhor entre o trabalho que calculou estatísticas de 2ª ordem associadas a cada modo tensor de dados (eixo) e o trabalho subsequente na Análise de Componente Independente Multilinear que calculou estatísticas de ordem superior associadas a cada modo / eixo de tensor.

O PCA multilinear pode ser aplicado para calcular os fatores causais da formação de dados ou como ferramenta de processamento de sinal em tensores de dados cujas observações individuais foram vetorizadas ou cujas observações são tratadas como matriz e concatenadas em um tensor de dados.

MPCA calcula um conjunto de matrizes ortonormais associadas a cada modo do tensor de dados que são análogas à linha ortonormal e espaço de coluna de uma matriz computada pela matriz SVD. Essa transformação visa capturar a maior variância possível, contabilizando o máximo da variabilidade nos dados associados a cada modo de tensor de dados (eixo).

O algoritmo

A solução MPCA segue a abordagem de mínimos quadrados alternados (ALS). É de natureza iterativa. Como no PCA, o MPCA trabalha com dados centralizados. A centralização é um pouco mais complicada para tensores e depende do problema.

Seleção de recursos

Recursos MPCA: a seleção de recursos MPCA supervisionada é usada no reconhecimento de objetos, enquanto a seleção de recursos MPCA não supervisionada é empregada na tarefa de visualização.

Extensões

Várias extensões do MPCA foram desenvolvidas:

  • MPCA não correlacionado (UMPCA) Em contraste, o MPCA não correlacionado (UMPCA) gera recursos multilineares não correlacionados.
  • Boosting + MPCA
  • MPCA não negativo (NMPCA)
  • MPCA robusto (RMPCA)
  • Fatoração Multi-Tensor, que também encontra o número de componentes automaticamente (MTF)

Referências

links externos