análise de componentes independentes do Kernel - Kernel-independent component analysis

Em estatística, análise de componentes independentes do kernel (ICA kernel) é um algoritmo eficiente para análise de componentes independentes que estima componentes de origem, otimizando a variância generalizada função de contraste, que é baseado em representações em um núcleo reprodução espaço de Hilbert . Essas funções de contraste usar a noção de informação mútua como uma medida de independência estatística .

Ideia principal

Kernel ICA é baseado na ideia de que as correlações entre duas variáveis aleatórias podem ser representados em um espaço de reprodução do kernel Hilbert (RKHS) , denotada por , associada a um mapa recurso definido para um fixo . O -correlation entre duas variáveis aleatórias e é definido como

onde as funções variar ao longo e

para fixo . Observe que a propriedade reproduzir implica que para fixo e . Segue-se então que o -correlation entre duas variáveis aleatórias independentes é zero.

Esta noção de -correlations é usado para a definição de contraste funções que são optimizadas no algoritmo Kernel ACI. Especificamente, se é uma matriz de dados prewhitened , isto é, a média da amostra de cada coluna é zero e a covariância amostra das linhas representa a matriz identidade dimensional, Kernel ICA calcula uma matriz ortogonal dimensional , de modo a minimizar finito-amostra -correlations entre as colunas de .

Referências