Incorporação semidefinida - Semidefinite embedding

Maximum Variance Unfolding (MVU) , também conhecido como Semidefinite Embedding (SDE), é um algoritmo em ciência da computação que usa programação semidefinida para realizar a redução da dimensionalidade não linear de dados de entrada vetorial de alta dimensão .

É motivado pela observação de que a análise de componentes principais do kernel (kPCA) não reduz a dimensionalidade dos dados, pois aproveita o truque do kernel para mapear não linearmente os dados originais em um espaço interno do produto .

Algoritmo

MVU cria um mapeamento dos vetores de entrada de alta dimensão para algum espaço vetorial euclidiano de baixa dimensão nas seguintes etapas:

  1. Um gráfico de vizinhança é criado. Cada entrada é conectada com seus vetores de entrada k-mais próximos (de acordo com a métrica de distância euclidiana) e todos os vizinhos k-mais próximos são conectados entre si. Se os dados são amostrados bem o suficiente, o gráfico resultante é uma aproximação discreta da variedade subjacente.
  2. O gráfico de vizinhança é "desdobrado" com a ajuda da programação semidefinida. Em vez de aprender os vetores de saída diretamente, a programação semidefinida visa encontrar uma matriz de produto interna que maximize as distâncias aos pares entre quaisquer duas entradas que não estão conectadas no gráfico de vizinhança, preservando as distâncias dos vizinhos mais próximos.
  3. A incorporação de baixa dimensão é finalmente obtida pela aplicação de escalonamento multidimensional na matriz de produto interna aprendida.

As etapas de aplicação de programação semidefinida seguidas de uma etapa de redução de dimensionalidade linear para recuperar uma incorporação de baixa dimensão em um espaço euclidiano foram propostas pela primeira vez por Linial , London e Rabinovich.

Formulação de otimização

Deixe ser a entrada original e a incorporação. Se forem dois vizinhos, a restrição de isometria local que precisa ser satisfeita é:

Let Ser as matrizes Gram de e (ou seja:) . Podemos expressar a restrição acima para todos os pontos vizinhos em termos de :

Além disso, também queremos restringir a incorporação para centralizar na origem:

Conforme descrito acima, exceto que as distâncias dos pontos vizinhos são preservadas, o algoritmo visa maximizar a distância entre pares de cada par de pontos. A função objetivo a ser maximizada é:

Intuitivamente, maximizar a função acima é equivalente a puxar os pontos o mais longe possível uns dos outros e, portanto, "desdobrar" a variedade. A restrição de isometria local

Deixe onde

impede a função objetivo de divergir (indo para o infinito).

Como o gráfico tem N pontos, a distância entre dois pontos quaisquer . Podemos então limitar a função objetivo da seguinte maneira:

A função objetivo pode ser reescrita puramente na forma da matriz de Gram:

Finalmente, a otimização pode ser formulada como:

Depois que a matriz de Gram é aprendida por programação semidefinida, a saída pode ser obtida por meio da decomposição de Cholesky .

Em particular, a matriz de Gram pode ser escrita como onde está o i-ésimo elemento do autovetor do autovalor .

Segue-se que o -ésimo elemento da saída é .

Veja também

Notas

Referências

Material adicional