Modelo gráfico - Graphical model

Um modelo gráfico ou modelo gráfico probabilístico ( PGM ) ou modelo probabilístico estruturado é um modelo probabilístico para o qual um gráfico expressa a estrutura de dependência condicional entre variáveis aleatórias . Eles são comumente usados em teoria de probabilidade , estatística - principalmente estatísticas bayesianas - e aprendizado de máquina .

Tipos de modelos gráficos

Geralmente, os modelos gráficos probabilísticos usam uma representação baseada em gráfico como a base para codificar uma distribuição sobre um espaço multidimensional e um gráfico que é uma representação compacta ou fatorada de um conjunto de independências que se mantêm na distribuição específica. Dois ramos de representações gráficas de distribuições são comumente usados, a saber, redes Bayesianas e campos aleatórios de Markov . Ambas as famílias englobam as propriedades de fatoração e independências, mas diferem no conjunto de independências que podem codificar e na fatoração da distribuição que induzem.

Modelo Gráfico Não Direcionado

Um gráfico não direcionado com quatro vértices.

O gráfico não direcionado mostrado pode ter uma de várias interpretações; a característica comum é que a presença de uma aresta implica algum tipo de dependência entre as variáveis aleatórias correspondentes. A partir deste gráfico, podemos deduzir que são todos mutuamente independentes, uma vez que é conhecido, ou (equivalentemente neste caso) que ${\ displaystyle B, C, D}$ ${\ displaystyle A}$

{\ displaystyle P [A, B, C, D] = f_ {AB} [A, B] \ cdot f_ {AC} [A, C] \ cdot f_ {AD} [A, D]}

para algumas funções não negativas . ${\ displaystyle f_ {AB}, f_ {AC}, f_ {AD}}$

Rede bayesiana

Exemplo de um gráfico acíclico direcionado em quatro vértices.

Se a estrutura de rede do modelo é um gráfico acíclico direcionado , o modelo representa uma fatoração da probabilidade conjunta de todas as variáveis aleatórias. Mais precisamente, se os eventos forem , a probabilidade conjunta satisfaz ${\ displaystyle X_ {1}, \ ldots, X_ {n}}$

{\ displaystyle P [X_ {1}, \ ldots, X_ {n}] = \ prod _ {i = 1} ^ {n} P [X_ {i} | {\ text {pa}} (X_ {i} )]}

onde está o conjunto de pais do nó (nós com arestas direcionadas para ). Em outras palavras, a distribuição conjunta se transforma em um produto de distribuições condicionais. Por exemplo, o gráfico acíclico direcionado mostrado na Figura, esta fatoração seria ${\ displaystyle {\ text {pa}} (X_ {i})}$ ${\ displaystyle X_ {i}}$ ${\ displaystyle X_ {i}}$

{\ displaystyle P [A, B, C, D] = P [A] \ cdot P [B | A] \ cdot P [C | A] \ cdot P [D | A, C]}

.

Quaisquer dois nós são condicionalmente independentes, dados os valores de seus pais. Em geral, quaisquer dois conjuntos de nós são condicionalmente independentes, dado um terceiro conjunto, se um critério denominado d -separation for válido no gráfico. As independências locais e globais são equivalentes nas redes bayesianas.

Este tipo de modelo gráfico é conhecido como modelo gráfico direcionado, rede bayesiana ou rede de crenças. Modelos clássicos de aprendizado de máquina, como modelos de Markov ocultos , redes neurais e modelos mais recentes, como modelos de Markov de ordem variável, podem ser considerados casos especiais de redes bayesianas.

Modelos Gráficos Cíclicos Direcionados

Um exemplo de modelo gráfico cíclico direcionado. Cada seta indica uma dependência. Neste exemplo: D depende de A, B e C; e C depende de B e D; enquanto A e B são independentes.

A próxima figura mostra um modelo gráfico com um ciclo. Isso pode ser interpretado em termos de cada variável 'dependendo' dos valores de seus pais de alguma maneira. O gráfico particular mostrado sugere uma densidade de probabilidade conjunta que fatora como

{\ displaystyle P [A, B, C, D] = P [A] \ cdot P [B] \ cdot P [C, D | A, B]}

,

mas outras interpretações são possíveis.

Outros tipos

Classificador Naive Bayes, onde usamos uma árvore com uma única raiz
Rede de dependência onde os ciclos são permitidos
Classificador de árvore aumentada ou modelo TAN
Um gráfico de fator é um gráfico bipartido não direcionado que conecta variáveis e fatores. Cada fator representa uma função sobre as variáveis às quais está conectado. Esta é uma representação útil para compreender e implementar a propagação de crenças .
Uma árvore de cliques ou árvore de junção é uma árvore de cliques , usada no algoritmo de árvore de junção .
Um gráfico de cadeia é um gráfico que pode ter arestas direcionadas e não direcionadas, mas sem quaisquer ciclos direcionados (ou seja, se começarmos em qualquer vértice e nos movermos ao longo do gráfico respeitando as direções de quaisquer setas, não podemos retornar ao vértice de onde começamos se passamos uma flecha). Tanto os grafos acíclicos direcionados quanto os não direcionados são casos especiais de grafos em cadeia, que podem, portanto, fornecer uma maneira de unificar e generalizar as redes Bayesianas e de Markov.
Um grafo ancestral é uma extensão adicional, tendo bordas direcionadas, bidirecionadas e não direcionadas.
Técnicas de campo aleatório
- Um campo aleatório de Markov , também conhecido como rede de Markov, é um modelo sobre um gráfico não direcionado . Um modelo gráfico com muitas subunidades repetidas pode ser representado com notação de placa .
- Um campo aleatório condicional é um modelo discriminativo especificado em um gráfico não direcionado.
Uma máquina de Boltzmann restrita é um modelo gerador bipartido especificado sobre um gráfico não direcionado.

Formulários

A estrutura dos modelos, que fornece algoritmos para descobrir e analisar a estrutura em distribuições complexas para descrevê-los sucintamente e extrair as informações não estruturadas, permite que eles sejam construídos e utilizados de forma eficaz. As aplicações de modelos gráficos incluem inferência causal , extração de informação , reconhecimento de voz , visão computacional , decodificação de códigos de verificação de paridade de baixa densidade , modelagem de redes reguladoras de genes , descoberta de genes e diagnóstico de doenças e modelos gráficos para estrutura de proteínas .

Veja também

Notas

Leitura adicional

Livros e capítulos de livros

Barber, David (2012). Raciocínio Bayesiano e Aprendizado de Máquina . Cambridge University Press. ISBN 978-0-521-51814-7.

Bispo, Christopher M. (2006). "Capítulo 8. Modelos gráficos" (PDF) . Reconhecimento de padrões e aprendizado de máquina . Springer. pp. 359–422. ISBN 978-0-387-31073-2. MR 2247587 .
Cowell, Robert G .; Dawid, A. Philip ; Lauritzen, Steffen L .; Spiegelhalter, David J. (1999). Redes probabilísticas e sistemas especialistas . Berlim: Springer. ISBN 978-0-387-98767-5. MR 1697175 . Um livro mais avançado e estatisticamente orientado
Jensen, Finn (1996). Uma introdução às redes bayesianas . Berlim: Springer. ISBN 978-0-387-91502-9.
Pearl, Judea (1988). Probabilistic Reasoning in Intelligent Systems (2ª edição revisada). San Mateo, CA: Morgan Kaufmann . ISBN 978-1-55860-479-7. MR 0965765 . Uma abordagem de raciocínio computacional, onde as relações entre gráficos e probabilidades foram formalmente introduzidas.

artigos de jornal

Edoardo M. Airoldi (2007). "Introdução aos Modelos Gráficos Probabilísticos" . PLOS Computational Biology . 3 (12): e252. arXiv : 0706.2040 . Bibcode : 2007PLSCB ... 3..252A . doi : 10.1371 / journal.pcbi.0030252 . PMC 2134967 . PMID 18069887 .
Jordan, MI (2004). "Modelos gráficos" . Ciência Estatística . 19 : 140–155. doi : 10.1214 / 088342304000000026 .
Ghahramani, Zoubin (maio de 2015). "Aprendizado de máquina probabilístico e inteligência artificial" . Nature . 521 (7553): 452–459. Bibcode : 2015Natur.521..452G . doi : 10.1038 / nature14541 . PMID 26017444 . S2CID 216356 .

Languages

In other projects