Integração de dados baseada em ontologia - Ontology-based data integration

A integração de dados com base em ontologias envolve o uso de uma ou mais ontologias para combinar dados ou informações de várias fontes heterogêneas de maneira eficaz. É uma das várias abordagens de integração de dados e pode ser classificada como Global-As-View (GAV). A eficácia da integração de dados com base em ontologias está intimamente ligada à consistência e expressividade da ontologia usada no processo de integração.

Fundo

Os dados de várias fontes são caracterizados por vários tipos de heterogeneidade. A seguinte hierarquia é freqüentemente usada:

  • Heterogeneidade sintática : é o resultado das diferenças no formato de representação dos dados
  • Heterogeneidade esquemática ou estrutural : o modelo nativo ou a estrutura para armazenar dados diferem nas fontes de dados, levando à heterogeneidade estrutural. A heterogeneidade esquemática que aparece particularmente em bancos de dados estruturados também é um aspecto da heterogeneidade estrutural.
  • Heterogeneidade semântica : diferenças na interpretação do 'significado' dos dados são fonte de heterogeneidade semântica
  • Heterogeneidade do sistema : o uso de diferentes sistemas operacionais , plataformas de hardware levam à heterogeneidade do sistema

Ontologias , como modelos formais de representação com conceitos definidos explicitamente e relacionamentos nomeados que os ligam, são usadas para abordar a questão da heterogeneidade semântica em fontes de dados. Em domínios como bioinformática e biomedicina , o rápido desenvolvimento, adoção e disponibilidade pública de ontologias [1] tornou possível para a comunidade de integração de dados alavancá-los para integração semântica de dados e informações.

O papel das ontologias

As ontologias permitem a identificação inequívoca de entidades em sistemas de informação heterogêneos e a afirmação de relacionamentos nomeados aplicáveis ​​que conectam essas entidades. Especificamente, as ontologias desempenham as seguintes funções:

Explicação de conteúdo
A ontologia permite a interpretação precisa de dados de fontes múltiplas por meio da definição explícita de termos e relacionamentos na ontologia.
Modelo de Consulta
Em alguns sistemas como o SIMS, a consulta é formulada usando a ontologia como um esquema de consulta global.
Verificação
A ontologia verifica os mapeamentos usados ​​para integrar dados de várias fontes. Esses mapeamentos podem ser especificados pelo usuário ou gerados por um sistema.

Abordagens usando ontologias para integração de dados

Existem três arquiteturas principais que são implementadas em aplicativos de integração de dados baseados em ontologia, a saber,

Abordagem de ontologia única
Uma única ontologia é usada como modelo de referência global no sistema. Esta é a abordagem mais simples, pois pode ser simulada por outras abordagens. SIMS é um exemplo importante dessa abordagem. O componente Structured Knowledge Source Integration do Research Cyc é outro exemplo proeminente dessa abordagem. (Título = Aproveitando Cyc para responder a consultas ad hoc de pesquisadores clínicos). O Dicionário-Ontologia Taxonômica Gellish também segue essa abordagem.
Ontologias múltiplas
Várias ontologias, cada uma modelando uma fonte de dados individual, são usadas em combinação para integração. Porém, essa abordagem é mais flexível do que a abordagem de ontologia única, ela requer a criação de mapeamentos entre as várias ontologias. O mapeamento de ontologias é uma questão desafiadora e é o foco de um grande número de esforços de pesquisa em ciência da computação [2] . O sistema OBSERVER é um exemplo dessa abordagem.
Abordagens híbridas
A abordagem híbrida envolve o uso de várias ontologias que se inscrevem em um vocabulário comum de nível superior. O vocabulário de nível superior define os termos básicos do domínio. Assim, a abordagem híbrida torna mais fácil usar várias ontologias para integração na presença do vocabulário comum.

Veja também

Referências

  1. ^ a b c d e f H. Wache; T. Vögele; U. Visser; H. Stuckenschmidt; G. Schuster; H. Neumann; S. Hübner (2001). Integração de informações baseada em ontologia Um levantamento das abordagens existentes . CiteSeerX  10.1.1.142.4390 .
  2. ^ Maurizio Lenzerini (2002). Integração de dados: uma perspectiva teórica (PDF) . pp. 243–246.
  3. ^ a b A.P. Sheth (1999). "Mudando o Foco na Interoperabilidade em Sistemas de Informação: do Sistema, Sintaxe, Estrutura à Semântica". Sistemas de Informação Geográfica Interoperativos. MF Goodchild, MJ Egenhofer, R. Fegeas e CA Kottman (eds.), Kluwer Academic Publishers (PDF) . pp. 5–30.
  4. ^ AHM02 Tutorial 5: Integração e mediação de dados; Colaboradores: B. Ludaescher, I. Altintas, A. Gupta, M. Martone, R. Marciano, X. Qian
  5. ^ "Tutorial 5 do AHM02: Integração e mediação de dados" . users.sdsc.edu . Página visitada em 2017-11-23 .
  6. ^ a b Y. Arens; C. Hsu; CA Knoblock (1996). Processamento de consultas no mediador de informações sims (PDF) .
  7. ^ http://www.cyc.com/content/semantic-knowledge-source-integration
  8. ^ "Cópia arquivada" . Arquivado do original em 31/12/2010 . Página visitada em 2014-05-15 .CS1 maint: cópia arquivada como título ( link )
  9. ^ https://www.gellish.net
  10. ^ E. Mena; V. Kashyap; A. Sheth; A. Illarramendi (1996). OBSERVER: Uma abordagem para o processamento de consultas em sistemas de informação globais com base na interoperação entre ontologias pré-existentes (PDF) .
  11. ^ Cheng Hian Goh (1997). Representando e Raciocinando sobre Conflitos Semânticos em Sistemas de Informação Heterogênea (PDF) .

links externos