UIMA - UIMA
UIMA ( / j u I m ə / yoo- EE -mə ), abreviação de Unstructured Arquitetura de Gerenciamento de Informações , é um padrão OASIS para a análise de conteúdo , originalmente desenvolvido na IBM . Ele fornece uma arquitetura de software de componente para o desenvolvimento, descoberta, composição e implantação de análises multimodais para a análise de informações não estruturadas e integração com tecnologias de pesquisa .
Estrutura
A arquitetura UIMA pode ser pensada em quatro dimensões:
- Ele especifica interfaces de componentes em um pipeline de analítica .
- Ele descreve um conjunto de padrões de design .
- Ele sugere duas representações de dados: uma representação na memória de anotações para análises de alto desempenho e uma representação XML de anotações para integração com serviços da web remotos.
- Ele sugere funções de desenvolvimento que permitem que as ferramentas sejam usadas por usuários com diversas habilidades.
Implementações e usos
Desenvolvedor (s) | IBM , Apache Software Foundation (desde outubro de 2006) |
---|---|
Versão estável | 3.1.1 / 8 de novembro de 2019
|
Repositório | |
Escrito em | Java com habilitação C ++ |
Sistema operacional | plataforma cruzada |
Modelo | mineração de texto , extração de informação |
Licença | Licença Apache 2.0 |
Local na rede Internet | uima |
Apache UIMA , uma implementação de referência do UIMA, é mantida pela Apache Software Foundation .
UIMA é usado em vários projetos de software:
- O Watson da IBM Research usa UIMA para analisar dados não estruturados .
- O Sistema de Análise de Texto Clínico e Extração de Conhecimento ( Apache cTAKES ) é um sistema baseado em UIMA para extração de informações de registros médicos.
- O DKPro Core é uma coleção de componentes UIMA reutilizáveis para processamento de linguagem natural de uso geral.
Veja também
- Data Discovery e Query Builder
- Extração de entidade
- Arquitetura Geral para Engenharia de Texto (GATE)
- IBM Omnifind
- Languageware