UIMA - UIMA

Apache UIMA
Desenvolvedor (s)	IBM , Apache Software Foundation (desde outubro de 2006)
Versão estável	3.1.1 / 8 de novembro de 2019 ; 17 meses atrás
Repositório
Escrito em	Java com habilitação C ++
Sistema operacional	plataforma cruzada
Modelo	mineração de texto , extração de informação
Licença	Licença Apache 2.0
Local na rede Internet	uima .apache .org

UIMA ( / j u I m ə / yoo- EE -mə ), abreviação de Unstructured Arquitetura de Gerenciamento de Informações , é um padrão OASIS para a análise de conteúdo , originalmente desenvolvido na IBM . Ele fornece uma arquitetura de software de componente para o desenvolvimento, descoberta, composição e implantação de análises multimodais para a análise de informações não estruturadas e integração com tecnologias de pesquisa .

Estrutura

A arquitetura UIMA pode ser pensada em quatro dimensões:

Ele especifica interfaces de componentes em um pipeline de analítica .
Ele descreve um conjunto de padrões de design .
Ele sugere duas representações de dados: uma representação na memória de anotações para análises de alto desempenho e uma representação XML de anotações para integração com serviços da web remotos.
Ele sugere funções de desenvolvimento que permitem que as ferramentas sejam usadas por usuários com diversas habilidades.

Apache UIMA , uma implementação de referência do UIMA, é mantida pela Apache Software Foundation .

UIMA é usado em vários projetos de software:

O Watson da IBM Research usa UIMA para analisar dados não estruturados .
O Sistema de Análise de Texto Clínico e Extração de Conhecimento ( Apache cTAKES ) é um sistema baseado em UIMA para extração de informações de registros médicos.
O DKPro Core é uma coleção de componentes UIMA reutilizáveis para processamento de linguagem natural de uso geral.