Apache Solr - Apache Solr

Solr
Logotipo da Solr
Desenvolvedor (s) Apache Software Foundation
Versão estável
8.10.1 / 18 de outubro de 2021 ; 0 dias atrás ( 2021-10-18 )
Repositório Repositório Solr
Escrito em Java
Sistema operacional Plataforma cruzada
Modelo API de pesquisa e índice
Licença Licença Apache 2.0
Local na rede Internet solr .apache .org Edite isso no Wikidata

Solr (pronuncia-se "solar") é uma plataforma de pesquisa corporativa de código aberto , escrita em Java . Seus principais recursos incluem pesquisa de texto completo , destaque de ocorrências , pesquisa facetada , indexação em tempo real, clustering dinâmico, integração de banco de dados, recursos NoSQL e manipulação de documentos ricos (por exemplo, Word, PDF). Fornecendo pesquisa distribuída e replicação de índice, o Solr foi projetado para escalabilidade e tolerância a falhas . Solr é amplamente usado para casos de uso de pesquisa e análise corporativa e tem uma comunidade de desenvolvimento ativa e versões regulares.

Solr é executado como um servidor de pesquisa de texto completo independente. Ele usa a biblioteca de pesquisa Lucene Java em seu núcleo para indexação e pesquisa de texto completo e possui APIs HTTP / XML e JSON semelhantes a REST que o tornam utilizável a partir das linguagens de programação mais populares. A configuração externa do Solr permite que ele seja adaptado a muitos tipos de aplicativos sem codificação Java e possui uma arquitetura de plug-in para oferecer suporte a personalizações mais avançadas.

O Apache Solr é desenvolvido de forma aberta e colaborativa pelo projeto Apache Solr na Apache Software Foundation .

História

Em 2004, o Solr foi criado por Yonik Seeley na CNET Networks como um projeto interno para adicionar capacidade de pesquisa para o site da empresa.

Em janeiro de 2006, a CNET Networks decidiu publicar abertamente o código-fonte doando-o à Apache Software Foundation . Como qualquer novo projeto Apache, ele entrou em um período de incubação que ajudou a resolver questões organizacionais, jurídicas e financeiras.

Em janeiro de 2007, o Solr passou do status de incubação para um projeto autônomo de nível superior (TLP) e cresceu de forma constante com recursos acumulados, atraindo usuários, colaboradores e committers. Embora bastante novo como projeto público, ele alimentou vários sites de alto tráfego.

Em setembro de 2008, o Solr 1.3 foi lançado incluindo recursos de pesquisa distribuída e melhorias de desempenho, entre muitos outros.

Em janeiro de 2009, Yonik Seeley, juntamente com Grant Ingersoll e Erik Hatcher, juntou-se à Lucidworks (anteriormente Lucid Imagination), a primeira empresa a fornecer suporte comercial e treinamento para tecnologias de pesquisa Apache Solr. Desde então, as ofertas de suporte em torno do Solr têm sido abundantes.

Novembro de 2009 viu o lançamento do Solr 1.4. Esta versão introduziu melhorias na indexação, pesquisa e facetação junto com muitas outras melhorias, como processamento de documentos ricos ( PDF , Word , HTML ), agrupamento de resultados de pesquisa baseado em Carrot2 e também integração de banco de dados aprimorada. A versão também apresenta muitos plug-ins adicionais.

Em março de 2010, os projetos Lucene e Solr se fundiram. Os downloads separados continuaram, mas os produtos agora eram desenvolvidos em conjunto por um único conjunto de committers.

Em 2011, o esquema de número de versão do Solr foi alterado para corresponder ao do Lucene. Depois do Solr 1.4, a próxima versão do Solr foi rotulada como 3.1, para manter o Solr e o Lucene no mesmo número de versão.

Em outubro de 2012, o Solr versão 4.0 foi lançado, incluindo o novo recurso SolrCloud. 2013 e 2014 viram uma série de lançamentos Solr na linha 4.x, aumentando continuamente o conjunto de recursos e melhorando a confiabilidade.

Em fevereiro de 2015, o Solr 5.0 foi lançado, o primeiro lançamento em que o Solr é empacotado como um aplicativo independente, encerrando o suporte oficial para a implantação do Solr como uma guerra . O Solr 5.3 apresentou uma estrutura integrada de autenticação e autorização plugável.

Em abril de 2016, o Solr 6.0 foi lançado. Adicionado suporte para a execução de consultas SQL paralelas em coleções SolrCloud. Inclui suporte para StreamExpression e um novo driver JDBC para a interface SQL.

Em setembro de 2017, o Solr 7.0 foi lançado. Esta versão, entre outras coisas, adicionou suporte a vários tipos de réplicas, escalonamento automático e um mecanismo de matemática.

Em março de 2019, o Solr 8.0 foi lançado, incluindo muitas correções de bugs e atualizações de componentes. Os nós Solr agora podem ouvir e atender a solicitações HTTP / 2. Esteja ciente de que, por padrão, as solicitações internas também são enviadas usando HTTP / 2. Além disso, um login de UI de administrador foi adicionado com suporte para BasicAuth e Kerberos. E traçar expressões matemáticas no Apache Zeppelin agora é possível.

Em novembro de 2020, a Bloomberg doou o Operador Solr para o projeto Lucene / Solr. O Operador Solr ajuda a implantar e executar o Solr no Kubernetes .

Em fevereiro de 2021, o Solr foi estabelecido como um projeto Apache (TLP) separado, independente do Lucene.

Operações

Para pesquisar um documento, o Apache Solr executa as seguintes operações em sequência:

  1. Indexação: converte os documentos em um formato legível por máquina.
  2. Consulta: compreender os termos de uma consulta feita pelo usuário. Esses termos podem ser imagens ou palavras-chave, por exemplo.
  3. Mapeamento: o Solr mapeia a consulta do usuário para os documentos armazenados no banco de dados para encontrar o resultado apropriado.
  4. Classificação: assim que o motor pesquisa os documentos indexados, classifica os resultados pela sua relevância.

Comunidade

Solr tem indivíduos e empresas que contribuem com novos recursos e correções de bugs.

Integrando Solr

Solr é empacotado como a busca embutida em muitos aplicativos, como sistemas de gerenciamento de conteúdo e sistemas de gerenciamento de conteúdo corporativo . As distribuições do Hadoop da Cloudera , Hortonworks e MapR agrupam o Solr como mecanismo de busca para seus produtos comercializados para big data . O DataStax DSE integra o Solr como um mecanismo de busca com o Cassandra . Solr é suportado como um ponto final em várias estruturas de processamento de dados e estruturas de integração corporativa .

O Solr expõe APIs semelhantes a REST HTTP padrão da indústria com suporte a XML e JSON e se integrará a qualquer sistema ou linguagem de programação que suporte esses padrões. Para facilidade de uso, também existem bibliotecas de cliente disponíveis para Java , C # , PHP , Python , Ruby e a maioria das outras linguagens de programação populares.

Veja também

Referências

Bibliografia

links externos