Apache Solr - Apache Solr
Desenvolvedor (s) | Apache Software Foundation |
---|---|
Versão estável | 8.10.1 / 18 de outubro de 2021
|
Repositório | Repositório Solr |
Escrito em | Java |
Sistema operacional | Plataforma cruzada |
Modelo | API de pesquisa e índice |
Licença | Licença Apache 2.0 |
Local na rede Internet |
solr |
Solr (pronuncia-se "solar") é uma plataforma de pesquisa corporativa de código aberto , escrita em Java . Seus principais recursos incluem pesquisa de texto completo , destaque de ocorrências , pesquisa facetada , indexação em tempo real, clustering dinâmico, integração de banco de dados, recursos NoSQL e manipulação de documentos ricos (por exemplo, Word, PDF). Fornecendo pesquisa distribuída e replicação de índice, o Solr foi projetado para escalabilidade e tolerância a falhas . Solr é amplamente usado para casos de uso de pesquisa e análise corporativa e tem uma comunidade de desenvolvimento ativa e versões regulares.
Solr é executado como um servidor de pesquisa de texto completo independente. Ele usa a biblioteca de pesquisa Lucene Java em seu núcleo para indexação e pesquisa de texto completo e possui APIs HTTP / XML e JSON semelhantes a REST que o tornam utilizável a partir das linguagens de programação mais populares. A configuração externa do Solr permite que ele seja adaptado a muitos tipos de aplicativos sem codificação Java e possui uma arquitetura de plug-in para oferecer suporte a personalizações mais avançadas.
O Apache Solr é desenvolvido de forma aberta e colaborativa pelo projeto Apache Solr na Apache Software Foundation .
História
Em 2004, o Solr foi criado por Yonik Seeley na CNET Networks como um projeto interno para adicionar capacidade de pesquisa para o site da empresa.
Em janeiro de 2006, a CNET Networks decidiu publicar abertamente o código-fonte doando-o à Apache Software Foundation . Como qualquer novo projeto Apache, ele entrou em um período de incubação que ajudou a resolver questões organizacionais, jurídicas e financeiras.
Em janeiro de 2007, o Solr passou do status de incubação para um projeto autônomo de nível superior (TLP) e cresceu de forma constante com recursos acumulados, atraindo usuários, colaboradores e committers. Embora bastante novo como projeto público, ele alimentou vários sites de alto tráfego.
Em setembro de 2008, o Solr 1.3 foi lançado incluindo recursos de pesquisa distribuída e melhorias de desempenho, entre muitos outros.
Em janeiro de 2009, Yonik Seeley, juntamente com Grant Ingersoll e Erik Hatcher, juntou-se à Lucidworks (anteriormente Lucid Imagination), a primeira empresa a fornecer suporte comercial e treinamento para tecnologias de pesquisa Apache Solr. Desde então, as ofertas de suporte em torno do Solr têm sido abundantes.
Novembro de 2009 viu o lançamento do Solr 1.4. Esta versão introduziu melhorias na indexação, pesquisa e facetação junto com muitas outras melhorias, como processamento de documentos ricos ( PDF , Word , HTML ), agrupamento de resultados de pesquisa baseado em Carrot2 e também integração de banco de dados aprimorada. A versão também apresenta muitos plug-ins adicionais.
Em março de 2010, os projetos Lucene e Solr se fundiram. Os downloads separados continuaram, mas os produtos agora eram desenvolvidos em conjunto por um único conjunto de committers.
Em 2011, o esquema de número de versão do Solr foi alterado para corresponder ao do Lucene. Depois do Solr 1.4, a próxima versão do Solr foi rotulada como 3.1, para manter o Solr e o Lucene no mesmo número de versão.
Em outubro de 2012, o Solr versão 4.0 foi lançado, incluindo o novo recurso SolrCloud. 2013 e 2014 viram uma série de lançamentos Solr na linha 4.x, aumentando continuamente o conjunto de recursos e melhorando a confiabilidade.
Em fevereiro de 2015, o Solr 5.0 foi lançado, o primeiro lançamento em que o Solr é empacotado como um aplicativo independente, encerrando o suporte oficial para a implantação do Solr como uma guerra . O Solr 5.3 apresentou uma estrutura integrada de autenticação e autorização plugável.
Em abril de 2016, o Solr 6.0 foi lançado. Adicionado suporte para a execução de consultas SQL paralelas em coleções SolrCloud. Inclui suporte para StreamExpression e um novo driver JDBC para a interface SQL.
Em setembro de 2017, o Solr 7.0 foi lançado. Esta versão, entre outras coisas, adicionou suporte a vários tipos de réplicas, escalonamento automático e um mecanismo de matemática.
Em março de 2019, o Solr 8.0 foi lançado, incluindo muitas correções de bugs e atualizações de componentes. Os nós Solr agora podem ouvir e atender a solicitações HTTP / 2. Esteja ciente de que, por padrão, as solicitações internas também são enviadas usando HTTP / 2. Além disso, um login de UI de administrador foi adicionado com suporte para BasicAuth e Kerberos. E traçar expressões matemáticas no Apache Zeppelin agora é possível.
Em novembro de 2020, a Bloomberg doou o Operador Solr para o projeto Lucene / Solr. O Operador Solr ajuda a implantar e executar o Solr no Kubernetes .
Em fevereiro de 2021, o Solr foi estabelecido como um projeto Apache (TLP) separado, independente do Lucene.
Operações
Para pesquisar um documento, o Apache Solr executa as seguintes operações em sequência:
- Indexação: converte os documentos em um formato legível por máquina.
- Consulta: compreender os termos de uma consulta feita pelo usuário. Esses termos podem ser imagens ou palavras-chave, por exemplo.
- Mapeamento: o Solr mapeia a consulta do usuário para os documentos armazenados no banco de dados para encontrar o resultado apropriado.
- Classificação: assim que o motor pesquisa os documentos indexados, classifica os resultados pela sua relevância.
Comunidade
Solr tem indivíduos e empresas que contribuem com novos recursos e correções de bugs.
Integrando Solr
Solr é empacotado como a busca embutida em muitos aplicativos, como sistemas de gerenciamento de conteúdo e sistemas de gerenciamento de conteúdo corporativo . As distribuições do Hadoop da Cloudera , Hortonworks e MapR agrupam o Solr como mecanismo de busca para seus produtos comercializados para big data . O DataStax DSE integra o Solr como um mecanismo de busca com o Cassandra . Solr é suportado como um ponto final em várias estruturas de processamento de dados e estruturas de integração corporativa .
O Solr expõe APIs semelhantes a REST HTTP padrão da indústria com suporte a XML e JSON e se integrará a qualquer sistema ou linguagem de programação que suporte esses padrões. Para facilidade de uso, também existem bibliotecas de cliente disponíveis para Java , C # , PHP , Python , Ruby e a maioria das outras linguagens de programação populares.
Veja também
- Estrutura Semântica Aberta
- Arquitetura orientada para pesquisa
- Lista de bibliotecas de recuperação de informação
Referências
Bibliografia
- Grainger, Trey; Potter, Timothy (março de 2014). Solr em ação (1ª ed.). Manning Publications . p. 664. ISBN 9781617291029.
- Smiley, David; Pugh, Eric; Parisa, Kranti; Mitchell, Matt (fevereiro de 2014). Apache Solr 4 Enterprise Search Server (1ª ed.). Publicação de pacote . p. 451. ISBN 9781782161363.
- Serafini, Alfredo (dezembro de 2013). Guia do Iniciante do Apache Solr (1ª ed.). Publicação de pacote . p. 324. ISBN 9781782162520.
- Rafalovitch, Alexandre (junho de 2013). Instant Apache Solr para indexação de dados How-to (1ª ed.). Publicação de pacote . p. 90. ISBN 9781782164845.
- Kuć, Rafał (janeiro de 2013). Apache Solr 4 Cookbook (1ª ed.). Publicação de pacote . p. 328. ISBN 9781782161325.
- Smiley, David; Pugh, Eric (20 de novembro de 2011). Apache Solr 3 Enterprise Search Server (1ª ed.). Publicação de pacote . p. 418. ISBN 1-84951-606-5.
- Kuć, Rafał (22 de julho de 2011). Apache Solr 3.1 Cookbook (1ª ed.). Publicação de pacote . p. 300. ISBN 1-84951-218-3.
- Smiley, David; Pugh, Eric (19 de agosto de 2009). Solr 1.4 Enterprise Search Server (1ª ed.). Publicação de pacote . p. 336. ISBN 1-84719-588-1.