Apache Solr è una delle più diffuse tecnologie di ricerca aperti intorno.
Costruito in cima al grande successo e apprezzato Lucene del motore, Solr può essere utilizzato per cercare i vari tipi di dati in vari tipi di ambienti e piattaforme.
Con funzionalità di ricerca full-text, Solr è ottimizzato per elevati volumi di traffico, rendendo ideale per qualsiasi tipo di progetto, sia esso o Web basato su desktop.
Solr fornisce anche le associazioni di XML / HTTP, Ruby, JSON, e Python, per l'integrazione con una varietà di altre tecnologie Web.
Cosa c'è di nuovo in questa versione:.
- Miglioramenti dell'usabilità che comprendono il miglioramento script bin e nuove ed esempi ristrutturati
- Script per sostenere installare ed eseguire Solr come servizio su Linux.
- Distributed IDF è ora supportato e può essere abilitato tramite la configurazione.
- Solr non sarà più spedire un file di guerra e invece essere un'applicazione scaricabile.
- SolrJ ora ha il supporto di prima classe per Collezioni API.
- registrazione implicito di replica, ottenere e gestori di amministratore.
- Configurazione API che supporta paramsets per configurare facilmente i parametri Solr e la configurazione di campi. Questa API supporta anche la gestione dei gestori delle richieste preesistenti e la modifica solrconfig.xml comune tramite sovrapposizione.
- API per la gestione delle macchie permette di richiesta caricare barattoli dei gestori e la loro registrazione via config API.
- BALANCESHARDUNIQUE Collezione API che consente anche la distribuzione delle proprietà di replica personalizzato.
- Ora c'è la possibilità di non mischiare la serie nodi fornito durante la creazione di raccolta.
- Possibilità di configurare consumo di banda gestore di replica per evitare che con tutta la banda.
- Frazionamento delle clusterstate a per-raccolta consente il miglioramento di scalabilità in SolrCloud. Questo è anche il formato predefinito per le nuove collezioni che si sarebbero creati in futuro.
- timeAllowed è ora utilizzato per terminare prematuramente richieste durante l'espansione della query e SolrClient richiesta di tentativo.
- risultati pivot.facet possono ora includere annidate risultati stats.field vincolati da tali perni.
- stats.field può essere utilizzato per generare statistiche sui risultati delle funzioni numeriche arbitrarie. Permette anche per la richiesta di statistiche per gli aspetti di articolazione utilizzando i tag.
- Una nuova DateRangeField è stato aggiunto per intervalli di date l'indicizzazione, in particolare quelle con più valori.
- campi spaziali che richiedevano unità = gradi ora prendere distanceUnits = gradi / chilometri miglia invece.
- parser MoreLikeThis ricerca permette la richiesta di documenti simili a un documento esistente e funziona anche in modalità SolrCloud.
- miglioramenti di registrazione.
Cosa c'è di nuovo nella versione 5.2.1 / 4.10.4 / 3.6.2:
- miglioramenti di usabilità che includono un migliorato script bin ed esempi di nuovi e ristrutturati.
- Script per sostenere installare ed eseguire Solr come servizio su Linux.
- Distributed IDF è ora supportato e può essere abilitato tramite la configurazione.
- Solr non sarà più spedire un file di guerra e invece essere un'applicazione scaricabile.
- SolrJ ora ha il supporto di prima classe per Collezioni API.
- registrazione implicito di replica, ottenere e gestori di amministratore.
- Configurazione API che supporta paramsets per configurare facilmente i parametri Solr e la configurazione di campi. Questa API supporta anche la gestione dei gestori delle richieste preesistenti e la modifica solrconfig.xml comune tramite sovrapposizione.
- API per la gestione delle macchie permette di richiesta caricare barattoli dei gestori e la loro registrazione via config API.
- BALANCESHARDUNIQUE Collezione API che consente anche la distribuzione delle proprietà di replica personalizzato.
- Ora c'è la possibilità di non mischiare la serie nodi fornito durante la creazione di raccolta.
- Possibilità di configurare consumo di banda gestore di replica per evitare che con tutta la banda.
- Frazionamento delle clusterstate a per-raccolta consente il miglioramento di scalabilità in SolrCloud. Questo è anche il formato predefinito per le nuove collezioni che si sarebbero creati in futuro.
- timeAllowed è ora utilizzato per terminare prematuramente richieste durante l'espansione della query e SolrClient richiesta di tentativo.
- risultati pivot.facet possono ora includere annidate risultati stats.field vincolati da tali perni.
- stats.field può essere utilizzato per generare statistiche sui risultati delle funzioni numeriche arbitrarie. Permette anche per la richiesta di statistiche per gli aspetti di articolazione utilizzando i tag.
- Una nuova DateRangeField è stato aggiunto per intervalli di date l'indicizzazione, in particolare quelle con più valori.
- campi spaziali che richiedevano unità = gradi ora prendere distanceUnits = gradi / chilometri miglia invece.
- parser MoreLikeThis ricerca permette la richiesta di documenti simili a un documento esistente e funziona anche in modalità SolrCloud.
- miglioramenti di registrazione.
Cosa c'è di nuovo nella versione 5.1.0 / 4.10.4 / 3.6.2:
- miglioramenti di usabilità che includono un migliorato script bin ed esempi di nuovi e ristrutturati.
- Script per sostenere installare ed eseguire Solr come servizio su Linux.
- Distributed IDF è ora supportato e può essere abilitato tramite la configurazione.
- Solr non sarà più spedire un file di guerra e invece essere un'applicazione scaricabile.
- SolrJ ora ha il supporto di prima classe per Collezioni API.
- registrazione implicito di replica, ottenere e gestori di amministratore.
- Configurazione API che supporta paramsets per configurare facilmente i parametri Solr e la configurazione di campi. Questa API supporta anche la gestione dei gestori delle richieste preesistenti e la modifica solrconfig.xml comune tramite sovrapposizione.
- API per la gestione delle macchie permette di richiesta caricare barattoli dei gestori e la loro registrazione via config API.
- BALANCESHARDUNIQUE Collezione API che consente anche la distribuzione delle proprietà di replica personalizzato.
- Ora c'è la possibilità di non mischiare la serie nodi fornito durante la creazione di raccolta.
- Possibilità di configurare consumo di banda gestore di replica per evitare che con tutta la banda.
- Frazionamento delle clusterstate a per-raccolta consente il miglioramento di scalabilità in SolrCloud. Questo è anche il formato predefinito per le nuove collezioni che si sarebbero creati in futuro.
- timeAllowed è ora utilizzato per terminare prematuramente richieste durante l'espansione della query e SolrClient richiesta di tentativo.
- risultati pivot.facet possono ora includere annidate risultati stats.field vincolati da tali perni.
- stats.field può essere utilizzato per generare statistiche sui risultati delle funzioni numeriche arbitrarie. Permette anche per la richiesta di statistiche per gli aspetti di articolazione utilizzando i tag.
- Una nuova DateRangeField è stato aggiunto per intervalli di date l'indicizzazione, in particolare quelle con più valori.
- campi spaziali che richiedevano unità = gradi ora prendere distanceUnits = gradi / chilometri miglia invece.
- parser MoreLikeThis ricerca permette la richiesta di documenti simili a un documento esistente e funziona anche in modalità SolrCloud.
- miglioramenti di registrazione.
Cosa c'è di nuovo nella versione 5.0.0 / 4.10.3 / 3.6.2:
- Bug Fixes :
- Se si utilizza la nuova opzione di cache blocco HDFS globale, si può finire la lettura di file corrotti sul nome del file di riutilizzo.
- CoreContainer riporta percorso non corretto e missleading per solrconfig.xml quando ci sono problemi di caricamento
- StatsComponent quando si utilizza docValues = & quot; vero & quot; multivalore = & quot; vero & quot;
- esclusione fq via & quot; ex & quot; param locale stats.field multivalore
- lo script bin / solr deve passare -DnumShards = 1 per boostrapping collection1 quando si inizia Solr in modalità cloud.
- risposta binaria Writer non restituisce campi jolly.
Cosa c'è di nuovo nella versione 4.9.0:
- Numerose ottimizzazioni per doc valori delle prestazioni di ricerca in tempo
- Consenti un'applicazione client per richiedere il fattore replica minio raggiunto per una richiesta di aggiornamento (lotto singolo o) inviando un parametro & quot facoltativo; min_rf & quot;.
- Interrogazione ri-ranking supporto con il nuovo ReRankingQParserPlugin.
- Un nuovo [bambino ...] DocTransformer per facoltativamente compreso Block-Join documenti discendenti in linea nei risultati di una ricerca.
- Una nuova (default) Lucene49NormsFormat per comprimere meglio alcuni casi come i campi molto corti.
Cosa c'è di nuovo nella versione 4.8.0: {! complexphrase}
- La nuova query parser supporta i caratteri jolly , OR ecc all'interno Query Phrase.
- Nuove Collezioni API azione ClusterStatus riporta lo stato delle collezioni, cocci, e le repliche, ed elenca anche gli alias di raccolta e le proprietà del cluster.
- Aggiunto gestito sinonimi e filtro stopword fabbriche, che consentono liste sinonimi e stopword da gestire dinamicamente tramite REST API.?
- JSON ora supportano documenti figli nidificati, consentendo {bambino!} e {!} genitore blocco join query.
- Aggiunto ExpandComponent per espandere i risultati crollati dal CollapsingQParserPlugin, così come il rapporto padre / figlio di documenti figli nidificate.
- di lunga durata Collezioni API possono ora essere eseguiti in modo asincrono; la nuova azione REQUESTSTATUS fornisce lo stato.
- Aggiunto un parametro hl.qparser per consentire di definire un parser di query per le query hl.q punto culminante.
- Nella modalità single-node Solr, core possono ora essere creati utilizzando named configsets.
aggiornamenti
compiti
Cosa c'è di nuovo nella versione 4.7.0:
- Un nuovo 'migrare' raccolta API per dividere tutto documenti con una chiave rotta in un'altra collezione.
- Aggiunto il supporto per tre livelli compositeId di routing.
- Interfaccia utente Admin - Aggiunto un nuovo & quot; Files & quot; visualizzatore conf directory browser / file.
- Aggiunto un QParserPlugin per SimpleQueryParser di Lucene.
- supporto SSL per SolrCloud.
Cosa c'è di nuovo nella versione 4.6.0:
- Molti miglioramenti e miglioramenti per le opzioni di coccio scissione
- Nuovo AnalyzingInfixLookupFactory di sfruttare la AnalyzingInfixSuggester
- Nuova CollapsingQParserPlugin per il campo ad alte prestazioni crollando sui campi di alta cardinalità
- Nuova API per la gestione della raccolta SolrJ
- Nuovo DocBasedVersionConstraintsProcessorFactory fornendo il supporto per utente configurati regole delle versioni doc-centrica
- Nuovo formato indice di default: Lucene46Codec
- Nuovo tipo EnumField
Cosa c'è di nuovo nella versione 4.5.0:
- Supporto sharding personalizzati, tra cui la possibilità di coccio da campo.
- miglioramenti DocValue: campi valutati singoli non richiedono più un valore predefinito, allowiing dynamicFields contenere valori doc, così come sortMissingFirst e sortMissingLast sui campi docValue .
- Possibilità di memorizzare solr.xml in ZooKeeper.
- sfaccettatura multithreaded.
- CloudSolrServer possono ora aggiornamenti instradare direttamente al capo frammento appropriata.
Cosa c'è di nuovo nella versione 4.4.0:
- Schema REST API: Aggiungere il supporto per la creazione di campi di copia .
- Un segmento unito più caldo ora può essere collegato solrconfig.xml.
- Nuovo MaxScoreQParserPlugin:. Ritorno max () invece di sum () di termini
- I file binari sono ora supportate in ZooKeeper.
- oggetto SolrPing di SolrJ ha nuovi metodi di ping, attivare e disattivare.
- L'interfaccia utente Admin ora supporta l'aggiunta di documenti di Solr.
- Aggiunto un comando PUT allo strumento Solr ZkCli.
- Nuovo & quot; deleteshard & quot; collezioni API che scarica tutte le repliche di un dato frammento e quindi rimuove dallo stato del cluster. Rimuoverà solo i cocci che sono inattivi o non hanno campo.
- Il Custode può ora facoltativamente assegnare i nomi dei nodi generici in modo che i nuovi indirizzi possono ospitare frammenti senza nominare confusione.
- Il CSV di aggiornamento Handler ora supporta la possibilità di aggiungere il numero di riga / ID di riga di un documento.
Cosa c'è di nuovo nella versione 4.3.0:
- Stanco di mantenere le informazioni di base in solr.xml? Ora è possibile configurare Solr per trovare automaticamente core a piedi una directory arbitraria.
- Shard Divisione:. A questo punto è possibile dividere frammenti SolrCloud per espandere il vostro cluster come si cresce
- Il lato di lettura dello schema REST API è stato migliorato e ampliato su: tutte le informazioni sullo schema è ora disponibile e lo schema in diretta completa può ora essere restituito in JSON o XML. Lavoro a terra è incluso per il lato prossima scrittura delle API REST schema.
- query spaziali possono ora ricercare forme indicizzate da & quot; iswithin & quot;
- & quot; Contiene & quot; e & quot; IsDisjointTo & quot; rapporti, oltre al tipico & quot; Interseca & quot;.
Cosa c'è di nuovo nella versione 4.2:
- Consenti nomi shard personalizzato, in modo che i nuovi indirizzi host possono assumere per frammenti in pensione. Lavorando su Amazon senza IP elastiche.
- Lucene 4.2 ottimizzazioni quali vettori compressi termine.
Cosa c'è di nuovo nella versione 3.6.2:
- fissi ConcurrentModificationException durante evidenziando, se sono stati richiesti tutti i campi .
- edismax fissa queryparser applicare minShouldMatch alle query booleane impliciti.
- Molti bugfix al DataImportHandler.
Cosa c'è di nuovo nella versione 4.0-alpha:
- Solr 4.0 alpha include più NoSQL caratteristiche per quelli utilizzando Solr come
- archivio dati primario.
Cosa c'è di nuovo nella versione 3.6.0:
- connettore client Nuova SolrJ utilizzando client HTTP Apache HTTP Componenti .
- Molte fabbriche dell'analizzatore sono ora & quot; ricerca a più consapevole termine & quot; permettendo cose come tipo di campo le lettere minuscole a conoscenza durante la creazione di query di prefisso e jolly.
- Nuovo Kuromoji analizzatore morfologico tokenizes testo giapponese, che producono entrambe le parole composte e la loro segmentazione.
- Gamma sfaccettatura (date e numeri) è ora supportata in cerca distribuita.
- HTMLStripCharFilter è stato completamente ri-implementato, fissando molti bug e migliorando notevolmente le prestazioni.
- StreamingUpdateSolrServer ora supporta il formato javabin.
- Nuova opzione LFU cache per l'utilizzo in cache interne di Solr.
- il miglioramento delle prestazioni di memoria a tutti suggesters basate FST.
- Nuovo WFSTLookupFactory suggester supporta grana fine classifica per i suggerimenti.
- Nuove opzioni per la configurazione della quantità di concorrenza utilizzati nelle ricerche distribuite.
- Molte correzioni di bug.
Cosa c'è di nuovo nella versione 3.5.0:
- Correzioni di bug e miglioramenti di Apache Lucene 3.5.0 , tra cui una molto consistente (3-5x) riduzione RAM necessaria per tenere l'indice termini sull'apertura di un IndexReader.
- Aggiunto il supporto per il raggruppamento risultato distribuita.
- Aggiunto il supporto per Hunspell Stemmer TokenFilter supporto derivante per 99 lingue.
- Un nuovo modulo contrib & quot; langid & quot; aggiunge capacità di identificazione linguaggio come un aggiornamento del processore, usando LanguageIdentifier di Tika o una libreria lingua-rilevamento Cybozu.
- I tipi numerici compresi Trie e tipi di data ora supportano sortMissingFirst / Ultima.
- Aggiunto parametro hl.q. E 'opzionale e se è specificato, la priorità parametro q in Highlighter.
- configurazioni Diverse correzioni di bug minori, come la data di analisi per anni dal 0001-1000, ignorate quando si utilizza QueryAnalyzer con SpellCheckComponent e molti altri.
Cosa c'è di nuovo nella versione 3.4.0:
- Correzioni di bug e miglioramenti di Apache Lucene 3.4.0 , tra cui un bug importante (Lucene-3418), per cui un indice di Lucene potrebbe facilmente essere danneggiato se il sistema operativo o il computer si è schiantato o perso il potere.
- cliente SolrJ può ora analizzare raggruppati e sfaccettature gamma dei risultati.
- Una nuova XsltUpdateRequestHandler permette la pubblicazione XML che è trasformato da un XSLT fornito in un documento Solr valido.
- Post-gruppo sfaccettature (group.truncate) possono ora calcolare i conteggi sfaccettatura per solo i più alti documenti di rango per-gruppo.
- Aggiungi parametro di richiesta di aggiornamento commitWithin a tutti i gestori di aggiornamento che in precedenza erano mancanti esso. Questo dice Solr per confermare la modifica entro il periodo di tempo specificato.
- È ora possibile specificare NIOFSDirectory.
- Nuovo parametro hl.phraseLimit accelera FastVectorHighlighter.
- La cache delle query e la cache del filtro possono essere disabilitati per ogni richiesta.
- utilizzo della memoria migliorata, tempi di costruzione, e le prestazioni di SynonymFilterFactory.
- Aggiunto omitPositions allo schema, in modo da poter omettere informazioni posizione mentre ancora indicizzazione frequenze termine.
- Varie correzioni per DataImportHandler multi-threaded.
opzione
Cosa c'è di nuovo nella versione 3.3.0:
- Raggruppamento / Campo Crollare
- Una nuova, basata automa-suggeriscono / implementazione autocomplete offrendo un ordine di grandezza più piccolo consumo di RAM.
- KStemFilterFactory, un'implementazione ottimizzata di un stemmer meno aggressivo per l'inglese.
- default Solr per una nuova politica di unione più efficiente (TieredMergePolicy). Per ulteriori informazioni, vedere http://s.apache.org/merging.
- bugfix importanti, tra cui l'utilizzo estremamente elevato RAM nel controllo ortografico.
- Correzioni di bug e miglioramenti di Apache Lucene 3.3
Cosa c'è di nuovo nella versione 3.2.0:
- Possibilità di specificare sovrascrivere e commitWithin come parametri di richiesta quando utilizzando il formato JSON aggiornamento.
- TermQParserPlugin, utile quando si generano le query di filtro di condizioni tornati da campo sfaccettatura o il componente di condizioni.
- DebugComponent supporta ora utilizzando un NamedList per modellare oggetti Spiegazione nelle sue risposte, invece di Explanation.toString.
- Miglioramenti alle integrazioni UIMA e Carrot2.
- Evidenziando miglioramenti delle prestazioni.
- Un vaso test-quadro per facilitare la sperimentazione di estensioni Solr.
- Correzioni di bug e miglioramenti di Apache Lucene 3.2.
Cosa c'è di nuovo nella versione 3.1.0:
- sfaccettature intervallo numerico (simili ad oggi sfaccettatura).
- Nuova ricerca spaziale, tra cui filtraggio spaziale, aumentando e funzionalità di ordinamento.
- Esempio Velocity UI ricerca guidato a http: // localhost: 8983 / solr / browse
- Una nuova evidenziatore basata termvector-
- Estendere dismax (edismax) parser di query che affronta alcune caratteristiche mancanti nel parser di query dismax insieme con alcune estensioni.
- Molti altri componenti ora supportano la modalità distribuita:. TermsComponent, SpellCheckComponent
- Una nuova Auto Suggerisci componente.
- Possibilità di ordinare in funzioni.
- documento JSON indicizzazione
- formato CSV risposta li>
- integrazione Apache UIMA per l'estrazione di metadati
- Sfrutta Lucene 3.1 ed è ottimizzazioni e correzioni di bug inerente nonché nuove funzionalità di analisi.
- Numerosi miglioramenti, correzioni di bug e ottimizzazioni.
Cosa c'è di nuovo nella versione 1.4.1:
- Si tratta di una release di bug fix - nessuna modifica sono richiesto durante l'aggiornamento da Solr 1.4.
I commenti non trovato