Open Search Server (OSS) è un software del motore di ricerca sviluppato sotto licenza open source GPL v3.
Costruito utilizzando le migliori tecnologie open source disponibili, Open Search Server è una stabile e ad alte prestazioni pezzo di software. È sia un moderno motore di ricerca e una serie di algoritmi di ricerca ad alta potenza testo integrale.
Open Search Server gira su Windows 20xx / XP / Vista, Mac OS X, Solaris e Linux + Java Virtual Machine.
OSS motore
Questo add-on è una libreria nativa sviluppato in C ++, e un notevole impulso alle capacità di Open Search Server. Grazie ad un codice nativo ottimizzato, OSS Engine ottiene prestazioni eccezionali di Open Search Server. I miglioramenti includono:
* Personalizzazione Pertinenza offre enormi possibilità
* Documento indicizzazione è più veloce di un ordine di grandezza
* Migliorata tempi di risposta
* Numero elevato di possibili interrogazioni simultanee
OSS motore funziona come un add-on per aprire Search Server su Linux, Solaris, Windows 20xx / XP / Vista e Mac OS X sia in 32 o 64 bit. E 'distribuito attraverso l'attribuzione di una licenza proprietaria
Caratteristiche .
- Multi-lingue indicizzazione. I documenti possono essere indicizzati in sedici lingue -. Cinese, Danese, Olandese, Inglese, Finlandese, Francese, Tedesco, Ungherese, Italiano, Norvegese, Portoghese, Rumeno, Russo, Spagnolo, Svedese, Turco
- analizzatori multilingue fetta frasi a parole, quindi eseguire algoritmi lemmatizzazione di parole basato sul linguaggio del documento (singolare / plurale, genere, i verbi coniugati, ecc.)
- I cingoli passare attraverso siti web e file system per creare rapidamente e facilmente il vostro indice.
- formati di documenti Numerosi sono supportati, come ad esempio XML, HTML / XHTML, Adobe PDF, Microsoft Word, PowerPoint, OpenOffice, ecc.
- L'interfaccia web è costruito attorno la potenza offerta dal quadro Zkoss. Funziona con i principali browser Ajax. Questa interfaccia RIA-tipo è più confortevole da utilizzare come quella di un client pesante.
- Semplice configurazione tramite un unico file XML, che comprende campi definizione e le opzioni di indicizzazione.
- integrazione rapidi grazie ad una interfaccia XML tramite query HTTP (XML su HTTP).
Cosa c'è di nuovo in questa versione:.
- Questa versione sviluppatore presenta nuove funzionalità potenti e alcuni bugfix
- La funzione screenshot acquisisce automaticamente gli screenshot delle pagine Web in fase di scansione.
- query di ricerca sono in grado di restituire i termini di campi non memorizzato.
- Filtri negativi sono disponibili.
- Il crawler Web è in grado di seguire i file sitemap.
Cosa c'è di nuovo nella versione 1.2.1-r987:
- Nuove funzionalità:
- 3176150: data / ora
- 3186042: Disattiva non poter (robots.txt)
- 3182953: Crawl URL da un database
- 3182950: Pattern e lista di esclusione disattivabile
- 3182097: Aggiunta campo spinta supporto
- 3175585: Altri risultati simili funzionalità
- 3169421: supporto giapponese e coreano
- 3159477: Identificazione delle pagine web identici
- 3151757: Aggiornamento a PDFBox 1.4.x
- 3141193: supporto FTP / FTPS nel file crawler
- 3141192: supporto SMB / CIFS nel file di crawler
- 3034238: Crawler in grado di accedere a sito web protetto
- 3011773: Aggiungi quarzo come servizio di pianificazione
- 3138603: Aggiornamento Tomcat alla versione 6.0.xx
- 3103055: Convertire entità HTML
- 3087916: Aggiornamento a PDFBox 1.2
- 3043692: Torrent Parser
- 3042488: Audio parser
- 2882260: Aggiungi un parser per text / plain
- 3010010: RTF parser
- 3038733: Aggiungere un filtro di ghiaia
- 3036262: Entra gestione
- 3031800: interfaccia Schema
- 3031204: Aggiunta del supporto Ngram
- 3008440: Indice replica
- 3026212: API e l'interfaccia per l'eliminazione del documento
- 3023327: estrazione di dominio Sub in Web Crawler
- 2820289: crawler database
- 3019035: Neglight url dinamica durante la scansione
- 3017277: Consenti domanda jolly nel browser URL
- 3016491: URL Esportatore
- 3016566: Monitoraggio API
- 3015939: Cluster collasso
- 2830490: Dimensioni dell'indice
- 3011847: Score spiegazione
- 3008633: Possibilità di disattivare l'evidenziazione
- 2997836: Nei campi restituiti hanno campi extra da Meta tag
- 2997826: Possibilità di indicizzare solo il contenuto specificato
- 2991252: Possibilità di indicizzare file binario e per aggiungerlo a un documento
- 2982545: Estrazione informazioni frequenza termine
- 2881385: API per recuperare l'indice disponibile
- 2887376: Valorizzazione per gli indici pagina indice contagocce
- 2881388: API per elencare / creare / modificare i campi in uno schema specifico
- 2973374: Aggiornamento a ZKoss 5.0.x
- 2970747: l'aggiornamento alla versione 6.0.26 Tomcat
- 2966139: Statistiche persi quando OSS restart
- 2964704: Aggiornamento a Lucene 2.9.x
- 2958015: Aggiungi archivio di origine
- 2958005: Aggiornamento libreria Apache HttpClient a 4.0.1
- 2956498: Fornire un modo per inviare le statistiche rapporto via e-mail
- 2953803: Aggiornamento a PDFBox 1.0
- 2953802: Aggiornamento a POI 3.6
- 2953575: rilevamento Charset dovrebbe guardare meta http-equiv
- 2953524: Specificare charset predefinito per parser
- 2929332: sfaccettatura posta collasso
- 2900462: Aggiornamento PDI per 3.5 per xlsx e documenti di supporto
- 2900449: Aggiornamento PDFBox a 0.8
- Correzioni di bug:
- 3178432: valori cron errati nel scheduler
- 3104065: crash cingolati File con java.io.EOFException
- 3090248: configurazione Statistiche perso quando si aggiungono i campi
- 3051308: non viene interpretato
- 2881689: Requests.xml non gira su alcune piattaforme Windows
- 3019491: NullPointerException & gt; a java.util.regex.Matcher
- 3017481: Il crawler web seleziona il padrone di casa in ordine alfabetico
- 3015838: problema crawler Web con codifica UTF-8 BOM
- 2993103: NoClassDefFoundError BouncyCastleProvider
- 2990960: parola chiave non sono state evidenziate a frammenti
- 2982541: sinonimi Phrase generano parole indesiderate
- 2934214: Shifted evidenziazione snippet
Cosa c'è di nuovo nella versione 1.2 Beta:.
- sono stati aggiunti più di 50 nuove funzioni e bugfix
- Un indice può essere replicata su un server remoto.
- Un filtro n-grammi e un filtro di ghiaia offrono nuove possibilità, come ad esempio una cassetta dei suggerimenti, la tolleranza ortografia sbagliato, e la generazione automatica argomento.
- È stato aggiunto un crawler di database di supporto unire query e file esterni.
- Molti miglioramenti sono stati fatti per il crawler Web, come un esportatore URL, estrazione sub-dominio, un elenco di esclusione, scansione manuale e un filtro parametri.
- Una API e l'interfaccia web per il controllo e la supervisione.
- Il nuovo parser audio offre la possibilità di indicizzare torrente, MP3 / MP4, OGG Vorbis, FLAC e WMA.
È stato aggiunto
Cosa c'è di nuovo nella versione 1.1.2:
- Nuove caratteristiche:
- Aggiungi archivio di origine
- Lucene lettura supportano solo
- Correzioni di bug:
- API PHP sicuro su qualche query con caratteri xml sbagliato
- Problema con le statistiche aggregazione
- sembrano Ordina functionnality ignorare tipo di ordinamento
- Problema di prestazioni con una grande cache di campo
- Problema con le prestazioni di web crawler
- Valore negativo sulle statistiche web crawler
- problema Comportamento della funzione jolly
- la duplicazione di campo restituito in XML restituito
Cosa c'è di nuovo nella versione 1.1:
- Sinonimi supporto
- Supporto Controllo ortografico
- crawler Web e file di crawler
- Supporto per altre lingue: rumeno, turco, danese, russo e singoli caratteri cinesi
- supporto OpenDocument Format
- Gestione di diversi indici all'interno di una singola istanza
I commenti non trovato