LanguageTool

Software screenshot:
LanguageTool
Dettagli del software:
Versione: 2.9 Aggiornato
Data di caricamento: 14 Apr 15
Sviluppatore: Daniel Naber
Licenza: Libero
Popolarità: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool è un programma di origine correzione di bozze aperto progettato per trovare gli errori che regolari strumenti correttore ortografico non possono rilevare. Si tratta di una regola basata stile e grammaticale che troverà gli errori per cui una regola è definita nelle sue file di configurazione XML, ad esempio mescolando & ldquo; loro & rdquo; con & ldquo;. & rdquo lì;


Rileva i vari problemi di grammatica

Il programma può anche rilevare i vari problemi di grammatica e viene fornito con il supporto per più di 20 lingue, tra cui inglese, tedesco, polacco, francese, spagnolo, svedese, greco, cinese, danese, giapponese, islandese, portoghese e portoghese brasiliano.
Inoltre, vanta un'interfaccia utente grafica facile da usare, semplice e lineare, che permette a chiunque di incollare il testo che deve essere controllato incantesimo. Si può controllare il testo negli appunti, variabile di testo, taglia / copia / incolla del testo, e di soggiornare nella zona di notifica.


Rileva una vasta gamma di problemi

Nella finestra di dialogo Opzioni, è possibile attivare il tipo di problemi l'applicazione in grado di rilevare, tra cui un cattivo stile, errori di grammatica, slang, errori di punteggiatura, i possibili errori di battitura, frasi ridondanti, comunemente parole confuse, collocazioni, la capitalizzazione, la semantica, così come frasi non standard.


LanguageTool per LibreOffice e OpenOffice

Oltre ad essere una applicazione stand-alone, LanguageTool è disponibile come estensione per due delle open-source più popolari e potenti suite per ufficio, LibreOffice e Apache OpenOffice.org anche, consentendo agli utenti di revisionati i loro testi facendo clic destro su frasi selezionate o dei paragrafi.


LanguageTool per Mozilla Firefox

Inoltre, l'applicazione è anche disponibile per il download come un add-on per il mondo & rsquo; s più popolare browser open-source al mondo, Mozilla Firefox. Non richiede il riavvio e pone un piccolo pulsante sulla barra degli strumenti principale, che consente di correggere le bozze del testo evidenziato da siti web o forme.


Sotto il cofano e disponibilità

L'applicazione è scritto interamente in linguaggio di programmazione Java, il che significa che & rsquo; sa software multipiattaforma, progettato per funzionare con qualsiasi distribuzione GNU / Linux, così come la BSD, Solaris, Microsoft Windows e Mac OS operativo X sistemi, in cui è installato il Java Runtime Environment.

Cosa c'è di nuovo in questa versione:

  • catalano:
  • dizionario tag POS aggiornato
  • ha aggiunto nuove regole
  • falsi allarmi fisse
  • English
  • Aggiunto alcune regole e fissato un paio di falsi allarmi
  • Aggiunto molte regole di nuovo stile hanno contribuito da Heikki Lehvaslaiho. Dato che questi possono causare falsi allarmi, essi non sono attivati ​​di default. È possibile attivare accendendo tutte le regole nella nuova categoria 'Plain English'.
  • Esperanto:
  • ha aggiunto alcune nuove regole
  • francese
  • dizionario tag POS aggiornato e dizionario Hunspell per Dicollecte-5.3
  • tedesco:
  • ha aggiunto alcune nuove regole e falsi allarmi fisse
  • Aggiunta una nuova regola che verifica la presenza di un accordo soggetto verbo. Per il momento, sono supportati solo i casi con 'ist', 'sind', 'guerra', e 'Waren'. Esempio di errori che vengono rilevati: '. Der Hund sind SCHA & para, n', 'Die Autos ist schnell.' Per fare questo lavoro regola, frasi sono ora unificate in disambiguation.xml: per esempio, 'Mann' nella frase 'ein Mann' servirà solo a mantenere la sua lettura nominativo (SUB: NOM: SIN: MAS), che ha usato per avere anche letture accusativo e dativo (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • Italiano
  • migliorato alcune regole
  • polacco:
  • aggiunto diverse nuove regole
  • portoghese:
  • aggiunte / migliorate diverse regole
  • 3695 parole composte (pre-riforma) - la più grande banca dati gratuita
  • Russo:
  • aggiunto e norme migliori
  • ucraino:
  • grande aggiornamento dizionario
  • nuove regole grammaticali
  • nuovo semplice sostituire regola per suggerimenti morbide
  • miglioramenti disambiguatore
  • di tagging composto e ortografia miglioramenti

  • Miglioramenti
  • iniziali di tagging
  • frase e parola miglioramenti creazione di token
  • una migliore gestione di stres simbolo e trattino debole
  • regole Bitext:
  • inserisce una regola semplice per verificare se le traduzioni terminano con lo stesso segno di punteggiatura dell'originale (questo include solo.?! Caratteri).
  • è ora possibile aggiungere file di regole bitext esterni sulla riga di comando, utilizzando
  • opzione -bitextrule. Il percorso del file deve essere assoluto. Nota:. Questo permette di utilizzare le regole bitext anche per le lingue che non hanno regole bitext incluse di default
  • Ortografia:
  • I nuovi file alla /hunspell/spelling.txt può essere utilizzato per aggiungere parole accettati per il controllo ortografico che sono considerati anche durante la creazione di suggerimenti per le parole errate. Questo è simile ai file /hunspell/ignore.txt, che elenco accettato le parole che sono * non * utilizzati per la creazione di suggerimenti per le parole errate.
  • API
  • JLanguageTool.activateDefaultPatternRules () e JLanguageTool.activateDefaultFalseFriendRules () sono state rimosse - tutte le norme e le regole del modello falso amico (se viene specificato una seconda lingua) vengono ora attivate automaticamente quando il costruttore di JLanguageTool viene chiamato. Se avete bisogno di una pedina senza le regole del modello basato su XML, estendere la classe di lingua (ad esempio 'inglese'), con uno che sovrascrive i getPatternRules () e restituisce una lista vuota lì.
  • ManualTagger.lookup () è stato sostituito da ManualTagger.tag () dopo essere stato deprecato da l'ultima versione
  • Tutti i metodi e campi di classe 'Lingua' statiche sono state spostate nella nuova classe di 'lingue'. Per ora, / esistono i metodi campi nella classe di lingua ancora, ma sono stati deprecati.
  • LanguageIdentifierTools è stato rimosso. Usa LanguageIdentifier invece.
  • Rimosso (Default) ResourceDataBroker.setResourceDir () e setRulesDir () in quanto questi possono essere impostati con il costruttore
  • Ripulito up super classe, per esempio rimozione getRemark ()
  • Category.setDefaultOff () è stato rimosso, questo può essere impostato con il costruttore ora
  • classi rinominati: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Altre piccole pulizie API che non dovrebbe pregiudicare i casi di uso comune, ad esempio, IncorrectExample.getCorrections () ritorna e la lista non modificabile ora, la rimozione di metodi deprecati.
  • Server incorporato:
  • escape XML è stato risolto, ciò potrebbe causare i documenti XML non validi da restituire
  • nuova opzione del file di configurazione 'maxWorkQueueSize' che consente di impostare la dimensione massima della coda di richieste - se ottiene più grande di questo, le richieste saranno respinte (503 Service unavailable)
  • Il server ora risponde con più specifici codici di stato HTTP a queste condizioni di errore: 413 Request Entity Too Large - se il testo supera la dimensione massima del testo 503 Servizio non disponibile - se il controllo supera il tempo massimo di controllo
  • GUI:
  • L'interfaccia grafica stand-alone possono ora prendere un file di testo come argomento, questo file verrà caricato all'avvio (Github numero # 232).
  • riga di comando:
  • È ora possibile aggiungere un file regola esterna quando si chiama LanguageTool dalla riga di comando. Utilizzare --rulefile per aggiungere un file. Se il nome del file ha un formato che contiene un nome di lingua, verrà utilizzato ad altre norme; altrimenti, sostituirà le regole. È anche possibile caricare un file esterno con falsi amici utilizzando i --falsefriends opzione. Il nome del file deve essere un percorso assoluto, ei file amici falsi sono sempre aggiunti a quelli caricati per la lingua. (Github numero # 192)
  • sintassi regola:
  • Una regola può ora avere una singola frase esempio fintanto che ha un attributo 'correzione' - questo può risparmiare qualche ridondanza se l'unica frase corretta è la stessa della frase non corretta con la correzione applicata. Prima, una regola di bisogno di almeno due frasi di esempio.
  • 'esempio' elemento: type = "scorretto" è ora facoltativo se c'è un attributo 'correzione'. L'attributo 'correzione' implica che la sentenza non è corretta.
  • 'esempio' elemento: type = "corretto" è ora facoltativo. Nessun attributo 'tipo' e nessun attributo 'correzione' implica che la frase è corretta.
  • interno:
  • Siamo passati da Apache Tika al linguaggio-detector (https://github.com/optimaize/language-detector) per identificare automaticamente la lingua del testo. Dovrebbe essere più veloce e risultati dovrebbe essere più affidabile. Rilevazione di Asturie e Galizia doveva essere disabilitato perché la qualità di rilevamento era troppo basso e colpito anche il rilevamento dello spagnolo.
  • fissi una regressione che ha reso impossibile per caricare file di regole esterne nella GUI.

Cosa c'è di nuovo nella versione 2.8:

  • asturiano:
  • dipendenza rimosso su Hunspell, ora usa Morfologik per il controllo ortografico
  • Breton:
  • aggiunto e migliorato alcune regole
  • catalano:
  • dizionario aggiornato
  • aggiunto e norme migliori
  • falsi allarmi fisse
  • olandese:
  • aggiunto e migliorato molte regole
  • English
  • alcune nuove regole (grazie a Nick Hough)
  • aggiornato i dizionari tagger e sintetizzatore, che fissa il numero # 202
  • nuovo filtro da utilizzare per la corrispondenza la partofspeech di parti di parole, ad esempio:. In * Questo sarà solo di tenere gli incontri per le parole che iniziano con 'in' e dove la parte dopo il 'in' è un aggettivo (tag POS 'JJ'). Il 'no: 1' è la posizione del token, cioè qui il primo (e unico) la corrispondenza viene definito
  • .
  • francese:
  • aggiunto e migliorato alcune regole
  • tedesco:
  • aggiunto e migliorato alcune regole
  • polacco:
  • aggiunto e migliorate parecchie regole
  • aggiunto e migliorato falsi amici con l'inglese
  • portoghese:
  • aggiunte / migliorate diverse regole
  • spagnolo:
  • dipendenza rimosso su Hunspell, ora usa Morfologik per il controllo ortografico
  • file di regole riformattato
  • Aggiunte altre regole
  • Tagalog:
  • dipendenza rimosso su Hunspell, ora usa Morfologik per il controllo ortografico
  • il carattere trattino ("") è un delimitatore ora quando creazione di token del testo
  • Russo:
  • aggiunto e norme migliori
  • aggiunto alcune regole falso amico (russo / inglese)
  • ucraino:
  • molte nuove regole (compresi gli accordi con i nomi, espressioni di tempo etc)
  • miglioramento copertura regola
  • Aggiornamento dizionario (grandi miglioramenti per nomi propri e vocativo)
  • nuovo tag e regola per mettere in guardia circa l'ortografia alternativa
  • aggiunto informazioni frequenza delle parole per migliorare i suggerimenti ortografici
  • alcune nuove regole disambiguatore
  • Regola Sintassi:
  • ... ora può essere aggiunto a una RuleGroup di influenzare tutte le regole di quel gruppo
  • Se si sviluppano le proprie regole che non fanno parte di LT è ora possibile aggiungere esterno = "yes" per le vostre categorie per impedire il collegamento regola per community.languagetool.org di apparire nella nostra GUI standalone (il link non avrebbe funzionato per le regole che non fanno parte della distribuzione principale LT). (Github numero # 223)
  • Se un gruppo regola specifica default = "off", le regole all'interno del gruppo di regole non possono specificare anche default = "on" / "off".
  • API
  • classi rimossi e metodi che erano state deprecate da 2.7 o più
  • Server incorporato:
  • Le opzioni del file di configurazione 'requestLimit' e 'requestLimitPeriodInSeconds "può ora essere utilizzato anche per il server HTTP (non solo per il server HTTPS)
  • opzione Nuovo file di configurazione 'trustXForwardForHeader': impostare questo 'true' se si esegue il server dietro un proxy inverso e si desidera che il limite di richieste per lavorare sugli indirizzi IP originali fornite dal HTTP 'Xforwardedfor', di solito impostata dal il proxy. Se si esegue dietro un proxy, ma non si imposta questa proprietà su true, un utente può utilizzare tutte le richieste in modo che altri utenti avranno anche un messaggio di errore a causa del limite di richieste.
  • risposta Fix di After modalità Scadenza: ... a volte era vuoto, confondendo il controllo Testo in WordPress
  • regole Bitext non sono state disattivate correttamente, anche se sono stati specificati con un parametro adeguato per il server; ora è risolto
  • Corretto il problema con le posizioni scorrette per alcune regole bitext (numero # 218)
  • GUI:
  • Una nuova impostazione 'errorColors' è stata aggiunta al file di configurazione languagetool.cfg. Può essere utilizzato per impostare il colore di sfondo errori. Ad esempio, errorColors = tipografico: # b8b8ff, stile: # ffb8b8 mostrerà errori "tipografici" con uno sfondo blu e gli errori di "stile" con uno sfondo rosso nella parte superiore della finestra LT. 'Tipografico' e 'stile' sono i tipi che sono impostati in grammar.xml come "type = ...". Non c'è alcuna interfaccia utente ancora di configurare questi colori. Si noti che si deve solo modificare il file languagetool.cfg quando LT non è in esecuzione.
  • interno:
  • Bugfix: regole all'interno di un gruppo di regole non erano stati attivati ​​se una regola precedente dallo stesso RuleGroup utilizzato default = "off"
  • Le parole non vengono ignorati più dal controllo ortografico solo perché si verificano in suggerimento di una regola. Se si desidera che il controllo ortografico di ignorare le parole a livello globale, aggiungerli alla hunspell / ignore.txt. Per ignorarli a seconda del contesto, aggiungere una regola 'ignore_spelling' a disambiguation.xml.
  • Un file 'hunspell / prohibit.txt' può ora essere utilizzato per contrassegnare le parole come gli errori di ortografia, anche se il controllo ortografico normalmente accettarli. Questo è utile per migliorare la LanguageTool correttore ortografico senza attendere il controllo a monte da aggiornare. Il file 'prohibit.txt' è il contrario di 'ignore.txt', che fa sì che il controllo ortografico per ignorare le parole.
  • Il tagger partofspeech per maggior parte delle lingue può ora essere esteso con l'aggiunta di voci al file org / LanguageTool / risorsa / XX / added.txt (XX è il codice della lingua). Il formato è "fullform BaseForm postag", tre colonne separate da tabulazioni. Questo rende più facile per gli utenti (e gli sviluppatori) per estendere il tagger POS, come non hanno bisogno di esportare, modificare e ricreare il dizionario binario per ogni modifica.

Cosa c'è di nuovo in versione 2.7:

  • Breton:
  • aggiunto e norme migliori
  • Nuova regola che controlla se un giorno feriale corrisponde a una data, ad esempio, rileva "Gwener 28 un EOST cioè 2014", come quella data non è un Venerdì.
  • catalano:
  • aggiunto e norme migliori
  • falsi allarmi fisse
  • olandese:
  • aggiunto e migliorato molte regole
  • passa al correttore ortografico basato su Morfologik
  • -Inglese:
  • Vuoi far parte della squadra che sviluppa più potente strumento di correzione delle bozze Open Source del mondo? Stiamo cercando un manutentore per le regole inglesi in LanguageTool. Per i dettagli vedere http://wiki.languagetool.org/tasks-for-language-maintainers.
  • Tutti i dizionari inglesi sono stati estesi per contenere classi di frequenza di parole per migliorare i suggerimenti del controllo ortografia (i dati di frequenza è tratto da https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / imes / latini / dizionari, come per le altre lingue che utilizzano già questa funzionalità).
  • suggerimenti migliori per studenti di inglese: verbi irregolari, sostantivi e aggettivi ora di solito hanno un suggerimento migliore. Per esempio, 'pensata' suggerisce 'pensiero', 'womans' suggerisce 'donne'.
  • Più errori ortografici fornire suggerimenti ora, ad esempio, 'Garentee' (garanzia), 'grato' (grati). Ciò può causare una riduzione delle prestazioni di circa il 10% (più per i testi con un sacco di parole sconosciute).
  • Nuova regola che controlla se un giorno feriale corrisponde a una data, ad esempio, rileva "Lunedi, 7 October 2014", come quella data non è un Lunedi. Questa regola funziona solo se rileva il formato della data in uso. Finora, questi formati sono supportati: * "Lunedi, 7 October 2014" * "Lunedi, 7 Oct 2014" * "Lunedi, 7 October, 2014" * "Lunedi, Oct 7, 2014" * (questo funziona anche con la settimana abbreviato giorni come Mo o Mon Lunedi)
  • Esperanto:
  • Nuova regola che controlla se un giorno feriale corrisponde a una data, ad esempio, rileva "Vendredon la 28-an de AAgusto 2014", come quella data non è un Venerdì.
  • francese:
  • dizionario tag POS aggiornato e dizionario Hunspell per Dicollecte-5.2
  • aggiunto un sintetizzatore - la regola di accordo ora può dare suggerimenti per alcuni errori
  • aggiunte / migliorate diverse regole
  • Nuova regola che controlla se un giorno feriale corrisponde a una data, ad esempio, rileva "vendredi 28/08/2014", come quella data non è un Venerdì.
  • tedesco:
  • Corretto un NullPointerException rara e un ArrayIndexOutOfBoundsException
  • Risolti diversi falsi allarmi
  • Aggiunto e regole migliorate
  • Nuova regola che verifica la presenza di frasi senza un verbo (disattivata per default a causa del rischio di falsi allarmi)
  • Nuova regola che controlla se un giorno feriale corrisponde a una data, ad esempio, rileva "Dienstag, 2014/09/29", come quella data non è un Martedì.
  • miglioramenti delle prestazioni per controllo ortografico suggerimenti
  • persiano:
  • aggiunto il supporto iniziale per Persiano (Farsi)
  • polacco:
  • aggiunto e migliorato alcune regole
  • nuova regola che controlla se un giorno feriale corrisponde a una data
  • portoghese:
  • aggiunte / migliorate diverse regole
  • aggiunto molte decine di parole composte
  • Russo:
  • ha aggiunto nuove regole
  • fix SourceForge richiesta la funzione # 38 (verificare la presenza di diverse virgolette)
  • aggiunto alcune regole falso amico (russo / inglese)
  • nuova regola che controlla se un giorno feriale corrisponde a una data, ad esempio, rileva "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & micro; & ETH; & frac12; N & sbquo; N ?? & ETH; & plusmn; N & euro; N ?? 2014 & ETH; & sup3 ;. ", come quella data non è un Lunedi
  • .
  • ampliato regola composto russo con nuove parole da dizionario postag
  • spagnolo:
  • Aggiunta nuova categoria POS Z (per i numeri farro, ad esempio, 'Uno', 'dos', ...)
  • Numeri Spelled possono ora essere rilevati e gestiti sia in disambigua e regole.
  • Correzione di alcuni lemmi non corretti nel dizionario POS.
  • Aggiunto Hybrid chunker-disambiguatore.
  • Tamil:
  • Aggiunto il supporto iniziale per Tamil. Se il tipo di carattere per Tamil non viene visualizzato correttamente sul computer e si sta utilizzando Windows, potrebbe essere necessario applicare il lavoro intorno qui descritto: https://bugs.openjdk.java.net/browse/JDK-8008572
  • ucraino:
  • grande aggiornamento per dizionario POS (correzioni e nuove parole)
  • alcuni tag POS ribattezzata per la coerenza; nuovi tag per abbreviazioni e parole rare
  • molte nuove regole e correzioni per le regole esistenti
  • nuova regola che controlla se un giorno feriale corrisponde a una data, ad esempio, rileva "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & micro; & ETH, 'N & ETH;" & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 ", in quanto a tale data non è un Lunedi
  • segno di miglioramento delle prestazioni normalizzazione
  • integrazione LibreOffice:
  • Non fatevi confondere da note in LibreOffice 4.3 e versioni successive (ora ci fornisce le posizioni della nota come metadati, così li possiamo ignorare).
  • API
  • Grandi miglioramenti delle prestazioni per il caso d'uso multi-thread, dove JLanguageTool viene creato per thread, ma l'oggetto di linguaggio (ad esempio 'tedesco') ottiene create solo una volta. Overhead per la creazione di JLanguageTool dovrebbe essere molto inferiore.
  • Rimosso diverse classi e metodi che sono stati deprecati dalla versione 2.6
  • DutchSpellerRule Rimosso - utilizzare MorfologikDutchSpellerRule invece
  • La firma di Language.getRelevantRules () è stato modificato
  • I costruttori JLanguageTool e MultiThreadedJLanguageTool non dichiarano di buttare più un IOException
  • WhitespaceRule è stato rinominato in MultipleWhitespaceRule (WhitespaceRule esiste ancora ma è stato deprecato)
  • Sconsigliata alcuni metodi la cui visibilità sarà ridotta (per esempio, dal pubblico al protetta)
  • MorfologikSpellerRule.getRuleMatch (String, int) è stato rinominato MorfologikSpellerRule.getRuleMatches (String, int)
  • Il costruttore RuleMatch ora genera un'eccezione se toPosition non è più grande di fromPosition
  • Introdotta una nuova TextLevelRule classe astratta che estende Regola e che può essere utilizzato per le regole che coprono più di singole frasi.
  • Riga di comando:
  • Attivazione e disattivazione norme specifiche, allo stesso tempo è ora consentito. Al fine di testare solo alcune regole (disattivazione tutto il resto), che in precedenza è stato fatto con "LIST_OF_RULES --enable", ora usare "LIST_OF_RULES --enabledonly --enable" (o "-eo -e LIST_OF_RULES").
  • Server incorporato:
  • Due nuove opzioni possono essere impostate nel file delle proprietà per rendere LanguageTool ritorno lo stesso formato XML Dopo la scadenza (ATD). In questo modo può essere usato come un rimpiazzo per Contro il Giorno: * Modalità - 'LanguageTool' o 'AfterTheDeadline' * afterTheDeadlineLanguage - codice di lingua di default se la modalità è impostata su 'AfterTheDeadline' NOTA: la modalità 'AfterTheDeadline' deve essere considerato sperimentale per ora.
  • 'maxCheckThreads' La nuova opzione permette di impostare il numero massimo di thread che lavorano sulle richieste in parallelo. Il valore predefinito è 10, come ha usato essere.
  • Internals:
  • Nuova regola AbstractDateCheckFilter astratta che consente di verificare se un giorno della settimana e la data partita. Ad esempio, "Martedì 29 settembre 2014" potrebbe essere rilevato, come 29 settembre 2014 non è in realtà un Martedì. Questo utilizza la nuova interfaccia RuleFilter sperimentale che può essere chiamato da XML con il nuovo elemento 'filtro'. 'Filtro' prende questi attributi: 'classe': il nome completo di una classe Java che implementa RuleFilter, ad esempio, "org.languagetool.rules.de.DateCheckFilter" 'args ": una stringa come" anno: 1 mese: due giorni: 3 giorno della settimana: 4 ", vale a dire un elenco separato da spazi di coppie chiave / valore, dove x viene risolto a valore simbolico del modello (come nell'elemento 'messaggio')
  • La regola composto ora ignora gettoni che sono stati immunizzati nel disambiguation.xml
  • L'azione "filtro" nella disambiguatore viene ora applicato solo ai tag POS che corrispondono al tag POS data. Se non corrispondono, la regola non viene applicata.
  • Se stai all'estensione delle regole XML come descritto al http://wiki.languagetool.org/tips-and-tricks#toc2, i file di regole e di disambiguazione esterni può essere ospitato su un server protetto da password, specificando un URL come questo: http: // utente: password@example.org/path/user-rules.xml
  • La lineetta ("a & euro;" ") è ora un personaggio creazione di token per tutte le lingue
  • Nuova funzione:
  • L'utilizzo di modelli di linguaggio
  • LanguageTool può ora utilizzare i dati Ngram. dati Ngram sono informazioni su come spesso le frasi si verificano in una lingua. Attualmente, questo utilizza frasi di lunghezza 3.
  • I dati vengono utilizzati da una regola inglese per trovare gli errori omofoni, come mescolando grossolano / corso o flair / flare. LanguageTool aveva alcune regole di questo genere prima, ma la nuova regola ora supporta circa 900 di queste coppie di parole / set.
  • I dati necessari per questo è enorme (7GB per l'inglese) e quindi non parte o LanguageTool.
  • I dati (solo in inglese per ora) e altra documentazione è disponibile all'indirizzo http://wiki.languagetool.org/finding-errors-using-big-data
  • Uso ngrams rende LanguageTool leggermente più lento quando i dati sono memorizzati su un SSD.
  • Se non memorizzato su un SSD, le prestazioni potrebbero drasticamente diminuire.
  • Utilizzare la nuova opzione --languagemodel con il client a riga di comando per attivare la regola che utilizza i dati. Tale opzione non è ancora disponibile per l'interfaccia grafica stand-alone.

Cosa c'è di nuovo nella versione 2.4.1:

  • Aggiornato biblioteche Morfologik a 1.8.3 per risolvere suggerimenti lenti nel controllo ortografico, che ha colpito almeno it-IT

Cosa c'è di nuovo nella versione 2.4:

  • Breton:
  • SRX frase tokenizzazione
  • aggiunto / migliorato alcune regole
  • fissi alcuni falsi allarmi
  • fisso suggerimenti corretti grazie a prove aggiunti correzioni
  • catalano:
  • aggiunte / migliorate diverse regole
  • falsi allarmi fisse
  • integrazioni apportate e correzioni al dizionario tagger
  • rimosso alcune parole dal dizionario sintesi (vedi filterarchaic.txt)
  • aggiunto dati di frequenza al dizionario tagger; wordlist frequenza viene dal progetto Gaia, con Apache License, versione 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • English
  • aggiunto / migliorato alcune regole
  • fissi alcuni falsi allarmi
  • francese:
  • aggiunte / migliorate diverse regole
  • fissi alcuni falsi allarmi
  • tedesco:
  • aggiunte / migliorate diverse regole
  • aggiunto un sintetizzatore regola accordo può ora dare suggerimenti per alcuni errori (non tutti i suggerimenti sono corretti, però)
  • polacco:
  • aggiunge / miglioramento delle diverse regole, soprattutto per trattino e uso trattino
  • aggiunto informazioni di frequenza per dizionario ortografico; wordlist frequenza viene dal progetto Gaia, con Apache License, versione 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • fissi alcuni falsi allarmi
  • portoghese:
  • aggiunge / miglioramento delle diverse regole (che comprende oggi norme di genere "a" / "o")
  • ora ha 3400+ parole composte
  • il file JAR è stato rinominato per languagetool.jar, da ex languagetoolstandalone.jar per evitare confusione su ciò che 'standalone' significa, in questo contesto (github numero # 29)
  • per le lingue con molte regole (come il francese o tedesco) prestazioni su testi lunghi è stata aumentata di circa il 2030%
  • correzione per threadsafety (ciò potrebbe causare appendere in MultiWordChunker)
  • risolto un bug per cui le annotazioni chunk non sono stati testati in gruppi
  • fix: 1 e non erano stati valutati in ...
  • corretto un bug nel meccanismo di unificazione che scartato alcune interpretazioni corrispondenti prematuramente
  • ha aggiunto il supporto per le annotazioni chunk nel disambiguatore, e fissato un bug in gettoni di filtraggio con annotazioni chunk
  • aggiornati biblioteche Morfologik a 1.8.2 (correzioni di bug, più severa di ingresso controllo di integrità, aggiungere i dati di frequenza di dizionari)
  • ha aggiunto la possibilità di includere i dati di frequenza per taggging di ortografia o dizionari. Il formato previsto delle liste di parole di frequenza è quella del progetto Gaia, con Apache License, versione 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • nuovi strumenti a linea di comando per esportare e creare dizionari binarie:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • integrazione LibreOffice / OpenOffice:
  • ha aggiunto una soluzione per il rilevamento errato condanna per il caso che una nota a piè apparso dopo un punto frase (Sourceforge bug # 191)
  • GUI standalone: ​​
  • La finestra aperta dal "More ..." nel menu contestuale di un errore ora anche mostrare frasi di esempio corretti
  • API
  • SentenceTokenizer è ora un'interfaccia, l'attuazione è stato spostato a RegexSentenceTokenizer, ma questo è deprecato e SRXSentenceTokenizer deve essere usato al posto
  • Alcuni metodi di org.languagetool.tools.StringTools sono stati spostati alla classe org.languagetool.gui.Tools nel progetto languagetoolguicommons
  • LanguageToolListener.languageToolEventOccured () è stato rinominato LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator non è più pubblico (non dovrebbe interessare a nessuno)
  • rimosso DanishSentenceTokenizer che era stato sconsigliato da tre anni
  • Rule.getCorrectExamples () e Rule.getIncorrectExamples () non restituiscono più nulla, ma un elenco vuoto se non ci sono esempi. Di conseguenza, setCorrectExamples () e setIncorrectExamples () non accettano più nulla.
  • Rule.getId () può restituire qualsiasi stringa ora, non solo ASCIIonly stringhe (in realtà questo è stato il caso prima, come la restrizione ASCIIonly non è mai stato applicato e indicato solo nel javadoc)
  • languagetoolwikipedia: le opzioni della riga di comando per il controllo di una discarica di Wikipedia sono state semplificate. Il comando può ora essere chiamato in questo modo: vaso java languagetoolwikipedia.jar checkdata l it f enwiki20130621pagesarticles.xml Chiama solo "jar java languagetoolwikipedia.jar checkdata" per ottenere un messaggio di utilizzo. Più di un file può essere specificato con l'opzione f. In aggiunta a Wikipedia discariche XML, i file CSV da Tatoeba (http://tatoeba.org) sono ora supportati anche, hanno bisogno di essere filtrati primo a contenere solo la lingua in questione.

Cosa c'è di nuovo nella versione 2.3:

  • Breton:
  • aggiunto / migliorato alcune regole
  • falsi allarmi fisse
  • dizionario POS aggiornato da Apertium (svn r47282)
  • catalano:
  • ha aggiunto il supporto per la lingua con codice ca-ES-valencia (catalana di Valencia), da utilizzare in LibreOffice 4.2.0
  • ha aggiunto una semplice regola sostituirli con centinaia di proposte di sostituzione
  • aggiunte / migliorate diverse regole
  • falsi allarmi fisse
  • cinese:
  • ha aggiunto una soluzione per un StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • English
  • aggiunto modelli di sostituzione per il correttore ortografico di formulare proposte più (ora offre 'insegnato' per 'insegnato')
  • aggiunto / migliorato alcune regole
  • francese:
  • aggiunto / migliorato alcune regole
  • falsi allarmi fisse
  • dizionario tag POS aggiornato e dizionario Hunspell per Dicollecte-4.12
  • tedesco:
  • aggiunte / migliorate diverse regole
  • portoghese:
  • aggiunto / migliorato alcune regole
  • ora ha 3300+ parole composte
  • ucraino:
  • aggiunte / migliorate diverse regole
  • il codice sorgente è stato spostato a github: https://github.com/languagetool-org/languagetool
  • LanguageTool richiede Java 7 ora
  • LanguageTool fa uso di più thread ora per il testo controllo su hardware moderno, migliorando le prestazioni (questo riguarda la versione stand-alone, la versione a riga di comando e l'estensione LibreOffice / OpenOffice)
  • sintassi regola:
  • supporto preliminare per i nuovi attributi min / max che consentono di corrispondere a un elemento che appare il dato numero di volte. Per esempio: pippo corrisponderà nulla o "pippo", cioè "pippo" è foo opzionale corrisponderà "pippo" o foo "foo foo" corrisponderà nulla, "pippo", o "foo foo" Usa max = "- 1" per consentire occorrenze illimitate. Per min, solo 0 o 1 è supportato (1 è l'impostazione predefinita).
  • supporto per O-dichiarazioni. Ad esempio: una internamente e in fase di esecuzione, una regola che contiene O-dichiarazioni viene convertito in alcune regole senza O-dichiarazioni
  • .
  • inglese ha ora un chunker di rilevare, tra l'altro, dai pezzi del sostantivo singolare e plurale. Ciò è documentato a http://wiki.languagetool.org/using-chunks
  • versione standalone: ​​
  • La versione standalone ora sottolinea gli errori con un rosso (errori di ortografia) o blu (altri errori) Linea (Panagiotis Minosse)
  • Ricordatevi la selezione della lingua per il prossimo avvio
  • Migliorata la finestra di dialogo e il posizionamento in una configurazione multi-monitor
  • server integrato: utilizza la porta di default (8081) di nuovo se avviato senza argomenti
  • aggiornato il-morfologik derivante libreria alla versione 1.7.1 per abilitare i suggerimenti migliori, tra cui corretta gestione dei segni diacritici e modelli di sostituzione (equivalenti di MAP e REP caratteristiche dizionari hunspell)
  • OpenOffice integrazione / LibreOffice:
  • fix: la finestra "About" non ha funzionato in Apache OpenOffice 4.0
  • fix: regole specifiche per paese (come per l'inglese britannico) non ha funzionato
  • API
  • Nel corso di lingua, getCountryVariants () è stato rinominato in getCountries (), ed è stato aggiunto un nuovo metodo di getVariant.
  • Alcuni metodi sono stati deprecati
  • Alcuni metodi sono stati spostati dalla classe Tools (LanguageTool-core) per la nuova classe CommandLineTools (LanguageTool-comando)










Cosa c'è di nuovo nella versione 2.2:



Cosa c'è di nuovo nella versione 2.1:





Cosa c'è di nuovo nella versione 2.0:







Requisiti

  • Java 2 Standard Edition Runtime Environment

Altri software di sviluppo Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Commenti a LanguageTool

I commenti non trovato
Aggiungi commento
Accendere le immagini!