Full-Text RSS funziona prendendo un URL immesso, l'analisi del contenuto, e la creazione di un feed full-text fuori di esso.
L'alimentazione può essere seguita per le modifiche tramite lettori di feed online o desktop, che lavorano proprio come qualsiasi altro mangime, aggiornando ogni volta che viene rilevata una modifica sulla pagina originale.
RSS full-text nella sua piena gloria è disponibile in due licenze commerciali. Una versione gratuita è disponibile, ma le versioni commerciali resa migliori risultati di estrazione
Cosa c'è di nuovo in questa versione:.
- Apri proprietà del grafico og: titolo, og: tipo, og: url, og: immagini, e OG: descrizione ora restituiti se trovato nella pagina in fase di elaborazione
- Bug fix: certe espressioni XPath non venivano valutati correttamente quando HTML5 parsing è stato attivato
- la gestione dei cookie ora redirect solo su - problema correzioni con alcuni siti (grazie a Dave Vasilevsky)
- Test di compatibilità non mostrerà più HHVM incompatibili - Full-Text RSS lavorato con HHVM 3.7.1 nei nostri test (ma senza supporto Tidy e aggiornamenti di configurazione automatica del sito)
- Agent HTTP Humble aggiornato per supportare la versione 2 di estensione HTTP di PHP
- HTML5-PHP aggiornato
- file di configurazione del sito possono ora includere le intestazioni HTTP (user-agent, biscotto, referer), ad esempio, http_header (utente-agent): PHP / 5.6
- opzione Config rimossa:. $ options - & # X3e; user_agents - i file utilizzo del sito di configurazione
- configurazione del sito che utilizzano single_page_link possono ora seguire con if_page_contains: XPath per renderla condizionale .
- Minimo versione supportata di PHP è ora 5.3. Se è necessario utilizzare PHP 5.2, scaricare Full-Text RSS 3.4
- file di configurazione del sito aggiornati per l'estrazione meglio
- Altre correzioni minori / miglioramenti
biblioteca
file
Cosa c'è di nuovo in versione 3.4:
- parametro Nuova richiesta: SiteConfig consente di inviare regole di estrazione direttamente in richiesta li>
- Nuova richiesta paramter: accettare = (auto | alimentazione | html) determina ciò che ci accettiamo come una risposta (disapprova html = 1 parametro)
- parametro Nuova richiesta: key_redirect = 0 per evitare reindirizzamento HTTP per nascondere chiave API
- Sito possono contenere native_ad_clue: [xpath] per verificare la presenza di elementi che significano che l'articolo è un annuncio nativo
- Nuova opzione di configurazione: remove_native_ads - impostata su true e quando notiamo annunci nativi (vedi sopra) ci rimuoverli dal uscita (solo durante l'elaborazione i feed, non influenza l'uscita quando i punti di ingresso URL di una pagina HTML) .
- uscita del Dosaggio comprenderà annuncio nativo per gli articoli che sembrano essere gli annunci native.
- Nuova opzione di configurazione: user_submitted_config per determinare se il parametro SiteConfig è abilitato o no
- uscita di alimentazione comprende ora con URL del feed generato
- uscita di alimentazione comprende ora con l'URL di quella originale (input) URL
- uscita di alimentazione comprende ora con l'URL per iscriverti al feed generato (usando subtome.com)
- Alimentazione anteprima foglio di stile (feed.xsl) presenta ora una iscrizione al feed collegamento
- problema di codifica dei caratteri fissa per alcuni testi
- problema di codifica dei caratteri fissa per alcuni caratteri in modalità HTML5 parsing
file di configurazione
Cosa c'è di nuovo in versione 3.3:
- Nuovo parser HTML5: HTML5Lib è stato sostituito da HTML5-PHP (il vecchio aveva troppi problemi)
- Nuova opzione di configurazione: tempo di cache ($ opzioni- & gt; cache_time)
- Nuova opzione di configurazione: abilitare / disabilitare il recupero di una singola pagina ($ opzioni- & gt; SinglePage)
- La nuova opzione di configurazione: consentire parser HTML di sostituzione attraverso querystring ($ opzioni- & gt; allow_parser_override)
- parametro Nuova richiesta: parser - usarlo per forzare nuovo parser HTML5 per essere utilizzato, & amp; parser = html5php (che sarà più lenta)
- Expanded parametro di richiesta di debug: & amp; debug = rawhtml (mostra le intestazioni originali di risposta e il corpo), & amp; debug = parsedhtml (mostra il corpo di risposta dopo il parsing)
- statistiche APC ora si aspetta APCu (vecchia versione di APC ancora sostenuta, ma le statistiche nella zona di amministrazione non sarà visibile)
- Aggiornamento automatico delle regole di estrazione site-specific fisso
- intestazioni HTTP Content Security ora utilizzati per l'anteprima di alimentazione
- parametri di richiesta ed esempi di risposta ora elencati in una tabella nella pagina di indice (nuova richiesta Parametri scheda)
- file di test di compatibilità aggiornata per mostrare se HTML5-PHP parser è supportato (PHP 5.3 dipendenza), e per testare HHVM (non ancora supportato)
- opzione Config rimosso: $ opzioni- & gt; registration_key
- Preserve elemento TTL RSS 2.0 feed
- Altre correzioni minori / miglioramenti
Pagina
Cosa c'è di nuovo nella versione 3.2:
- Vai alla scheda può essere escluso dalla uscita (passa & amp; content = 0 in querystring, vedi $ opzioni- & gt; contenuti nel file di configurazione per maggiori informazioni)
- file di configurazione del sito possono ora essere aggiornati automaticamente dal nostro repository GitHub (URL chiamare visibile in area di amministrazione)
- file di configurazione del sito aggiornati per l'estrazione meglio
- PHP Leggibilità aggiornato per essere più indulgente quando si riducono HTML
- biblioteca Rilevamento lingua aggiornato
- HTML meta refresh reindirizzamenti ora seguita anche
- statistiche APC (se APC è disponibile sul server) ora visibile nella zona di admin
- Bug Fix: Duplicate find_string e replace_string valori nei file di configurazione del sito non rimossi (! grazie Fabrizio)
- Bug fix: azioni di tipo MIME ora applicati quando segue gli URL delle pagine singole
- Altre correzioni minori / miglioramenti
Cosa c'è di nuovo nella versione 3.1:
- Consenti più elementi (in precedenza solo uno è stato conservato)
- Bug fix: No più elementi iframe di auto-chiusura
- Bug fix: manifest.yml fisso per evitare che il messaggio di errore durante la distribuzione di AppFog
- Altre correzioni minori / miglioramenti
Cosa c'è di nuovo nella versione 3.0:
- multi-pagina supportnext_page_link ora supportata in sito config (abilitare / disabilitare con $ opzioni- & gt; multipagina)
- HTML5 parser availableuse parser: html5lib in luogo config, puoi anche $ opzioni- & gt; allowed_parsers
- modelli sito aggiornato per l'estrazione meglio
- Nuovo sito globale di configurazione da applicare a tutti i siti (global.txt)
- 'http: //' Striscia prefisso quando viene fornita chiave API
- config Sito fusione (+ fingerprint standard personalizzato + + globale)
- Sito comando config replace_string (Trova): sostituire possono ora essere divisa in due righe: find_string: trovare, replace_string: sostituire
- YouTube e Vimeo URL ora ritornano iframe codice embed
- Ora cerchiamo Opengraph titolo e la data elementi
- Migliore estrazione da AJAX pageswe ora cercare AJAX trigger incorporato in HTML, per Google spec
- JSONP supportuse & amp; format = json & amp; callback = functionName in querystring
- Nuova opzione di configurazione per abilitare Cross-Origin Resource Sharing (CORS): $ Opzione & gt; cors
- Nuova opzione di configurazione per abilitare il filtro XSS, se necessario: $ opzione- & gt; xss_filter
- Zend_Cache aggiornato
- caratteristica cachingexperimental intelligente agli ID di cache negozio di APC prima, e scrive l'output su disco sul successiva richiesta (vedi opzioni-$ & gt; smart_cache)
- Più facile nuvola deploymanifest.yml aggiunto per AppFog
- la cache APC di file di configurazione del sito per migliorare le prestazioni, se APC availablesee $ opzioni- & gt; apc
- Editor di configurazione del sito in admin / facilmente trovare, modificare, testare e sito di prova i file di configurazione, o aggiungerne di nuovi
- modalità di debug per vedere cosa sta succedendo dietro la scenessee $ opzioni- & gt; debug
- Rimosso opzioni deprecate config: limitare, message_to_prepend_with_key, message_to_append_with_key, error_message_with_key
- Rimosso estrazione con i CSS tramite querystring
- Opzioni di configurazione nel Rimossa: $ opzioni- & gt; alternative_url
- Bug fix: consentire l'estrazione di un singolo elemento
- Bug fix: reindirizzare la manipolazione migliorata li>
Requisiti :
- PHP 5.2 o superiore
I commenti non trovato