English Italiano
Filtri
L'interfaccia "Filtri" consente di cercare documenti interi secondo una serie di criteri che possono essere specificati dall'utente. I documenti possono poi essere analizzati singolarmente oppure scaricati in formato solo testo (.txt) in un unico file .zip.
L'interfaccia "Filtri" consente anche di creare dei sottocorpora che si compongono dei testi individuati tramite un filtro e di assegnare loro un nome. In seguito i sottocorpora appaiono nel menù a tendina dei corpora e si possono effettuare le stesse ricerche del corpus PAISÀ completo.
Criteri di filtraggio
- Parola-chiave – una volta inserita una parola nel campo "parola-chiave", solo i documenti che la contengono verranno recuperati.
- Numero di token all'interno del testo – il numero delle parole contenute nel testo
- Numero di parole (token) che non sono del vocabolario di base – parole che non fanno parte del vocabolario di base secondo queste liste
- Numero di frasi – Numero di frasi che compongono il testo
- Rapporto type-token – Il rapporto type-token all'interno del testo, per ulteriori informazioni consultare qui
- L'indice Gulpease – L'indice Gulpease del testo, per ulteriori informazioni consultare qui
- Il dominio di livello massimo – il finale dell'URL (es. ".it", ".org" or ".com") da cui I testi sono stati scaricati
- URL principale – Il nome delle pagine da cui sono stati tratti più di 500 testi per realizzare il corpus PAISÀ
I risultati dei filtri sono resi accessibili in tre modi:
- Liste di documenti di testo
- Sottocorpora rinominati
- Nuvole di parole
Liste di documenti di testo
I testi che soddisfano i criteri di filtraggio possono essere impaginati cliccando sulle icone a freccia (si veda lo screenshot seguente); i singoli testi possono essere aperti in tab separati cliccando sul nome del file o sull'icona.
Sottocorpora rinominati
È possibile creare un sottocorpus contenente tutti i testi del corpus che soddisfano i criteri di filtraggio; per far ciò è sufficiente scrivere il nome del sottocorpus desiderato nel campo relativo (si veda lo screenshot seguente) e cliccare "invia". Il nome del sottocorpus deve iniziare con una maiuscola e si può comporre di lettere, numeri e underscore (trattino basso).
I sottocorpora creati dall'utente sono visibili nel menù a tendina del corpus e possono essere usati per ricerche successive. Il sottocorpus denominato "Last" è sempre l'ultimo creato dall'utente; è quello quindi composto dai risultati delle ricerche o dei filtri più recenti.
Nuvole di parole
Le nuvole di parole sono create sulla base delle frequenze delle parole contenute in 80 dei dcoumenti che soddisfano i criteri di filtraggio. Le parole sono mostrate in ordine alfabetico e appaiono più o meno grandi a seconda della loro frequenza.
Lo screenshot seguente mostra la nuvola di parole (word cloud) relativa a un gruppo di documenti filtrati in base alla parola "ferie".
La nuovola di parole è realizzata grazie a Google Visualization API.
Non hai trovato ciò che cerchi? Clicca qui per accedere alla lista completa delle nostre pagine di aiuto.