This is an old revision of the document!

Risorse CODE

Qui sotto trovate una breve descrizione delle risorse linguistiche che stiamo creando all'interno del progetto CODE e che serviranno da supporto per la scrittura di unità formative in inglese lingua franca. Le risorse create finora includono un corpus di descrizioni di unità formative (DUF) e un'interfaccia web per l'inserimento e la gestione dei testi.

Corpus

All'interno del progetto CODE abbiamo creato vari corpora di DUF descritti qui sotto:

CODE-ELF

È un corpus monolingue in inglese ELF formato da DUF relative a tre aree geografiche/linguistiche: area italiana, area germanofona (Austria e Germania) e area francofona (Francia e Belgio). Il corpus contiene 150 descrizioni di unità formative per ciascuna area geografica e una serie di informazioni per ciascun testo raccolto, tra cui: macro-area disciplinare (life sciences, physical sciences, social sciences), Paese (AU, BE, DE, FR, IT), nome dell'ateneo, ciclo di studi (first, second, unknown) e qualità del testo (low, medium, high), definita secondo i parametri della guida ECTS.

CODE-NAT

È un corpus monolingue in inglese nativo formato da DUF pubblicate nel Regno Unito e in Irlanda, e raccolte con varie tecniche manuali e semi-automatiche. Il corpus contiene 11.000 testi provenienti da 97 università britanniche (88 dal Regno Unito e 9 dall'Irlanda) e circa 1 milione di parole (700.000 per il Regno Unito e 300.000 per l'Irlanda). Potrebbe essere usato per l'estrazione di terminologia standard nativa in ambito accademico-istituzionale.

CODE-UniBO

È un corpus bilingue italiano-inglese di descrizioni di unità formative UniBo pubblicate nell'a.a. 2013/2014. Il corpus contiene 4.800 testi in italiano e 4.800 in inglese. Parte di questi testi sono confluiti in una memoria di traduzione bilingue di due milioni di parole.

Interfaccia web

All'interno di CODE abbiamo poi creato un'applicazione web (costituita da un'interfaccia utente e da un database) che consente ai membri del progetto di inserire e gestire i testi del corpus CODE. Il database permette di controllare in ogni momento lo stato di avanzamento della raccolta dei testi, scaricare i testi in tempo reale e selezionarli in base a parametri definiti dagli utenti (sfruttando i metadati del corpus). Accedi all'interfaccia web

Per saperne di più, per contribuire al progetto e per testare le nostre risorse, contattateci all'indirizzo: code@sslmit.unibo.it.