Risorse CODE

Qui sotto trovate una breve descrizione delle risorse linguistiche che stiamo creando all'interno del progetto CODE e che serviranno da supporto per la scrittura di unità formative in inglese lingua franca. Le risorse create finora includono un corpus di descrizioni di unità formative (DUF) e un'interfaccia web per l'inserimento e la gestione dei testi.

Corpus

All'interno del progetto CODE abbiamo creato vari corpora di DUF descritti qui sotto:

  • CODE-ELF

    È un corpus monolingue in inglese ELF formato da DUF relative a tre aree geografiche/linguistiche: area italiana, area germanofona (Austria e Germania) e area francofona (Francia e Belgio). Il corpus contiene 150 descrizioni di unità formative per ciascuna area geografica e una serie di informazioni per ciascun testo raccolto, tra cui: macro-area disciplinare (life sciences, physical sciences, social sciences), Paese (AU, BE, DE, FR, IT), nome dell'ateneo, ciclo di studi (first, second, unknown) e qualità del testo (low, medium, high), definita secondo i parametri della guida ECTS.
  • CODE-NAT

    È un corpus monolingue in inglese nativo formato da DUF pubblicate nel Regno Unito e in Irlanda, e raccolte con varie tecniche manuali e semi-automatiche. Il corpus contiene 11.000 testi provenienti da 97 università britanniche (88 dal Regno Unito e 9 dall'Irlanda) e circa 1 milione di parole (700.000 per il Regno Unito e 300.000 per l'Irlanda). Potrebbe essere usato per l'estrazione di terminologia standard nativa in ambito accademico-istituzionale.
  • CODE-UniBO

    È un corpus bilingue italiano-inglese di descrizioni di unità formative UniBo pubblicate nell'a.a. 2013/2014. Il corpus contiene 4.800 testi in italiano e 4.800 in inglese. Parte di questi testi sono confluiti in una memoria di traduzione bilingue di 2 milioni di parole.

Interfaccia web

All'interno di CODE abbiamo poi creato un'applicazione web (costituita da un'interfaccia utente e da un database) che consente ai membri del progetto di inserire e gestire i testi del corpus CODE. Il database permette di controllare in ogni momento lo stato di avanzamento della raccolta dei testi, scaricare i testi in tempo reale e selezionarli in base a parametri definiti dagli utenti (sfruttando i metadati del corpus). Accedi all'interfaccia web

Per saperne di più, per contribuire al progetto e per testare le nostre risorse, contattateci all'indirizzo: code@sslmit.unibo.it.