OR2
Stato di avanzamento
- In corso
Descrizione
Attività dell'OR:
- Task 2.1 - Studio e definizione di un modello uniforme per la creazione di annotazioni semantiche
- Task 2.2 - Costruzione e popolazione di ontologie di dominio
- Task 2.3 - Sistemi di annotazione semantica di contlets
- Task 2.4 - Definizione di tecniche semantiche per l’IR e realizzazione di uno strumento integrato per il supporto su basi documentali e portali
- Rapporto Attività di Ricerca del Consulente UNIMED-Sapienza - Questa cartella contiene, come richiesto dal revisore, un rapporto sull'attività di ricerca svolta dal consulente Sapienza (sub-contraente UNIMED) nell'ambito dell'OR 2.
Deliverable
-
Size 35.2 kB - File type application/pdf
D2.1 - Studio e definizione di un modello uniforme per la creazione di annotazioni semantiche
Lo scopo di questo task è quello di analizzare e confrontare i modelli possibili per effettuare l'annotazione di documenti multimediali cercando di creare un modello uniforme e analizzabile. Lo studio ha portato alla definizione di un modello e di una tecnica per la definizione di annotazione semantiche. Nel seguito si descrivono le attività svolte dalle Unità di ricerca della Seconda Università di Napoli (DII e JM) con la consulenza del gruppo di ricerca dell’ Università di Roma Sapienza, unità operativa del Consulente Unimed.
-
Size 393.6 kB - File type application/pdf
TR2.1.1 - Analisi delle metodologie di annotazione: criteri di classificazione ed annotazioni basate su ontologie
L’obiettivo di questo deliverable consiste nell’individuazione di un paradigma funzionale utile per la creazione di annotazioni semantiche, e alla specificazione di un agente software idoneo a sfruttare la conoscenza contenuta nei metadati per fornire servizi complessi agli utenti dell’archivio documentale multimediale nel quale verranno immagazzinati i documenti dell’applicazione LC3.
-
Size 101.9 kB - File type application/pdf
TR2.1.2 - Analisi e confronto dei modelli per l'annotazione semantica di documenti
Le produzione di annotazioni semantiche costituisce il problema principale nella realizzazione del cosiddetto “Semantic Web” e di ogni tipo di strumento di ricerca semantica. Sebbene il problema della creazione automatica di annotazioni semantiche rimanga un problema tuttora irrisolto, in letteratura esistono diversi framework e modelli di annotazione semantica che si focalizzano sul problema della creazione di annotazione in modalità “semi-automatica”. Questi framework utilizzano modelli e API più o meno aperti. In questo TR seguono una descrizione e un confronto dei principali modelli di annotazione semantica presenti in letteratura.
-
Size 220.4 kB - File type application/pdf
TR2.1.3 - Definizione di un modello Concettuale ed Architetturale uniforme di Annotazione Semantica
Compito di questo technical report è quello di introdurre un modello unico di annotazione, che faccia riferimento agli aspetti architetturali e concettuali riguardanti l'annotazione semantica. Verranno illustrata l'architettura di riferimento e il modello unico di annotazione semantica utilizzati come base di progetto per il prototipo del tool di annotazione del progetto LC3.
-
Size 79.8 kB - File type application/pdf
D2.2 - Costruzione e Popolazione di Ontologie di Dominio
Lo scopo di questo task è la definizione e realizzazione di tecniche per la creazione, gestione e popolazione di ontologie di dominio, cioè di una rete semantica di concetti e relazioni mediante le quali annotare documenti testuali, cercando di privilegiare tecniche automatiche o semiautomatiche.
-
Size 3.0 MB - File type application/pdf
TR2.2.1 - Stato dell’Arte dei modelli e dei linguaggi standard per la rappresentazione di ontologie nel Semantic Web
In questo Technical Report si è effettuata l’analisi dello stato dell’arte dei modelli, dei linguaggi standard e delle tecnologie per la rappresentazione di ontologie nel Semantic Web.
-
Size 2.0 MB - File type application/pdf
TR2.2.2 - Rassegna ed Analisi delle tecnologie e degli strumenti per la costruzione Computer Assisted di Ontologie
La descrizione riportata da questo Technical Report riguarda l’individuazione ed analisi dei principali strumenti e piattaforme tecnologiche, commerciali ed Open Source, per la costruzione Computer Assisted di Ontologie. Tali strumenti e tecnologie saranno classificati in base ai modelli ed alle tecniche adottate, alle funzionalità offerte, alle piattaforme di sviluppo e di esecuzione.
-
Size 2.1 MB - File type application/pdf
TR2.2.3 - Rassegna ed Analisi delle metodologie, delle tecniche e degli strumenti per la derivazione automatica di Ontologie
In questo Technical Report sono state individuate ed analizzante le principali metodologie nonché i principali strumenti e piattaforme tecnologiche, commerciali ed Open Source, per la derivazione automatica di Ontologie. Gli strumenti e le tecnologie analizzate saranno classificate in base ai modelli ed alle tecniche adottate, alle funzionalità offerte, alle piattaforme di sviluppo e di esecuzione.
-
Size 267.5 kB - File type application/pdf
TR2.2.4 - Definizione di una tecnica per la derivazione automatica di Ontologie da corpora documentali
Il lavoro svolto in questo Technical Report è indirizzato al raggiungimento della definizione di un metodo che prevede l’applicazione di tecniche di machine learning, basate su classificazione automatica di tipo supervised (basate su training sets) ed unsupervised gerarchico, per l’annotazione coarse grained di porzioni di testo ed interi documenti, e per la generazione semi-automatica di ontologie, intese come insiemi di categorie gerarchicamente relazionate.
-
Size 1.7 MB - File type application/pdf
TR2.2.5 - Realizzazione di uno Strumento Prototipale per la derivazione automatica di Ontologie da corpora documentali
In questo Technical Report sarà descritta l’implementazione di uno strumento prototipale il cui obiettivo è la derivazione automatica di ontologie a partire da testo non strutturato; al tool che implementa ciò è stato associato il nome OntoClust.
-
Size 118.6 kB - File type application/pdf
TR2.2.6 - Definizione di una tecnica per la derivazione di Ontologie da strutture di documenti gerarchicamente o relazionalmente organizzate
Il lavoro svolto in questo Technical Report è indirizzato al raggiungimento della definizione di una tecnica che permette l’estrazione semiautomatica di una ontologia dalla struttura implicita o esplicita di relazioni associate ad un insieme di documenti. Esempi di tali strutture possono essere quella gerarchica presente in una struttura di directories in cui documenti siano organizzati; o una tassonomia a cui siano associati documenti classificati in accordo ad essa; oppure la struttura relazionale rappresentata dai links degli ipertesti presenti in un sito web o la loro strutturazione logica.
-
Size 1.4 MB - File type application/pdf
TR2.2.7 - Realizzazione di uno strumento Prototipale per la derivazione di Ontologie da strutture di documenti gerarchicamente o relazionalmente organizzate
In questo Technical Report sarà descritta l’implementazione di uno strumento prototipale il cui obiettivo è la derivazione automatica di ontologie a partire da una struttura di directory, di pagine web, oppure da una tassonomia descritta in RDFS o Prolog; al tool che implementa ciò è stato associato il nome OntoExtract
-
Size 503.9 kB - File type application/pdf
TR2.2.8 - Ontology Manager: architettura e funzionalità
Il presente Technical Report definisce l’architettura di base dell’Ontology Manager del sistema LC3 per quanto riguarda l’immagazzinamento e la gestione delle ontologie di interesse.
-
Size 270.4 kB - File type application/pdf
TR2.2.9 - Costruzione automatica di una ontologia in formato OWL sul dominio “Il rapimento di Aldo Moro”.
In questo TR viene descritta brevemente la procedura semi-automatica per produrre un'ontologia sul dominio “Aldo Moro”. La metodologia viene descritta ad alto livello e una sua descrizione più dettagliata verrà ripresa nei prossimi TR.
-
Size 610.3 kB - File type application/pdf
TR2.2.10 - Esperienze di Costruzione di Ontologie di Dominio e relative Annotazioni Semantiche
La costruzione di ontologie che definiscano in modo formale i concetti salienti di un determinato dominio e le relazioni tra di essi è spesso compito arduo. Sebbene esistano in letteratura molte metodologie per la produzione “automatica” o “semi-automatica” di ontologie di dominio a partire dall'analisi di documenti appartenenti al dominio applicativo, in generale le strutture delle ontologie così costruite potrebbero non contenere tutti i concetti e le relazioni di interesse. La costruzione manuale di ontologie è quindi un'attività che spesso diventa cruciale per due motivi: 1) l'ontologia così costruita (da esperti di dominio) è sicuramente più dettagliata di una costruita in modo automatico; 2) l'ontologia può servire per valutare la bontà di uno strumento di costruzione automatico. In questo TR verranno descritte le metodologie utilizzate per la costruzione manuale di ontologie OWL dei alcuni dei domini di interesse del progetto LC3.
-
Size 299.2 kB - File type application/pdf
TR2.2.11 - Applicazione di metodologie e tecniche Statistiche per la costruzione di ontologie di dominio ad un corpus relativo al dominio "Rapimento Aldo Moro"
In questo Technical Report si esaminano le principali metodologie e tecniche per l’ Analisi lessicale, con particolare riferimento alle procedure di Stemming, di individuazione di collocazioni, di estrazione di indici, di pesatura dei termini. Inoltre, sono state esaminate le principali metodologie e tecniche per l’ analisi sintattica, in particolare il Part of Speech (POS), il Tagging e la word sense disambiguation.
-
Size 479.7 kB - File type application/pdf
TR2.2.12 - MAG Repository: Definizione di uno storage sicuro dei contenuti multimediali granulari, in grado di gestire contenuti semanticamente annotati
Il tecnical report contiene una descrizione del MAG repository (MAG Teca) e della sua evoluzione per arrivare a gestire gli oggetti granulari (Contlet), al fine di consentire una gestione delle annotazioni semantiche, la loro archiviazione sicura e il relativo recupero delle stesse (retrieval)
- Size 111.5 kB - File type application/vnd.ms-excel
-
Size 42.7 kB - File type application/pdf
D2.3 - Sistemi di Annotazione Semantica di Contlets
Lo scopo di questo task è stato quello di analizzare e confrontare i modelli ed i sistemi disponibili per effettuare l'annotazione semantica (manuale o parzialmente automatizzata) di documenti multimediali e per effettuare la classificazione automatica degli stessi.
-
Size 1.5 MB - File type application/pdf
TR2.3.1 - Stato dell’arte dei modelli ed Analisi di Sistemi di annotazione basati su ontologie
Il seguente Technical Report ha lo scopo di analizzare i principali strumenti di annotazione semantica presenti in letteratura al fine di tracciare lo stato dell'arte sui sistemi di Annotazioni Basati su Ontologie.
-
Size 2.0 MB - File type application/pdf
TR2.3.2 - Installazione, analisi e confronto funzionale dei sistemi di annotazione basati su ontologie
Obiettivo del presente Technical Report è l’analisi degli strumenti disponibili per l’annotazione semantica. In particolar modo si vogliono descrivere le fasi di installazione, configurazione ed utilizzo, presentando eventuali casi d’uso per ogni specifico tool. Per ciascun software di annotazione vengono descritte le prestazioni, i problemi riscontrati, i limiti e le potenzialità evidenziate nella fase di utilizzo.
-
Size 1.6 MB - File type application/pdf
TR2.3.3 - Realizzazione dell’architettura per l’ annotazione semantica e di uno strumento prototipale
Il presente technical report contiene una descrizione dello strumento prototipale sviluppato per permettere l’annotazione semantica di contenuti, che implementa il modello uniforme di annotazione definito nel task T2.1, e della architettura per la gestione ed il versioning delle annotazioni, dei documenti annotati e delle ontologie utilizzate.
-
Size 387.0 kB - File type application/pdf
TR2.3.4 - Stato dell’ arte ed Analisi delle metodologie e delle tecniche per la Classificazione ed il Clustering
In questo Technical Report si analizzano le principali tecniche di classificazione automatica e non, approfondendo, in particolare, l’analisi di quegli algoritmi che operano una classificazione basata su Clustering e su Reti Neurali, tramite cui si ottengono rappresentazioni più aderenti alla realtà.
-
Size 1.1 MB - File type application/pdf
TR2.3.5 - Stato dell’ arte ed Analisi delle tecnologie e degli strumenti per la Classificazione Documentale
In questo Technical Report si sono individuati ed analizzati i principali strumenti e piattaforme tecnologiche, commerciali ed Open Source, per la classificazione documentale. Tali strumenti e tecnologie saranno classificati in base ai modelli ed alle tecniche adottate, alle funzionalità offerte, alle piattaforme di sviluppo e di esecuzione.
-
Size 718.8 kB - File type application/pdf
TR2.3.6 - Realizzazione di uno strumento prototipale per l’ annotazione semantica automatica di corpora documentali basato su tecniche di classificazione automatica
In questo Technical Report viene descritto uno strumento prototipale che permette la generazione automatica di annotazioni semantiche e per la classificazione automatica di documenti basata sull’utilizzo di reti neurali back-propagation (non supervisionate) e reti supervisionate.
-
Size 2.0 MB - File type application/pdf
TR2.3.7 - MAG Repository: Architettura generale e interscambio dei datI
Il tecnical report descrive come il MAG-Repository, che si occupa dello storage e della gestione dei contenuti digitali a livello centralizzato, dialoghi con le componenti software esterne ad esso relative della produzione di metadati, dell'annotazione semantica e all'IR semantico
-
Size 56.4 kB - File type application/pdf
DM2 MAGRepository - Dimostratore del software MAG Repository, per lo storage sicuro dei contenuti multimediali granulari (Contlets)
Il dimostratore illustra le funzionalità di storage e di gestione dei contenuti digitali a livello centralizzato ed è in grado di gestire anche gli oggetti granulari (Contlet) - secondo le specifiche del TR2.2.12 - e di dialogare con le componenti software esterne relative alla produzione di metadati, all'annotazione semantica e all'IR semantico, secondo le specifiche del TR3.2.7
-
Size 41.6 kB - File type application/pdf
D2.4 - Definizione di tecniche semantiche per l'IR e la realizzazione di uno strumento Integrato per il Supporto su basi dati culturali semanticamente annotate e portali WEB
Scopo di questo task è la definizione di un insieme di metodologie e tecniche relative all’ analisi di natura semantica, sia della query di ricerca, che della base documentale oggetto della ricerca, che della conoscenza disponibile riguardo al dominio di applicazione.
-
Size 701.7 kB - File type application/pdf
TR2.4.1 - Stato dell’ arte ed analisi delle metodologie e delle tecniche per il Natural Language Processing
In questo technical report si esaminano le principali metodologie e tecniche per il Natural Language Processing.
-
Size 466.8 kB - File type application/pdf
TR2.4.2 - Stato dell’arte ed analisi delle tecnologie e degli strumenti per il Natural Language Processing
In questo technical report vengono analizzate le funzionalità dei tool maggiormente utilizzati in ambito NLP, tra i quali GATE, OpenNLP e UIMA.
-
Size 900.2 kB - File type application/pdf
TR2.4.3 - Stato dell’ arte ed analisi dei modelli e delle tecniche per l’ Information Retrieval
In questo tecnical report si esaminano i principali modelli e le tecniche per l’Information Retrieval, con particolare riferimento ai modelli per la rappresentazione dei documenti e delle queries, delle metriche di similarità e delle metriche di valutazione dei risultati.
-
Size 852.2 kB - File type application/pdf
TR2.4.4 - Stato dell’ arte ed analisi delle tecnologie e degli strumenti per l’Information Retrieval
In questo technical report si esaminano ed analizzano i principali strumenti e le piattaforme tecnologiche, commerciali ed Open Source, per l’Information Retrieval. Tali strumenti e tecnologie saranno classificati in base ai modelli ed alle tecniche adottate, alle funzionalità offerte, alle piattaforme di sviluppo e di esecuzione.
-
Size 411.9 kB - File type application/pdf
TR2.4.5 - Stato dell’ arte ed analisi delle metodologie, dei linguaggi standard e delle tecniche per la Rappresentazione della Conoscenza ed Inferenza in ambito Ontologico
In questo Technical Report si dà una descrizione generale dei Sistemi Esperti e della programmazione logica, a cui segue una rassegna di tre linguaggi simbolici per la rappresentazione della conoscenza ed inferenza in ambito documentale ed ontologico: FLogic, Prolog, RuleML.
-
Size 615.4 kB - File type application/pdf
TR2.4.6 - Stato dell’arte ed analisi delle metodologie, dei linguaggi standard e degli engines per il querying semantico
In questo Technical Report si analizzano e si confrontano i principali linguaggi di query del Semantic Web: RDQL, SPARQL e OWL-QL, che saranno oggetto di discussione nella prima parte. Nella seconda parte si descrive invece il framework Jena, utilizzato per realizzare applicazioni Java ontology-based. Infine nella terza parte si analizzano i principali reasoner presenti in Jena ed i reasoner stand alone disponibili in rete.
-
Size 548.7 kB - File type application/pdf
TR2.4.7 - Stato dell’arte ed analisi delle metodologie e delle tecniche per il matching di ontologie
In questo Technical Report si descrivono quali sono le soluzioni ad uno dei problemi principali che nascono con il Semantic Web, vale a dire la gestione delle eterogeneità fra le ontologie che di esso faranno parte. In particolare vengono introdotte le principali problematiche e soluzioni al generale problema dell’interoperabilità fra ontologie e successivamente descritto lo stato dell’arte relativo allo specifico problema della scoperta di mapping tra di esse, che costituisce anche la base per la soluzione di tutti gli altri.
-
Size 836.4 kB - File type application/pdf
TR2.4.8 - Realizzazione di uno strumento prototipale per il Natural Language Processing
In questo Technical Report viene descritto uno strumento prototipale che utilizza moduli di Natural Language Processing per l’analisi di documenti testuali (in formato txt, rtf o doc) o di frasi e testi digitati online.
-
Size 546.1 kB - File type application/pdf
TR2.4.9 - Definizione di una architettura per il Semantic Information Retrieval
In questo Technical Report si definisce una architettura per il Semantic Information Retrieval.
-
Size 859.1 kB - File type application/pdf
TR2.4.10 - Realizzazione di uno strumento per il Semantic Information Retrieval
In questo Technical Report si descrive uno strumento prototipale che implementa la tecnica basata sul linguaggio Prolog, per il parsing grammaticale e logico della query in linguaggio naturale e la sua traduzione in linguaggio di querying semantico descritta nel TR2.4.9
-
Size 154.2 kB - File type application/pdf
TR2.4.11 - Definizione di una tecnica per il confronto (matching) di ontologie
Il lavoro svolto in questo Technical Report è indirizzato al raggiungimento della definizione di una tecnica per il matching tra Ontologie.
-
Size 970.0 kB - File type application/pdf
TR2.4.12 - Realizzazione di uno strumento per il confronto (matching) di ontologie
In questo Technical Report viene descritto uno strumento prototipale che permette il matching tra differenti tipologie di schema ed in particolare ha l’obiettivo di definire un mapping semantico tra due ontologie, ai fini della “riconciliazione” tra ontologie o della ricerca di contenuti e servizi basati sulla similarità di ontologie. In esso vengono utilizzate tecniche per l’ontology matching basate su algoritmi strutturali di isomorfismo e similarità tra grafi, su algoritmi sintattici e sull’ utilizzo di Wordnet.
- Size 6.3 MB - File type application/pdf
- Size 322.4 kB - File type application/pdf
-
Size 1.7 MB - File type application/vnd.ms-powerpoint
Presentazione ppt
Presentazione riassuntiva delle attività svolte dal consulente Sapienza