Nome:
Fabio Massimo Zanzotto
Data di nascita:
5 Gennaio 1972
Luogo di nascita:
Roma
Professore associato (ING-INF/05) presso il Dipartimento di Ingegneria dell’Impresa dell’Università di Roma “Tor Vergata”
Attività di ricerca
Obiettivo di ricerca
Così come nella tradizione della disciplina dell’Intelligenza Artificiale, il mio obiettivo è quello di studiare modelli formali utili a supportare lo sviluppo di sistemi automatici che possano imitare il comportamento cognitivo umano. In particolare, il mio obiettivo è quello di studiare e costruire modelli formali utili per l’analisi di una delle forme principe di rappresentazione della conoscenza: il linguaggio naturale.
Linee di ricerca
Il perseguimento dell’obiettivo richiede un approccio multidisciplinare che spazi dall’ambito informatico, all’ambito psicologico cognitivo e all’ambito umanistico. Cercando di trarre spunti da tutti questi differenti aree, mi occupo quindi di studiare modelli di elaborazione sintattico-semantica del linguaggio naturale, metodi di apprendimento automatico della conoscenza necessaria ai modelli precedenti e, infine, sistemi sia visionari che orientati ai task che permettano di testare i modelli precedenti. Questi sistemi automatici, oltre ad essere degli interessanti banchi di prova per le teorie sviluppate, possono rivelarsi molto utili in vari campi connessi con la necessità di accedere in maniera automatica ad informazione espressa in maniera testuale. In particolare, tali sistemi possono essere strumenti utili allo studio dei linguaggi naturali specialmente quando questo richieda l’analisi di grandi collezioni di testi.
Nella sviluppare le mie linee di ricerca mi colloco nella tradizione secondo la quale la conoscenza è rappresentata principalmente in maniera simbolica. Quindi studio modelli di elaborazione del linguaggio naturale che abbiano lo scopo di costruire sistemi formali orientati a portare espressioni testuali verso una rappresentazione della conoscenza espressa in un linguaggio semi-logico e non ambiguo. Pur tentando di mantenere un approccio indipendente dalla lingua, i modelli di elaborazione sono stati sviluppati con una attenzione a due particolari lingue naturali: l’italiano e l’inglese. La complessità, l’eterogeneità e la occasionale non conformità alle regole del linguaggio naturale mi ha spinto verso l’analisi di modelli di elaborazione robusti che rilassino i vincoli di grammaticalità. Con questo spirito ho sviluppato tecniche di parsing sintattico e strumenti per l’analisi semantica basati su regole di associazione tra parole e concetti e tra strutture sintattiche e relazioni semantiche.
La necessità dei modelli precedenti basati su una rappresentazione esplicita di una grande quantità di conoscenza mi ha spinto inoltre allo studio di metodi che permettano di apprendere automaticamente ed in maniera incrementale la conoscenza che a loro soggiace. Dunque parte della mia attività di ricerca è stata rivolta all’analisi, lo studio e l’applicazione di tecniche di apprendimento automatico che combinano analisi di tipo puramente simbolico ad una analisi più di tipo probabilistico o numerico.
Più nello specifico, la mia attività di ricerca svolta nelle precedenti aree ha avuto gli sviluppi descritti qui di seguito.
Area: modelli di elaborazione sintattico-semantica del linguaggio naturale
Parsing robusto dei linguaggi naturali.
Il parsing sintattico dei linguaggi naturali è un problema aperto. Non esistono modelli e sistemi corrispondenti che possano svolgere il compito in maniera perfetta. Inoltre, l’applicazione delle tecniche di parsing sintattico a grandi collezioni di testi ha evidenziato le carenze di sistemi “monolitici”. La totale copertura del fenomeno linguistico risulta essere di difficile raggiungimento specialmente poiché ha come effetto collaterale un corrispondente aumento dell’ambiguità introdotta dal modello. Rinunciare alla nozione di grammaticalità dell’intera frase è stato visto come una possibile soluzione che ha dato origine a modelli di parsing modulare cosiddetto robusto. Il lavoro di ricerca in quest’area si orienta alla definizione di modelli robusti tali che possano garantire una copertura parziale del fenomeno linguistico in maniera indipendente dal dominio conoscitivo di applicazione. Tali modelli possono essere utilizzati in applicazioni quali l’estrazione di informazioni da testi (conoscenza fattuale) e l’estrazione di conoscenza ontologica. La verifica delle prestazioni di questi sistemi di parsing sintattico è naturalmente una priorità che richiede lo sviluppo, da una parte, di risorse annotate [LINC2000, LC2003] e, dall’altra, di opportuni modelli di valutazione. Nell’ambito di questa ricerca è stato prodotto un sistema (denominato CHAOS) che incarna le idee precedenti.
Analisi semantica del linguaggio naturale.
L’assunzione di fondo è che il significato delle frasi e dei discorsi possa essere rappresentato attraverso una rappresentazione semi-formale che riduca in qualche modo l’ambiguità della lingua. Se tale rappresentazione della conoscenza, possibilmente chiamata ontologia, descrive come l’interprete vede il mondo, la lingua naturale diventa una sorta di interfaccia che serve all’interprete per comunicare con l’esterno ovvero analizzare ed emettere frasi. Assumendo l’esistenza di tali ontologie che possono emergere dalle più disparate sorgenti (ad esempio il Web Semantico) il problema dell’interpretazione della frase richiede da una parte il collegamento tra le basi di conoscenza lessicali e queste rappresentazioni ontologiche interne e dall’altra la possibilità di disambiguare le parole che vengono presentate in un contesto frasale all’interprete. Una particolare modalità di approccio al problema prevede di definire un insieme molto generale di classi semantiche che siano significative per la determinazione dei sensi delle parole. Il lavoro di ricerca in quest’area si concentra nella costruzione di modelli di apprendimento automatico che permettano di classificare nomi all’interno di classi semantiche di alto livello.
Area: metodi di apprendimento automatico della conoscenza linguistica
Dal momento che l’analisi semantica si basa su una rappresentazione ontologica delle conoscenza, una delle fondamentali questioni aperte è la produzione di queste enormi risorse. Il mio lavoro di ricerca in quest’area si è concentrato nell’analisi del problema di estrazione di concetti salienti in domini specifici, ovvero di estrazione terminologica e di estrazione di pattern sintattico semantici che possano modellare relazioni tra concetti e le loro espressioni linguistiche. L’analisi di modelli di estrazione di terminologia da testi è stato anche oggetto della mia tesi di dottorato. Inoltre, un tentativo che ho fatto è quello di indurre analizzando statisticamente collezioni di testi, relazioni di causa effetto tra relazioni o eventi specifici del dominio.
Area: sistemi basati su strumenti di elaborazione del linguaggio naturale
Sistemi di Question&Answering basati su modelli ontologici.
Una parte fondamentale del mio lavoro di ricerca consiste nel provare le teorie e i modelli attraverso dei sistemi che possano assolvere un compito difficile che richieda in qualche modo le competenze precedenti. Tale sistema dovrebbe incarnare le parti dell’agente che è progettato per imitare il comportamento cognitivo umano obiettivo della mia ricerca. Ho quindi partecipato alla definizione e alla realizzazioni di sistemi che permettano una attività di question-answering dove la rappresentazione ontologica della conoscenza sia assunta come nucleo attorno il quale risolvere il compito specifico. Tali sistemi sono stati principalmente sviluppati in un ambito in cui queste rappresentazioni ontologiche si suppone possano essere costruite, ovvero il Web Semantico.
Sviluppo di sistemi per l’accesso assistito all’informazione testuale multilinguale basati su tecniche di Information Extraction. Infine, le ricerche sul linguaggio naturale danno la possibilità di costruire sistemi che facilitino l’accesso all’informazione testuale multilinguale. In quest’area la domanda principale è quella di rappresentare in maniera formale ed oggettiva il contenuto dei documenti. Ho dunque studiato sistemi che permettano una rappresentazione del contenuto dei testi in un ambito di sistemi di Information Extraction e di hyperlinking automatico
Lista delle Pubblicazioni
Articolo in rivista
1. FABIO MASSIMO ZANZOTTO, LORENZO DELL'ARCIPRETE, ALESSANDRO MOSCHITTI (2011). Efficient Graph Kernels for Textual Entailment Recognition. FUNDAMENTA INFORMATICAE, vol. 107 (2-3), p. 199-222, ISSN: 0169-2968, doi: 10.3233/FI-2011-400
2. FRANCESCA FALLUCCHI, FABIO MASSIMO ZANZOTTO (2011). Inductive Probabilistic Taxonomy Learning using Singular Value Decomposition. NATURAL LANGUAGE ENGINEERING, vol. 17 (1), p. 71-94, ISSN: 1351-3249, doi: 10.1017/S1351324910000197
3. STEFANO PREZIOSO, DANILO CROCE, FABIO MASSIMO ZANZOTTO (2011). Reading what machines “think”: a challenge for nanotechnology. JOURNAL OF COMPUTATIONAL AND THEORETICAL NANOSCIENCE, vol. 8 (10), p. 1-6, ISSN: 1546-1955, doi: 10.1166/jctn.2011.1927
4. FABIO MASSIMO ZANZOTTO, MARCO PENNACCHIOTTI, ALESSANDRO MOSCHITTI (2009). A Machine Learning Approach to Textual Entailment Recognition. NATURAL LANGUAGE ENGINEERING, vol. 15-04, p. 551-582, ISSN: 1351-3249, doi: 10.1017/S1351324909990143
5. FABIO MASSIMO ZANZOTTO (2007). Lost in Grammar Translation. INTELLIGENZA ARTIFICIALE, vol. Anno IV, N° 2, ISSN: 1724-8035
6. ROBERTO BASILI, ALESSANDRO MOSCHITTI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2003). Personalizing Web Publishing via Information Extraction. IEEE INTELLIGENT SYSTEMS, vol. 18, p. 62-70, ISSN: 1541-1672, doi: 10.1109/MIS.2003.1179195
7. SIMONETTA MONTEMAGNI, F. BARSOTTI, M. BATTISTA, NICOLETTA CALZOLARI, O CORAZZARI, ANTONIO ZAMPOLLI, F FANCIULLI, M MASSETANI, R RAFFAELLI, ROBERTO BASILI, MARIA TERESA PAZIENZA, DARIO SARACINO, FABIO MASSIMO ZANZOTTO, MANA N, PIANESI F, DELMONTE R (2003). The Italian Syntactic-Semantic Treebank: Architecture, Annotation, Tools and Evaluation. LINGUISTICA COMPUTAZIONALE, vol. 16-18, ISSN: 0392-6907
8. ROBERTO BASILI, FABIO MASSIMO ZANZOTTO (2002). Parsing engineering and empirical robustness. NATURAL LANGUAGE ENGINEERING, vol. 8, p. 97-120, ISSN: 1351-3249, doi: 10.1017/S1351324902002875
Contributo in volume (Capitolo o Saggio)
9. Francesca Fallucchi, Fabio Massimo Zanzotto (2012). Exploiting Transitivity in Probabilistic Models for Ontology Learning. In: Semi-Automatic Ontology Development: Processes and Resources. p. 259-293, IGI Global, ISBN: 9781466601888, doi: 10.4018/978-1-4666-0188-8.ch010
10. FABIO MASSIMO ZANZOTTO, DANILO CROCE (2010). Comparing EEG/ERP-like and fMRI-like Techniques for Reading Machine Thoughts. In: YIYU YAO AND RON SUN. BI 2010: Proceedings of the Brain Informatics Conference - Toronto.
11. FRANCESCA FALLUCCHI, NOEMI SCARPATO, ARMANDO STELLATO, FABIO MASSIMO ZANZOTTO (2009). Probabilistic Ontology Learner in Semantic Turkey. In: R. SERRA, R. CUCCHIARA. AI*IA 2009. vol. LNAI 5883, p. 294-303, HEIDELBERG:SPRINGER, ISBN: 978-3-642-10290-5, doi: 10.1007/978-3-642-10291-2_30
12. FABIO MASSIMO ZANZOTTO, DANILO CROCE (2009). Reading what machines "think". In: N. ZHONG ET AL.. BI 2009: Proceedings of the Brain Informatics Conference - Bejing, China, October 2009. vol. LNAI 5819, p. 159-170, BERLIN HEIDELBERG:Springer-Verlag, ISBN: 978-3-642-04953-8, doi: 10.1007/978-3-642-04954-5_26
13. ROBERTO BASILI, FABIO MASSIMO ZANZOTTO (2008). Morfologia e sintassi. In: BIANCHINI F. - GLIOZZO A. - MATTEUZZI M.. Instrumentum vocale: intelligenza artificiale e linguaggio. BOLOGNA:Bononia University Press, ISBN: 8873952844
14. MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2008). Natural Language Processing across time: an empirical investigation on Italian. In: BENGT NORDSTROM AND AARNE RANTA. Advances in Natural Language Processing, 6th International Conference, GoTAL 2008, Gothenburg, Sweden, August 25-27,2008, Proceedings. vol. 5221, p. 371-382, Springer, ISBN: 978-3-540-85286-5, doi: 10.1007/978-3-540-85287-2_36
15. FABIO MASSIMO ZANZOTTO, ALESSANDRO MOSCHITTI (2007). Experimenting a "General Purpose" Textual Entailment Learner in AVE. In: CAROL PETERS AND PAUL CLOUGH AND FREDRIC C. GEY AND JUSSI KARLGREN AND BERNARDO MAGNINI AND DOUGLAS W. OARD AND MAARTEN DE RIJKE AND MAXIMILIAN STEMPFHUBER. Evaluation of Multilingual and Multi-modal Information Retrieval, 7th Workshop of the Cross-Language Evaluation Forum, CLEF 2006, Alicante, Spain, September 20-22, 2006, Revised Selected Papers. vol. 4730, p. 510-517, Springer, ISBN: 978-3-540-74998-1, doi: 10.1007/978-3-540-74999-8_61
16. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2006). "Discovering verb relations in corpora: distributional versus non-distributional approaches". In: Advances in Applied Artificial Intelligence 19th International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, IEA/AIE 2006, Annecy, France, June 27-30, 2006. Proceedings. vol. LNCS 4031, p. 1042-1052, BERLIN, HEIDELBERG:Springer, ISBN: 978-3-540-35453-6, doi: 10.1007/11779568_111
17. ROBERTO BASILI, FABIO MASSIMO ZANZOTTO (2006). CHAOS: Un approccio modulare e lessicalizzato per il parsing sintattico dell'Italiano e dell'Inglese. In: ALICE DI STEFANO. Cyberletteratura: tra Mondi Testuali e Mondi Virtuali. p. 43-62, NAPOLI:La Nuova Cultura, ISBN: 9788861340169
18. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2006). Learning Textual Entailment on a Distance Feature Space. In: Machine Learning Challenges. vol. 3944, p. 240-260, Heidelberg:Springer Berlin, ISBN: 978-3-540-33427-9, doi: 10.1007/11736790_14
19. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2005). A Linguistic Inspection of Textual Entailment. In: AI*IA 2005: Advances in Artificial Intelligence. vol. LNCS 3673, p. 315-326, BERLIN, HEIDELBERG:Springer, ISBN: 978-3-540-29041-4, doi: 10.1007/11558590_32
20. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, MICHELE VINDIGNI, FABIO MASSIMO ZANZOTTO (2005). AI/NLP technologies applied to spacecraft design. In: Innovations in Applied Artificial Intelligence. vol. LNCS 3533, p. 239-248, BERLIN, HEIDELBERG:Springer, ISBN: 978-3-540-26551-1, doi: 10.1007/11504894_35
21. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2005). Terminology Extraction: an analysis of linguistic and statistical approaches. In: S. SIRMAKESSIS. Knowledge Mining. vol. SFSC185, p. 255-279, VERLAG:Springer/Berlin, ISBN: 978-3-540-25070-8, doi: 10.1007/3-540-32394-5_20
22. PAOLO ATZENI, ROBERTO BASILI, D.H. HANSEN, PAOLO MISSIER, PATRIZIA PAGGIO, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2004). "Ontology-based question answering in a federation of university sites: the MOSES case study". In: Natural Language Processing and Information Systems. vol. LNCS 3136, p. 413-420, BERLIN, HEIDELBERG:Springer, ISBN: 978-3-540-22564-5, doi: 10.1007/b98754
23. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2003). Inducing Hyperlinking Rules in Text Collections. In: NICOLAS NICOLOV,KALINA BONTCHEVA,GALIA ANGELOVA,RUSLAN MITKOV. Recent Advances in Natural Language Processing III, Selected Papers from RANLP 2003.Current Issues in Linguistic Theory. vol. 260, p. 131-140, ISBN: 978-90-272-4774-2
24. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2001). Flexible Parsing Architectures for NLP Applications. In: Proceedings of the 7th Congress of the Italian Association for Artificial Intelligence on Advances in Artificial Intelligence. vol. LNCS 2175, LONDON:SPRINGER-VERLAG, ISBN: 3-540-42601-9
25. Inizio modulo
26. Fine modulo
27. Inizio modulo
28. Fine modulo
29. F. BARSOTTI, R BASILI, M. BATTISTA, N. CALZOLARI, O. CORAZZARI, R. DEL MONTE, F. FANCIULLI, N. MANA, M. MASSETANI, S. MONTEMAGNI, M.T. PAZIENZA, F. PIANESI, R. RAFFAELLI, D. SARACINO, A. ZAMPOLLI, FABIO MASSIMO ZANZOTTO (2000). The Italian Syntactic-Semantic Treebank: Architecture, Annotation, Tools and Evaluation. In: ANNE ABEILLE. Building and using sintattically annotated corpora. Language and speech series.
Contributo in Atti di convegno
30. FABIO MASSIMO ZANZOTTO, LORENZO DELL'ARCIPRETE (2011). Distributed Representations and Distributional Semantics. In: Proceedings of the ACL-HLT 2011 workshop on Distributional Semantics and Compositionality (DiSCo). Portland, Oregon
31. FABIO MASSIMO ZANZOTTO, MARCO PENNACCHIOTTI, KOSTAS TSIOUTSIOULIKLIS (2011). Linguistic Redundancy in Twitter. In: Proceedings of 2011 Conference on Empirical Methods on Natural Language Processing (EmNLP). Edimburg, UK, 2011, ISBN: 978-1-937284-11-4
32. FABIO MASSIMO ZANZOTTO, IOANNIS KORKONTZELOS, FRANCESCA FALLUCCHI, SURESH MANANDHAR (2010). Estimating Linear Models for Compositional Distributional Semantics. In: Proceedings of the 23rd International Conference on Computational Linguistics (COLING). Bejing, August, 2010
33. FABIO MASSIMO ZANZOTTO, MARCO PENNACCHIOTTI (2010). Expanding textual entailment corpora from Wikipedia using co-training. In: Proceedings of the COLING-Workshop on The People’s Web Meets NLP: Collaboratively Constructed Semantic Resources. Bejing, China, August 2010
34. FRANCESCA FALLUCCHI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2010). Generic Ontology Learners on Application Domains. In: Proceedings of the International Conference on Language Resources and Evaluation. Malta, May 2010, ISBN: 2-9517408-6-7
35. YASHAR MEHDAD, ALESSANDRO MOSCHITTI, FABIO MASSIMO ZANZOTTO (2010). Syntactic/Semantic Structures for Textual Entailment Recognition. In: Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics. Los Angeles, California, 2010, p. 1020-1028, ISBN: 1-932432-65-5
36. FRANCESCA FALLUCCHI, FABIO MASSIMO ZANZOTTO (2010). Transitivity in Semantic Relation Learning. In: Proceedings of the 6th IEEE International Conference on Natural Language Processing and Kwoledge Engineering (NLP-KE). Beijing, China, August 21-23, 2010, p. 552-559, ISBN: 978-1-4244-6897-3, doi: 10.1109/NLPKE.2010.5587773
37. ROBERTA BECCACECI, FRANCESCA FALLUCCHI, CRISTINA GIANNONE, FRANCESCA SPAGNOULO, FABIO MASSIMO ZANZOTTO (2009). Education with “Living Artworks” in Museums. In: Proceedings of the International Conference on Computer Supported Education (CSEDU). Lisboa, Portugal, 2009, vol. 1, p. 346-349, ISBN: 978-989-8111-82-1
38. FABIO MASSIMO ZANZOTTO, LORENZO DELL'ARCIPRETE (2009). Efficient kernels for sentence pair classification. In: Conference on Empirical Methods on Natural Language Processing. Singapore, 6-7 August 2009, p. 91-100, ISBN: 978-1932432-59-6
39. FABIO MASSIMO ZANZOTTO, DANILO CROCE, STEFANO PREZIOSO (2009). Reading what Machines "Think": a Challenge for Nanotechnology. In: Joint Conferences on Avdanced Materials. Sulmona, Italy, p. 287, GDANSK:Task Publishing, ISBN: 978-83-908112-7-7
40. FRANCESCA FALLUCCHI, FABIO MASSIMO ZANZOTTO (2009). SVD Feature Selection for Probabilistic Taxonomy Learning. In: Proceedings of the EACL Workshop on GEometrical Models of Natural Language Semantics. Athens, Greece, 2009
41. FRANCESCA FALLUCCHI, FABIO MASSIMO ZANZOTTO (2009). SVD for Feature Selection in Taxonomy Learning. In: Proceedings of the Conference on Recent Advances on Natural Language Processing. Borovets, Bulgaria, 14-16 September 2009
42. YASHAR MEHDAD, ALESSANDRO MOSCHITTI, FABIO MASSIMO ZANZOTTO (2009). SemKer: Syntactic/Semantic Kernels for Recognizing Textual Entailment. In: Proceedings of the Text Analysis Conference. Gaithersburg, Maryland, November 2009
43. JOHAN BOS, FABIO MASSIMO ZANZOTTO, MARCO PENNACCHIOTTI (2009). Textual Entailment at EVALITA 2009. In: Proceedings of EVALITA 2009. Modena, December 2009, ISBN: 978-88-903581-1-1
44. FABIO MASSIMO ZANZOTTO, MARCO PENNACCHIOTTI, ALESSANDRO MOSCHITTI (2008). Combining Semi-Unsupervised Acquisition of Corpora and Supervised Learning of Textual Entailment Rules. In: Proceedings of the Symposium on Semantic Knowledge Discovery, Organization and Use. New York, November 2008
45. ALESSANDRO MOSCHITTI, FABIO MASSIMO ZANZOTTO (2008). Encoding Tree Pair-based Graphs in Learning Algorithms: the Textual Entailment Recognition Case. In: Proceedings of the CoLing Workshop on Textgraph-3. Manchester, 2008, ISBN: 978-1-905593-57-6
46. FABIO MASSIMO ZANZOTTO, MARCO PENNACCHIOTTI, ALESSANDRO MOSCHITTI (2008). PeMoZa submission to TAC 2008. In: Proceedings of the Text Analysis Conference. Gaithersburg, Maryland, November 17-19 2008
47. FRANCESCA FALLUCCHI, FABIO MASSIMO ZANZOTTO (2008). Yet Another Platform for Extracting Knowledge from Corpora. In: Proceedings of LREC 2008. Marrakesh, Marocco, 2008, ISBN: 2-9517408-4-0
48. ALESSANDRO MOSCHITTI, FABIO MASSIMO ZANZOTTO (2007). "Fast and Effective Kernels for Relational Learning from Texts". In: Proceedings of 24th Annual International Conference on Machine Learning. Corvallis, June 2007, vol. 227, p. 649-656, ISBN: 978-1-59593-793-3, doi: 10.1145/1273496.1273578
49. FABIO MASSIMO ZANZOTTO, MARCO PENNACCHIOTTI, ALESSANDRO MOSCHITTI (2007). "Shallow Semantic in Fast Textual Entailment Rule Learners". In: Proceedings of the ACL-PASCAL Workshop on textual entailment and paraphrasing. Praga, June 2007, ISBN: 978-1-932432-48-0
50. MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2007). Learning Shallow Semantic Rules for Textual Entailment. In: Proceedings of International Conference RANLP - 2007. Incoma Ltd., ISBN: 978-954-91743-7-3
51. ALESSANDRO BAHGAT, FABIO MASSIMO ZANZOTTO (2006). "A Dependency-based Algorithm for Grammar Conversion". In: Proceedings of Language Resources and Evaluation Conference 2006. GENOVA, MAY 2006, ISBN: 2-9517408-2-4
52. FABIO MASSIMO ZANZOTTO, ALESSANDRO MOSCHITTI (2006). Automatic learning of textual entailments with cross-pair similarities. In: ACL-44: Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the Association for Computational Linguistics. Sydney, July 2006, p. 401-408, Morristown, NJ:Association for Computational Linguistics, ISBN: 1-932432-65-5, doi: 10.3115/1220175.1220226
53. FABIO MASSIMO ZANZOTTO, MARCO PENNACCHIOTTI, MARIA TERESA PAZIENZA (2006). Discovering asymmetric entailment relations between verbs using selectional preferences. In: ACL-44: Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the Association for Computational Linguistics (volume 2). Sydney, July 2006, p. 849-856, Morristown, NJ:Association for Computational Linguistics, ISBN: 1-932432-66-3, doi: 10.3115/1220175.1220282
54. FABIO MASSIMO ZANZOTTO, ALESSANDRO MOSCHITTI (2006). Experimenting a ”General Purpose” Textual Entailment Learner in AVE. In: Working Notes for the CLEF 2006 Workshop. Alicante, September 2006, ISBN: 2-912335-23-X
55. FABIO MASSIMO ZANZOTTO, ALESSANDRO MOSCHITTI, MARCO PENNACCHIOTTI, MARIA TERESA PAZIENZA (2006). Learning textual entailment from examples. In: Proceedings of the Second PASCAL Recognizing Textual Entailment Challenge. Venice, April 2006
56. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2006). MixingWordNet, VerbNet and PropBank for studying verb relations. In: Proceedings of Language Resources and Evaluation Conference 2006. GENOVA, May 2006, ISBN: 2-9517408-2-4
57. FABIO MASSIMO ZANZOTTO, ALESSANDRO MOSCHITTI (2006). Similarity between Paris of Co-indexed Trees for textual Entailment Recognition. In: Proceedings of TextGraphs Based Methods for Natural Language Processing. New York
58. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2005). Discovering entailment relations using ”textual entailment patterns. In: Proceedings of Empirical Modeling of Semantic Equivalence and Entailment Workshop. Ann Arbor, June 2005
59. ROBERTO BASILI, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2005). Language Learning and Ontology Engineering: an Integrated Model for the Semantic Web. In: 2nd Meaning Workshop. Trento, February 2005
60. MARIA TERESA PAZIENZA, ARMANDO STELLATO, L. HENRIKSEN, PATRIZIA PAGGIO, FABIO MASSIMO ZANZOTTO (2005). Ontology Mapping to support ontology-based question answering. In: Proceedings of the 2nd Meaning Workshop. Trento, February 2005
61. ROBERTO BASILI, MARCO CAMMISA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO, MARIA VITTORIA MARABELLO, DARIO SARACINO (2005). Ontology-driven Information Retrieval in FF-Poirot. In: Proceedings of Semantic Web Applications and Perspectives 2nd Italian Semantic Web Workshop. 2005
62. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2005). Textual Entailment as Syntactic Graph Distance: a rule based and a SVM based approach. In: PASCAL Challenges Workshop. Southampton, April 2005
63. ROBERTO BASILI, MARCO CAMMISA, FABIO MASSIMO ZANZOTTO (2004). "A Semantic similarity measure for unsupervised semantic tagging". In: Proceedings of 4th International Conference on Language Resources and Evaluation (LREC2004). Lisbon - Portugal, May 2004, ISBN: 2-9517408-1-6
64. ROBERTO BASILI, NICOLA LORUSSO, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2004). "A2Q: an agent-based architecure for multilingual Q&A". In: Proceedings of 4th International Conference on Language Resources and Evaluation (LREC2004). Lisbon - Portugal, May 2004, ISBN: 2-9517408-1-6
65. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2004). "Identifying relational concept lexicalisations by using general linguistic knowledge". In: Proceedings of 15th European Conference on Artificial Intelligence (ECAI 2004). Valencia - Spain, August 2004, p. 1071-1072, ISBN: 1-58603-452-9
66. LUISE GUTHRIE, ROBERTO BASILI, FABIO MASSIMO ZANZOTTO, KALINA BONTCHEVA, HAMISH CUNNINGHAM, DAVID GUTHRIE, JIA CUI, MARCO CAMMISA, JERRY CHENG-CHIEH LIU, CASSIA FARRIA MARTIN, KRISTIYAN HARALAMBIEV, MARTIN HOLUB, KLAUS MACHERY, FREDRICK JELINEK (2004). "Large Scale Experiments for Semantic Labeling of Noun Phrases in Raw Text". In: Proceedings of 4th International Conference on Language Resources and Evaluation (LREC2004) LISBON. Lisbon - Portugal, May 2004, ISBN: 2-9517408-1-6
67. MARIA TERESA PAZIENZA, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (2004). "Modelling Semantic Grid knowledge embedded in documents". In: Proceedings of Workshop on Emerging Technologies for Next generation GRID (ETNGRID-2004). Modena - Italy, June 2004, p. 364-369, ISBN: 0-7695-2183-5, doi: 10.1109/ENABL.2004.45
68. ROBERTO BASILI, D.H. HANSEN, PATRIZIA PAGGIO, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2004). "Ontological resources and question answering". In: Proceedings of Workshop on Pragmatics of Question Answering held jointly with NAACL 2004. Boston - U.S.A., May 2004
69. PATRIZIA PAGGIO, D.H HANSEN, ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2004). "Ontology-based question analysis in a multilingual environment: the MOSES case study". In: Workshop OntoLex 2004. Lisbon, May 2004
70. ROBERTO BASILI, MICHELE VINDIGNI, FABIO MASSIMO ZANZOTTO (2004). "Understanding the Web through its Language ". In: ACM/IEEE/WIC Web Intelligence. Bejing - China, September 2004, p. 736-739, ISBN: 0-7695-2100-2, doi: 10.1109/WI.2004.10105
71. MARIA TERESA PAZIENZA, ARMANDO STELLATO, MICHELE VINDIGNI, FABIO MASSIMO ZANZOTTO (2004). "XeOML: an XML-based extensible ontology mapping language". In: ISWC-04 workshop on Meaning Coordination and Negotiation. Hiroshima, November 2004
72. FABIO MASSIMO ZANZOTTO, ARMANDO STELLATO (2004). Exploiting the Semantic Fingerprint for Tagging ”Unseen” Words. In: Proceedings for Workshop "Beyond Named Entity Recognition: Semantic labelling for NLP tasks" held jointly with LREC2004 LISBON. Lisbon - Portugal, May 2004
73. ROBERTO BASILI, MICHELE VINDIGNI, FABIO MASSIMO ZANZOTTO (2004). Integrating Semantic Lexicons and Domain Ontologies. In: Proceedings Workshop OntoLex 2004. Lisbon - Portugal, May 2004
74. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2003). "Exploiting the feature vector model for learning linguistic representations of relational concepts". In: Workshop on Adaptive Text Extraction and Mining (ATEM 2003) held in conjuction with European Conference on Machine Learning (ECML 2003). Cavtat - Croazia, September 2003
75. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2003). "Inducing Hyperlinking Rules in Text Collections". In: Proceedings of Conference RANLP2003. Borovets - Bulgaria, September 2003
76. ROBERTO BASILI, MICHELE VINDIGNI, FABIO MASSIMO ZANZOTTO (2003). "Integrating ontological and linguistic knowledge for Conceptual Information Extraction". In: Proceedings of IEEE/WIC Web Intelligence (WI 2003). Halifax - Canada, October 2003, doi: 10.1109/WI.2003.1241190
77. ALESSANDRO MOSCHITTI, FABIO MASSIMO ZANZOTTO (2002). "A robust summarization system to explain document categorization". In: Proceedings of 2nd Workshop of Robust Methods in Analysis of Natural language Data 2002. Frascati - Italy, July 2002
78. ROBERTO BASILI, ALESSANDRO MOSCHITTI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2002). A Semantic-driven approacn to Hypertextual Authoring. In: PROCEEDINGS OF Workshop of Event Modelling for Multilingual Document Linking at LREC 2002. Canary Islands (Spain), 2002
79. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2002). Acquisition of conceptual domain dictionaries via decision tree learning. In: Proceedings of 15th European Conference on Artificial Intelligence (ECAI 2002). LYON, FRANCE, 2002, p. 480-484
80. FABIO MASSIMO ZANZOTTO (2002). Costruzione di ontologie per sistemi di Information Extraction: un approccio terminologico. In: Proceedings of the Workshop su NLP e Web: la sfida della multimodalità tra approcci simbolici e approcci statistici, held in Convegno AIIA 2002. Siena (Italy),, September 2002
81. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2002). Decision trees as explicit domain term definition. In: Proceedings of 19th International Conference on Computational Linguistic (COLING2002). TAIPEI, 2002, Morristown, NJ:Association for Computational Linguistics, doi: 10.3115/1072228.1072357
82. ROBERTO BASILI, ROBERTA CATIZONE, LUIS PADRO, MARIA TERESA PAZIENZA, GERMAN RIGAU, ANDREA SETZER, NICK WEBB, FABIO MASSIMO ZANZOTTO (2002). Knowledge-Based Multilingual Document Analysis. In: Proceedings of Building and Using Semantic Networks, held with 19th International Conference on Computational Linguistic (COLING2002). TAIPEI, TAIWAN, 2002
83. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2002). Learning IE patterns: a terminology extraction perspective. In: PROCEEDINGS OF THE Workshop of Event Modelling for Multilingual Document Linking at LREC 2002. Canary Islands (Spain), 2002
84. ROBERTO BASILI, MARIA TERESA PAZIENZA, ALESSANDRO MOSCHITTI, FABIO MASSIMO ZANZOTTO (2001). A Contrastive Approach to Term Extraction. In: Proceedings of the 4th Terminology and Artificial Intelligence Conference. Nancy (France),, May 2001
85. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2001). Modelling the syntactic contextual information for term extraction. In: Proceedings of the Conference on Recent Advances in Natural Language Processing RANLP2001. Tzigiv Chark(Bulgaria), 2001
86. R. BASILI, R. CATIZONE, L. PADRÓ, M.T. PAZIENZA, G. RIGAU, A. SETZER, N. WEBB, Y. WILKS, FABIO MASSIMO ZANZOTTO (2001). Multilingual Authoring: the NAMIC approach. In: Proceedings of the EACL/ACL Workshop on Human Language Technology and Knowledge Management (HLT & KM). Toulose (France), 2001
87. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2001). Web-based information access: Multilingual Automatic Authoring. In: PROCEEDINGS OF THE Third IEEE Conference on Information Technology: Coding and Computing ITCC-2002. Las Vegas, Nevada, USA, 2001, doi: 10.1109/ITCC.2002.1000446
88. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (2000). Customizable Modular Lexicalized Parsing. In: PROCEEDINGS OF THE 6TH INTERNATIONAL WORKSHOP ON PARSING TECHNOLOGY. TRENTO (ITALY), FEB. 2000
89. ROBERTO BASILI, MARIA TERESA PAZIENZA, MICHELE VINDIGNI, FABIO MASSIMO ZANZOTTO (2000). Tuning lexicons to new operational scenarios. In: Proceedings of the Second International Conference on Language Resources and Evaluation Conference (LREC2000). Athens (Greece), 2000
90. ROBERTO BASILI, MARIA TERESA PAZIENZA, MICHELE VINDIGNI, FABIO MASSIMO ZANZOTTO (1999). Adaptive parsing for time-constrained tasks. In: Proceedings of AIIA99 workshop on "Natural Language Processing and Speech Recognition". TRENTO (ITALY), 1999
91. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (1999). Lexicalizing a shallow parser. In: PROCEEDINGS OF TALN99 CONFERENCE, LE TRAITMENT AUTOMATIQUE DES LANGUES NATURELLES. CARGESE, CORSE (France), 12-17 JUILLET 1999,
92. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (1998). Efficient Parsing for Information Extraction,. In: Procedings of the European Conference on Artificial Intelligence. Brighton, UK, 1998
93. ROBERTO BASILI, MARIA TERESA PAZIENZA, FABIO MASSIMO ZANZOTTO (1998). Evaluating a Parsing System for Italian. In: Proceedings of the Workshop on The Evaluation of Parsing System, held with the International Conference on Language Resources and Evaluation. Granada (Spain), 1998
Curatela
94. IRINA MATVEEVA, LLUIS MARQUEZ, ALESSANDRO MOSCHITTI, FABIO MASSIMO ZANZOTTO (a cura di) (2011). Proceedings of TextGraphs-6 Workshop on Graph-based Methods for Natural Language Processing. Association for Computational Linguistics (ACL)
95. CARMEN BANEA, ALESSANDRO MOSCHITTI, SWAPNA SOMASUNDARAN, FABIO MASSIMO ZANZOTTO (a cura di) (2010). TextGraphs-5 2010Workshop on Graph-based Methods for Natural Language Processing. ISBN: 978-1-932432-77-0
96. CHRISTOPHER CALLISON-BURCH, IDO DAGAN, CHRISTOPHER MANNING, MARCO PENNACCHIOTTI, FABIO MASSIMO ZANZOTTO (a cura di) (2009). TextInfer 2009: ACL/IJCNLP 2009 Workshop on Applied Textual Inference. ISBN: 978-1-932432-48-0
Libri
97. Ido Dagan, Dan Roth, Fabio Massimo Zanzotto, Textual Entailment Recognition, Synthesis Lectures on Human Language Technologies, Morgan & Claypool Publishers, 2009 (in preparation)
Tutorials
98. Ido Dagan, Dan Roth, Fabio Massimo Zanzotto,Textual Entailment, in45th Annual Meeting of the Association for Computational Linguistics, Prague, 2007
99. Roberto Basili, Fabio Massimo Zanzotto, Parsing Robusto: Approcci Statistici e Simbolici per il riconoscimento sintattico su larga scala in 7th Conference of the Italian Association for Artificial Intelligence, Bari (Italy), September 2001
Posizioni Precedenti Ricoperte
· Ricercatorepersso il Dipartimento di Informatica, Sistemistica e Comunicazione presso l’Università di Milano-Bicocca from 2004 to 2006
· Assegnista di Ricerca presso il Dipartimento di Informatica, Sistemi e Produzione dell’Università di Roma - Tor Vergata sotto la guida della Prof.ssa M.T. Pazienza da Luglio 2002 ad Aprile 2004
· Collaboratore alla ricerca presso l’unità dell’Università di Roma - Tor Vergata sotto la guida della Prof.ssa M.T. Pazienza nel progetto MOSES, A MOdular and Scalable Environment for the Semantic WEB, IST-2001-37244, da Settembre 2002
· Ricercatore nel gruppo di Semantic Analysis Over Sparse Data nel Workshop 2003 presso “The Center for Language and Speech Processing” all’università di John Hopkins, Baltimora MD dal Luglio 2003 all’Agosto 2003
· Collaboratore alla ricerca presso l’unità dell’Università di Roma - Tor Vergata sotto la guida della Prof.ssa M.T. Pazienza nel progetto NAMIC, News Agencies Multilingual Information Categorisation, IST-99 12392, dal Febbraio 2000 a Settembre 2002
· Ricercatore visitatore presso lo Xerox Research Centre Europe (Grenoble, FR) per la ricerca sulla estrazione automatica di terminologia da testi dal Febbraio 2000 al Marzo 2000
· Collaboratore alla ricercanel progetto nazionale SI-TAL dal gennaio 2000 al marzo 2000
· Collaboratorealla ricerca presso l’unità dell’Università di Roma - Tor Vergata sotto la guida della Prof.ssa M.T. Pazienza nel progetto TREVI, Esprit Telematics Project n.21130, dal Marzo 1998 al Dicembre 1999.
· Ricercatore visitatore presso lo Xerox Research Centre Europe (Grenoble, FR) con borsa del programma europeo “Leonardo da Vinci” per la ricerca sui modelli di parsing sintattico dei testi dal Novembre 1998 al Maggio 1999
Esperienze internazionali di ricerca
· Ricercatore nel John Hopkins University summer workshop (Luglio-Agosto 2003): il summer workshop della John Hopkins University di Baltimora (Maryland) ha lo scopo di radunare un gruppo di esperti internazionali intorno ad un tema. Nell’ambito del Workshop 2003 ho partecipato come Researcher nel progetto di “Semantic Analysis Over Sparse Data” di Louise Guthrie e Roberto Basili per sperimentare tecniche statistiche e di apprendimento automatico per il problema dell’etichettamento semantico. Oltre che in alcune pubblicazioni [BNER2004, LREC2004a, LREC2004b], i risultati di tale progetto sono raccolti nel Final Report pubblicato sul sito del Workshop stesso.
· Ricercatore visitatore allo Xerox Research Centre Europe(XRCE): Nell’ambito della mia tesi di dottorato ho passato due periodi (Novembre 1998-Maggio 1999 e Febbraio-Marzo 2000) nel laboratori di Grenoble (Francia) per collaborare con Eric Gaussier sul tema dell’apprendimento automatico di terminologia da testi e con Salah Ait Moktar sul tema del parsing sintattico e della valtazione dei parser per lingue diverse dall’inglese.
Esperienze di ricerca e sviluppo
· Nel Progetto EuropeoMoses IST-2001-37244 (Settembre 2002-Febbraio 2005) sono stato responsabile tecnico per l’unità dell’università di Roma Tor Vergata e mi sono occupato di coordinare lo sviluppo di modelli di question-answering ontologici, di modelli di mapping tra ontologie e di modelli per l’apprendimento automatico di concetti, relazioni ed istanze. Tali modelli sono stati sviluppati principalmente per la lingua italiana. In particolare ho curato all’interno del progetto la gestione degli aspetti interdisciplinari con i partner del centro di ricerche di Linguistica Computazionale di Copenhagen di formazione prettamente umanistica. I risultati di tale progetto di ricerca sono stati descritti, oltre che in alcune pubblicazioni, nei deliverable del progetto.
· Nel Progetto EuropeoNamic IST-99 12392 (Febbraio 2000-Settembre 2002) mi sono occupato della progettazione e dello sviluppo di un sistema di elaborazione sintattico-semantica della lingua inglese e della lingua italiana allo scopo di supportare una attività automatica di hyperlinking testuale. I risultati scientifici di tale progetto sono stati riportati in alcune pubblicazioni specifiche oltre che nei deliverables.
· Nel Progetto NazionaleSI-TAL (gennaio-marzo 2000) dove lo scopo era quello di creare una corpus italiano etichettato sintatticamente e semanticamente mi sono occupato della progettazione del sistema per la gestione dei dati linguistici collaborando con i ricercatori del centro di linguistica computazionale di Pisa.
· Nel Progetto EuropeoTrevi Esprit Telematics Project n.21130 (Marzo 1998-Dicembre 1999) che aveva come scopo quello di costruire un sistema di categorizzazione di notizie basato su informazioni linguistiche mi sono occupato dell’implementazione di un parser sintattico per la lingua italiana e per la lingua inglese.
Tesi di Laurea
· Leonardo Tonna, Ars Ludica: Arte e Videogiochi, Corso di Laurea Lingue e Letterature Moderne, 2012
· Lorenzo Molinari, Politica illogica: analisi dei discorsi politici tramite strumenti di ricerca di implicazione testuale, Corso di Laurea Scienze della Comunicazione, 2012
· Annalisa Coluzzi, Apprendimento Automatico di Modelli per la Semantica Distribuzionale Composizionale: uno Studio Esplorativo, Corso di Laurea in Filosofia, 2011
· Luigia Ursi, Essere Opinion Leader credibili per promuovere il proprio prodotto turistico sul Web: Proposta di un Sistema per il Rilevamento Automatico di Cheaters su Siti di Commenti su Prodotti Turistici, Corso di Laurea in Scienze del Turismo Culturale, 2011
· Lorena D'angelo, Coltivare il turismo nei domini semantici: come pubblicizzare i siti turistici acquistando parole chiave non ovvie su web, Corso di Laurea in Scienze del Turismo Culturale, 2011
· Adriana Ganino, Da Brobdingnag a Lilliput: combattere il nanismo delle imprese italiane con le Olta su Web, Corso di Laurea in Scienze del Turismo Culturale, 2011
Tesi di Dottorato
· Lorenzo Dell'Arciprete, PhD Student, 2010-
· Francesca Fallucchi, PhD, Exploiting Transitivity in Probabilistic Modelsfor Ontology Learning, 2006-2010
Attività didattica
· Fondamenti di Informatica per il Turismo presso la Scuola IAD dell’Università di Roma “Tor Vergata” (AA 2011/2012)
· Trattamento del Linguaggio Naturale presso la facoltà di Lettere dell’Università di Roma “Tor Vergata” (AA 2011/2012)
· Informatica e Rappresentazione della Conoscenza presso la facoltà di Lettere dell’Università di Roma “Tor Vergata” (AA 2008/2009, AA 2009/2010, AA 2010/2011, AA 2011/2012)
· Fondamenti di Informatica per Umanisti presso la facoltà di Lettere dell’Università di Roma “Tor Vergata” (AA 2008/2009, AA 2009/2010, AA 2010/2011, AA 2011/2012)
· Linguaggi e Modelli per i Dati e la Conoscenza presso la facoltà di Lettere dell’Università di Roma “Tor Vergata” (AA 2006/2007, AA 2007/2008)
· Abilità Informatiche presso la facoltà di Lettere dell’Università di Roma “Tor Vergata” (AA 2006/2007, AA 2007/2008)
· Affidamento a titolo gratuito del corso di Intelligenza Artificiale (elementi) presso la facoltà di Scienze Matematiche, Fisiche e Naturali dell’Università di Milano-Bicocca(AA 2005/2006)
· Affidamento a titolo gratuito del corso di Basi di Dati (elementi) presso la facoltà di Scienze Matematiche, Fisiche e Naturali dell’Università di Milano-Bicocca(AA 2004/2005)
· Esercitatore nel corso Intelligenza Artificiale della Prof. Stefania Bandini presso la facoltà di Scienze Matematiche, Fisiche e Naturali dell’Università di Milano-Bicocca coperti: Elaborazione del Linguaggio Naturale, Parsing sintattico, Parsing Sintattico Robusto, Implementazione di Parsers Sintattico Robusto, Cenni di Apprendimento Automatico (AA 2004/2005)
· Esercitatore nel corso Linguaggi di Programmazione della Prof. Carla Simone presso presso la facoltà di Scienze Matematiche, Fisiche e Naturali dell’Università di Milano-Bicocca. Argomenti coperti: Argomenti trattati: Logica, Programmazione Logica, Prolog (AA 2004/2005, AA 2005/2006)
· Collaboratore alla didattica nel corso Basi di Dati Distribuite della Prof. Maria Teresa Pazienza presso la facoltà di Ingegneria dell’Università di Roma “Tor Vergata”. Argomenti coperti: Logiche descrittive e Web Semantico (AA 2003/2004)
· Collaboratore alla didattica nel corso Intelligenza Artificiale della Prof. Maria Teresa Pazienza presso la facoltà di Ingegneria dell’Università di Roma “Tor Vergata”. Argomenti coperti: Parsing sintattico, Parsing Sintattico Robusto, Implementazione di Parsers Sintattico Robusto (AA 2000/2001, AA 2001/2002, AA 2002/2003, AA 2003/2004)
· Collaboratore alla didatticanel corso Sistemi Basati su Conoscenza della Prof. Maria Teresa Pazienza presso la facoltà di Ingegneria dell’Università di Roma “Tor Vergata”. Argomenti coperti: Argomenti trattati: Logica, Programmazione Logica, Prolog, Agenti in Prolog (AA 2000/2001, AA 2001/2002, AA 2002/2003, AA 2003/2004)
· Collaboratore alla didatticanel corso di Abilità Informatiche del Prof. Roberto Basili presso Facoltà di Lettere e Filosofia dell’Università di Roma “Tor Vergata”. Argomenti coperti: Sistemi Operativi, Basi di Dati, strumenti di Office Automation (AA 2003/2004)
· Collaboratore alla didatticanel corso di Fondamenti di Informatica del Prof. Roberto Basili presso Facoltà di Lettere e Filosofia dell’Università di Roma “Tor Vergata”. Argomenti coperti: Sistemi Operativi, Basi di Dati, strumenti di Office Automation (AA 2000/2001, AA 2002/2003)
· Collaboratore alla didatticanei corsi di Fondamenti di Informatica 2 del Dott. Michele Vindigni e del Dott. Cicerchia presso la facoltà di Ingegneria dell’Università di Roma “Tor Vergata”. Argomenti coperti: Esercitazioni sul linguaggio di programmazione C/C++ (con Contratto Integrativo alla didattica) (AA 2000/2001)
· Collaboratore alla didatticanel corso di Basi di dati del Prof. Giuseppe Italiano presso la facoltà di Ingegneria dell’Università di Roma “Tor Vergata”. Argomenti coperti: XML, Esercizi di progettazione di una base di dati. (AA 1999/2000)
Altre attività
Partecipazioni a centri internazionali
· Founding Fellow of The International Institute of Cognitive Informatics and Cognitive Computing (ICIC)
Conference Top Organization
· Program Co-Chair, Brain Informatics 2012
Organizzazione workshop
· TextGraphs-6 co-located at ACL 2011, US
· TextInfer 2011 co-lcated at EmNLP 2011, UK
· TextGraphs-5 co-located at ACL 2010, Sweden
· TextInfer 2009 co-lcated at ACL 2009, Singapore
Partecipazione a comitati di programma di workshop
· DiDaS 2012 – 1st Workshop on Distributional Data Semantics at the 6th IEEE International Conference on Semantic Computing (ICSC)
· Textgraphs 2012 colocated at ACL 2012
· EmNLP Workshop on GEMS : GEometrical Models of Natural Language Semantics, 2011
· MLG-2010: Mining and Learning from Graphs
· ACL Workshop on GEMS : GEometrical Models of Natural Language Semantics, 2010
· EACL Workshop on GEMS : GEometrical Models of Natural Language Semantics, Athens, Greece, 2009
· CoLing Workshop on TextGraphs, 2008
· NAACL-HLT Workshop on TextGraphs, 2007
· ACL-PASCAL Workshop on Pascal Challenge Workshop: Recognizing Textual Entailment, Prague, Czech Republic, 2007
· 2nd Workshop on Pascal Challenge Workshop: Recognizing Textual Entailment 2006, Venice (Italy)
· 4rd Workshop on RObust Methods in Analysis of Natural language Data at EACL 2006, Trento (Italy)
· 3rd Workshop on RObust Methods in Analysis of Natural language Data at CoLing 2004, Geneva (Switzerland)
· Workshop of Event Modelling for Multilingual Document Linking at LREC 2002, Canary Islands (Spain), May 2002
Partecipazione come revisore: Conferenze
· IEEE International Conference on COGNITIVE INFORMATICS & COGNITIVE COMPUTING: 2012
· *Sem: 2012
· Association of Computational Linguistics (ACL): 2012, 2011, 2009, 2006, 2003
· North American Association of Computational Linguistics (NAACL): 2012, 2009
· European Association of Computational Linguistics (EACL): 2012, 2009
· Language Resources and Evaluation Conference (LREC): 2012, 2010, 2008, 2006
· International Joint Conference on Artificial Intelligence (IJCAI): 2011, 2005
· Empirical Natural Language Processing (EmNLP): 2012(EmNLP-CoNLL), 2011, 2010, 2007
· Extended Semantic Web Conference (ESWC): 2011
· Brain Informatics (BI): 2010
· International Conference on Computational Linguistics (CoLing): 2012, 2010, 2008
· Cross Lingual Evaluation Forum Conference (CLEF): 2010, 2009, 2008
· European Conference on Artificial Intelligence (ECAI): 2008, 2004
· Nolidata 2007
· European Conference on Information Retrieval 2005 (ECIR): 2005
· ACM Special Interest Group on Information Retrieval Conference 2002 (SIGIR 2002)
Partecipazione come revisore: Journal
· Journal of Natural Language Engineering 2012
· ACM Transactions on Intelligent Systems 2011
· Cognitive Computation Journal 2010
· Computational Linguistics Journal (2006)
Partecipazione come revisore: Journal – Guest Editorial Board
· Journal of Natural Language Engineering 2011 – Special Issue on Structured Input – Structured Output
· Artificial Intelligence Journal 2011 – Special Issue on
· IEEE Data and Knowledge Engineering 2010
· Journal of Natural Language Engineering 2010 – Special Issue on Distributed Approaches
· Journal of Natural Language Engineering 2008
Partecipazione a comitati di organizzazione
· Conferenza dell’Associazione Italiana di Intelligenza Artificiale 2005 (AIIA2005): Responsabile del comitato di organizzazione
· School of Information Extraction 2002 (SCIE 2002): Responsabile dell’organizzazione delle attività di laboratorio
· Schoolof InformationExtraction 1999 (SCIE 1999)
Premi
· Yahoo Award 2010
Presenza sulla stampa nazionale
· Espresso On Line, Sms, il 'tvb' entra nell'Oxford di Maria Simonetti, http://espresso.repubblica.it/dettaglio/sms-il-tvb-entra-nelloxford/2154276
· Corriere della Sera, 11 Maggio 2011, http://www.corriere.it/cultura/11_maggio_11/scritture-brevi-convegno_d93357a6-7bd8-11e0-9798-7300882160ff.shtml
Invited Talks
· CNR-Semantic Technologies Labs, (2nd STLab Workshop 2012, 13/3/2012): Machine Learning for Recognizing Textual Entailment
· Yahoo Labs, 2010,'Search Science' seminar, 15/09/2010: Learning Compositional Distributional Semantics Models
· New York University, 8/12/2009, Textual Entailment
· Microsoft Research Center Asia, Bejing, 21 October 2009: Techniques in Machine Learning for Textual Entailment: Possible Applications to Machine Translation
· Microsoft Research Center Seattle, 17 March 2008: Learning Rules for Textual Entailment
· Saarland University, Saarbrucken, 14/6/2007: Machine Learning for Recognizing Textual Entailment
· IRST, Trento, 2/5/2006: The Chaos Project: Theory and Practice
Project Reviewer
· ERC: Evaluator 2012
· COSYNE European Project: MidTerm Reviewer 2011, 2012
· PASCAL2 pump-priming program: 2009
Commissioni di Dottorato
· Università di Trento, Commissione 2010, Dottorato in Informatica, Marco Dinarelli
· Passaggio anni successivi, Università di Trento, Commissione 2011, Dottorato in Informatica
Titoli
2002
Dottorato di ricerca in Informatica e Ingegneria dell’automazione
Università degli Studi ‘Tor Vergata’, Roma
Titolo della tesi di dottorato: “L’estrazione della terminologia come strumento per la modellazione dei domini conoscitivi”
2002
Master in Business Administration
Profingest, Business School, Bologna
1997
Università degli Studi ‘Tor Vergata’ Roma
– Laurea in Ingegneria Informatica conseguita il 13/5/1997
– votazione 100/100 e lode
– titolo tesi di laurea: “Una metodologia stratificata per l’analisi del linguaggio naturale. Il sistema Chaos”
Fabio Massimo Zanzotto is an Associate Professor at Department of Enterprise Engineering of the University of Rome ”Tor Vergata”. Since 1998, he has interests in the research endeavor of Artificial Intelligence. He is active in the area of Natural Language Processing, mainly working in three areas: recognizing textual entailment, syntactic parsing for Italian, and, recently, distributed/distributional models for NLP.
Area of Recognizing Textual Entailment
The term recognizing textual entailment (RTE) has been recently introduced in NLP to systematically foster studies in defining computational models that replicate the human ability to determine whether or not texts imply sentences. A simple RTE example is determining whether or not “Acme bought BigT” entails “Acme owns BigT”. Zanzotto has been interested in this scientific endeavor since its beginning in 2005. He is mainly interested in studying the application of machine learning models to the RTE. After 2005, a first exploratory year [7], during the investigation of the application of ML models to RTE task, Zanzotto produced a major innovation for the specific RTE field [14, 13, 10] as well as for the related fields of natural language processing, machine learning [6], and graph analysis applied to text [15]. It is still under analysis if the innovation can generate an interest in the research area of graph theory as it involves graph isomorphism on a particular class of graphs. The innovation is the following. In the context of machine learning models based on kernel functions, he proposed a novel class of feature spaces encoding first-order rewrite rules. With this new class of feature spaces and the related kernel functions, Zanzotto and his colleagues produced a system which scored at the 3rd place in the 2006 worldwide RTE Challenge (scored 1st among the academic systems) and in the 5th place in 2007 RTE Challenge. The exploration of full potential of this ides is still an on-going research as the class of first-order rewrite rule feature spaces can be applied in many areas of natural language processing (machine translation, document summarization, stylistic control systems, question-answering, and dialogue models) as well as in many other research areas. For these interests, Zanzotto has been invited to the program committees of all the textual entailment recognition workshops and challenges after the first. In 2009, Zanzotto co-chaired the ACL workshop of Applied Textual Inference that has a program committee with researchers in the area of textual entailment recognition and natural language processing. In 2009, he co-organized the Italian chapter of the RTE challenge in Evalita 2009. Zanzotto, together with Ido Dagan and Dan Roth, gave a tutorial titled “Textual Entailment Recognition” in the 45th Association of Computational Linguistics (ACL) Annual Conference. The tutorial has originated a book that is in preparation. He co-organized two editions of the TextGraphs Workshop series (2010,2011). He steadly participated to the program committees of the TextGraphs (2007, 2008, 2012) and he partecipated to the program committee of the workshop MLG-2010: Mining and Learning from Graphs.
Area of Syntactic Parsing
In the early stages of his career, Zanzotto developed a robust natural language syntactic parser [1, 2, 3, 4] based on two principles: lexicalization and modularization. He proposed a novel model for representing syntactic information for modular parsing system that combined the two alternative theories: the dependency and the constituency based model. The resulting syntactic parser is still one of the only available syntactic parsing system for Italian. For these interests, Zanzotto has been invited as program committee member in the two workshops on RObust Methods for Analyzing Natural language Data (ROMAND) (2004,2006). Due to his expertise in Italian parsing technologies, he participated as co-organizer in the “parsing track” of the Evalita 2007 Challenge, he wrote the parsing technology chapter of an Italian Artificial Intelligence Book, and he gave a tutorial in the Italian Association for Artificial Intelligence in 2001.
Area of distributed/distributional models for NLP
Zanzotto is recently studying the implication of distributed representations and distributional semantics in natural language processing [12, 5, 11] and in relation to the brain representation of knowledge and information. For this purpose, he investigated the replication of Brain State Decoders for traditional computers [8, 9]. For this research area, he has been involved in the program committe of GEMS: GEometrical Models of Natural Language Semantics in (2009,2010, 2011) and, recently, *Sem (2012). He has been involved in Brain Informatics as program committee member in 2010 and as Program Chair in 2012.
General information
Zanzotto is author of more than 100 pubblications. He is a reviewer for the major conferences in the area of NLP and AI (ACL, NAACL, EACL, EmNLP, CoLing, LREC, IJCAI, ECAI, CLEF) and for journals (Computational Lingusitics, Journal of Natural Language Engineering, Cognitive Computation Journal, ACM Transactions on Intelligent Systems, IEEE Data and Knowledge Engineering). He is member of ACL and of the Italian Association on Artificial Intelligence (AIIA).
Selected Publications
[1] Roberto Basili, Maria Teresa Pazienza, and Fabio Massimo Zanzotto. Efficient parsing for information extraction. In Proc. of the ECAI98. Brighton, UK, 1998.
[2] Roberto Basili, Maria Teresa Pazienza, and Fabio Massimo Zanzotto. Lexicalizing a shallow parser. In Proc. of the Traitement Automatique de la Langue Naturelle, TALN99. Cargese, FR, 1999.
[3] Roberto Basili, Maria Teresa Pazienza, and Fabio Massimo Zanzotto. Customizable modular lexicalized parsing. In Proc. of the 6th International Workshop on Parsing Technology, IWPT2000. Trento, Italy, 2000.
[4] Roberto Basili and Fabio Massimo Zanzotto. Parsing engineering and empirical robustness. Natural Language Engineering, (8/2-3):1245–1262, 2002.
[5] Yashar Mehdad, Alessandro Moschitti, and Fabio Massimo Zanzotto. Syntactic/semantic structures for textual entailment recognition. In Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics, HLT ’10, pages 1020–1028, Stroudsburg, PA, USA, 2010. Association for Computational Linguistics.
[6] Alessandro Moschitti and Fabio Massimo Zanzotto. Fast and effective kernels for relational learning from texts. In Proceedings of the International Conference of Machine Learning (ICML). Corvallis, Oregon, 2007.
[7] Maria Teresa Pazienza, Marco Pennacchiotti, and Fabio Zanzotto. Textual entailment as syntactic graph distance: a rule based and a svm based approach. In Proceedings of the 1st Pascal Challenge Workshop, Southampton, UK, 2005.
[8] Fabio Massimo Zanzotto and Danilo Croce. Reading what machines ”think”. In BI 2009: Proceedings of the Brain Informatics Conference - Bejing, China, October 2009, volume LNAI 5819, pages 159–170. Springer-Verlag, 2009.
[9] Fabio Massimo Zanzotto and Danilo Croce. Comparing eeg/erp-like and fmri-like techniques for reading machine thoughts. In BI 2010: Proceedings of the Brain Informatics Conference, Toronto, volume 6334 of Lecture Notes in Computer Science, pages 133–144. Springer-Verlag, 2010.
[10] Fabio Massimo Zanzotto and Lorenzo Dell’Arciprete. Efficient kernels for sentence pair classification. In Conference on Empirical Methods on Natural Language Processing, pages 91–100, 6-7 August 2009.
[11] Fabio Massimo Zanzotto and Lorenzo Dell’Arciprete. Distributed structures and distributional meaning. In Proceedings of the Workshop on Distributional Semantics and Compositionality, pages 10–15, Portland, Oregon, USA, June 2011. Association for Computational Linguistics.
[12] Fabio Massimo Zanzotto, Ioannis Korkontzelos, Francesca Fallucchi, and Suresh Manandhar. Estimating linear models for compositional distributional semantics. In Proceedings of the 23rd International Conference on Computational Linguistics (COLING), August, 2010.
[13] Fabio Massimo Zanzotto and Alessandro Moschitti. Automatic learning of textual entailments with cross-pair similarities. In Proceedings of the 21st Coling and 44th ACL, pages 401–408. Sydney, Australia, July 2006.
[14] Fabio Massimo Zanzotto, Marco Pennacchiotti, and Alessandro Moschitti. A machine learning approach to textual entailment recognition. NATURAL LANGUAGE ENGINEERING, 15-04:551–582, 2009.
[15] FM Zanzotto, L Dell’Arciprete, and A Moschitti. Efficient graph kernels for textual entailment recognition. Fundamenta Informaticae, 107(2-3):199 – 222, 2011.