Synset
Un synset (abbreviazione di synonym set, in italiano insieme di sinonimi) è un gruppo di lemmi o sinonimi che condividono lo stesso senso o concetto lessicale. Ogni synset rappresenta una singola unità semantica, definita da una breve definizione (glossa) e da un insieme di sinonimi che possono essere usati in contesti simili. Le varianti sinonimiche possono inoltre dipendere da fattori diafasici, diastratici o diatopici. Il concetto di synset è stato introdotto nel progetto WordNet, una banca dati lessicale del Princeton Cognitive Science Laboratory ideata da George A. Miller e colleghi alla fine degli anni ’80. Una stessa parola può appartenere a più synset se presenta diversi sensi (o significati). Ad esempio, il lemma banca può riferirsi sia a un istituto finanziario, sia alla riva di un fiume: in questo caso, due synset distinti conterranno lo stesso lemma nei due significati differenti. Questo approccio permette di organizzare il lessico secondo varie relazioni semantiche (come iponimia, iperonimia e meronimia) e relazioni lessicali (come la sinonimia e l'antonimia), dando origine — come nel caso di WordNet — a una vera e propria rete semantica o grafo di conoscenza, in cui i nodi identificano i synset e gli archi rappresentano le relazioni tra di essi.
Un synset (abbreviazione di synonym set, in italiano insieme di sinonimi) è un gruppo di lemmi o sinonimi che condividono lo stesso senso o concetto lessicale. Ogni synset rappresenta una singola unità semantica, definita da una breve definizione (glossa) e da un insieme di sinonimi che possono essere usati in contesti simili. Le varianti sinonimiche possono inoltre dipendere da fattori diafasici, diastratici o diatopici. Il concetto di synset è stato introdotto nel progetto WordNet, una banca dati lessicale del Princeton Cognitive Science Laboratory ideata da George A. Miller e colleghi alla fine degli anni ’80.[1][2]
Una stessa parola può appartenere a più synset se presenta diversi sensi (o significati). Ad esempio, il lemma banca può riferirsi sia a un istituto finanziario, sia alla riva di un fiume: in questo caso, due synset distinti conterranno lo stesso lemma nei due significati differenti. Questo approccio permette di organizzare il lessico secondo varie relazioni semantiche (come iponimia, iperonimia e meronimia) e relazioni lessicali (come la sinonimia e l'antonimia), dando origine — come nel caso di WordNet — a una vera e propria rete semantica o grafo di conoscenza, in cui i nodi identificano i synset e gli archi rappresentano le relazioni tra di essi.
Synset multilingue
[modifica | modifica wikitesto]Sebbene originariamente concepito per l'inglese, il concetto di synset è stato esteso ad altre lingue tramite progetti internazionali. Il progetto EuroWordNet ha creato un database multilingue con wordnet per diverse lingue europee (néerlandese, italiano, spagnolo, tedesco, francese, ceco, estone), ognuna strutturata secondo i synset e collegata tramite un indice interlinguistico.[3][4] Analogamente, il progetto Open Multilingual WordNet (OMW) raccoglie numerose wordnet aperte per molte lingue e le allinea tramite synset condivisi o collegati alla WordNet inglese come riferimento comune.[5]
BabelNet introduce un’altra estensione: integra concetti e entità nominate in molte lingue, identificati in Babel synset, ovvero synset multilingui che abbracciano sinonimi in lingue diverse, con definizioni multilingue e relazioni semantiche tra synset.[6][7]
Esempio
[modifica | modifica wikitesto]Un synset relativo al concetto di automobile può comprendere l'insieme di lemmi con la corrispondente definizione:
{ car, auto, automobile, motorcar } -- A motor vehicle with four wheels; usually propelled by an internal combustion engine
Analogamente, la wordnet italiana[8] contiene il seguente synset:
{ auto, automobile, autovettura, macchina } -- Autoveicolo adibito al trasporto di un numero limitato di persone su strada
Infine BabelNet fornisce un synset multilingue[9] contenente, tra gli altri lemmi:
{ (EN) car, (EN) auto, (EN) automobile, (EN) motorcar, (ES) coche, (FR) voiture, (FR) automobile, (IT) auto, (IT) automobile, (IT) autovettura, (IT) macchina, (IT) vettura, (ZH) 汽车 }
Note
[modifica | modifica wikitesto]- ^ Miller, G. A. (1995). WordNet: A lexical database for English. Communications of the ACM, 38(11), 39–41.
- ^ Fellbaum, C. (1998). WordNet: An Electronic Lexical Database. MIT Press.
- ^ Vossen, P. (1998). EuroWordNet: A Multilingual Database with Lexical Semantic Networks. Kluwer Academic Publishers.
- ^ Vossen, P. (1997). "EuroWordNet: a Multilingual Database for Information Retrieval". DELOS workshop, Zurich.
- ^ Bond, F. & Foster, R. (2013). Linking and extending an Open Multilingual Wordnet. In Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, pages 1352–1362, Sofia, Bulgaria.
- ^ Navigli, R., Ponzetto, S. P. (2012). "BabelNet: The Automatic Construction, Evaluation and Application of a Wide-Coverage Multilingual Semantic Network." Artificial Intelligence, 193, 217-250.
- ^ Navigli, R. & Ponzetto, S. P. (2010). "BabelNet: Building a Very Large Multilingual Semantic Network." In Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics, pp. 216-225.
- ^ A. Roventini, A. Alonge, N. Calzolari, B. Magnini, F. Bertagna (2000). ItalWordNet: a Large Semantic Database for Italian. In Proceedings of the Second International Conference on Language Resources and Evaluation (LREC), Atene, Grecia.
- ^ Synset in BabelNet per automobile, su babelnet.org.
Voci correlate
[modifica | modifica wikitesto]Collegamenti esterni
[modifica | modifica wikitesto]- Open English WordNet, su en-word.net.
- BabelNet, su babelnet.org.