Woordenboek

Taxonomisch Woordenboek

Het Gellish electronisch taxonomisch woordenboek (dat ook een ontologie genoemd kan worden) is een meertalig woordenboek van concepten dat zowel tekstuele definities biedt als ook computerinterpreteerbare delen van definities. Het wordt een taxonomisch woordenboek genoemd omdat elk concept is gedefinieerd door ten minste één computerinterpreteerbare relatie met een direct supertype concept. Dat betekent dat alle gedefinieerde concepten gerangschikt zijn in één geïntegreerde subtype-supertype hiërarchie, die ook een taxonomie genoemd wordt. Het woordenboek wordt ook een taaldefiniërende ontologie genoemd, omdat het ook expliciete relaties tussen concepten (definitiemodellen) bevat die specificeren wat per definitie het geval is voor de gedefinieerde concepten. Zulke relaties zijn ook onderdeel van de definitie van de formele taal.
Een taal bestaat niet alleen maar uit woorden (termen of namen van concepten), maar ook uit standaard frasen (specifieke vaste volgordes van bepaalde woorden) die gebruikt kunnen worden voor het maken van computerinterpreteerbare expressies (uitdrukkingen). De frasen in dit woordenboek duiden soorten relaties aan. Die soorten relaties classificeren de relaties tussen concepten (dus niet alleen relaties tussen personen). Bijvoorbeeld, de frasen <heeft als deel> of <bevindt zich in>. Een essentiële sectie van de taaldefinitie is daarom de verzameling van soorten relaties met hun tekstuele definities en de frasen waardoor ze aangeduid kunnen worden. Die definities van soorten relaties omvat onder andere de specificaties van de soorten rollen in zulke relaties én de toelaatbare soorten rolspelers in zulke relaties (ook wel hun domein en bereik genoemd).
Het volledige taxonomische woordenboek is licenceerbaar en wordt geleverd in de vorm van computer leesbare files en kan geïmporteerd worden in databanken en systemen. Sommige delen zijn als basiseditie vrij beschikbaar via de download optie in de Gellish website of als deel van de referentietoepassingssoftware op GitHub.

Taxonomisch Woordenboek van Relaties

De sectie van het taxonomische woordenboek dat de definities van soorten relaties bevat wordt ook wel de ‘basisontologie’ of het ‘taxonomisch woordenboek van relaties’ genoemd. Dat deel’woordenboek’ is een gedeelte van het veel grotere taxonomische woordenboek of ontologie die de betekenissen definieert van de Gellish familie van geformaliseerde talen, waaronder Formeel Nederlands. De definities van soorten relaties in de basisontologie bevatten dus zowel tekstuele definies van die soorten relaties als ook namen en frasen waardoor die soorten relaties aangeduid kunnen worden, als ook de namen en synoniemen van soorten rollen in zulke soorten relaties en ook van concepten die zulke rollen kunnen vervullen. Het woordenboek van relaties, ofwel de basisontologie, bevat echter geen andere relaties tussen concepten.
Het equivalente taxonomische woordenboek van relaties voor de formele Engelse taal definieert exact dezelfde concepten en duidt ze aan met dezelfde unieke identificatoren (UIDs). Die Engelse versie is ook beschikbaar en de kern daarvan kan geraadpleegd worden via English Dictionary.

Soorten relaties worden uniek gerepresenteerd door hun UIDs en in dit woordenboek aangeduid door zowel namen als synonieme namen, basis frasen en inverse frasen. De frasen zijn bedoeld om in Formeel Nederlandse uitdrukkingen gebruikt te worden. Bijvoorbeeld de frase <bevindt zich in> kan gebruikt worden in uitdrukkingen zoals ‘De Eiffeltoren <bevindt zich in> Parijs. De inverse frasen duiden dezelfde soorten relaties aan als de basisfrasen, behalve dat het linker concept en het rechter concept van plaats verwisseld zijn in de uitdrukking.
Een naam van enig soort relatie is bedoeld als een naam die neutraal is ten opzichte van enige leesrichting in Formeel Nederlands (ondanks het feit dat een naam wellicht een leesrichting suggereert). Dis een naam alleen specificeert niet of
‘A Rel B’ of ‘B Rel A’ geldig is. Daarom komen namen van relaties gewoonlijk niet in uitdrukkingen voor, maar in de plaats daarvan worden er frasen gebruikt.

De ontologie definieert ook de soorten dingen die respectievelijk een eerste rol en een tweede rol mogen spelen in een uitdrukking. In het Nederlands correspondeert de frase waarvan verklaard is dat hij de basisfrase voor een naam (Pb) is met een uitdrukking waarin de speler van de eerste rol (A) zich aan de linker kant en de speler van de tweede rol (B) zich aan de rechter kant van de frase bevindt. Dus <A Pb B> en niet <B Pb A>. De inverse frase Pi correspondeert met de inverse posities van A en B. Dus <B Pi A> is equivalent met <A Pb B>. Bijvoorbeeld, de frase <bevindt zich is> is een inverse frase voor de soort relatie met de naam “zich bevinden in een fysiek object”.

Gebruikers wordt aangeraden te zoeken naar soorten relaties door te zoeken naar het voorkomen van de naam van een soort rol die gespeeld kan worden door het linker of rechter gerelateerde object.

Voor een beter begrip van een definitie wordt het aangeraden om ook de definities van de directe supertype(n) concept(en) van het betreffende concept te raadplegen.

Software, speciaal als het de RDF taal gebruikt, zou naar de concepten en termen kunnen refereren door middel van URI‘s. Referenties naar een Gellish UID kan gedaan worden via een absolute URI of naar een Formeel Nederlandse term of frase.
Bijvoorbeeld, het volgende is een URI http://www.formalenglish.net/dictionary#2850 die een referentie is naar het concept met UID ‘2850’ en de volgende URI http://www.formalenglish.net/dictionary#relation is een referentie naar hetzelfde concept via de term ‘relation’.

Elke definitie begint met een referentie naar een supertype concept (met een andere UID) die hoger in de taxonomische hiërarchie gerangschikt is, dus hoger in de subtype-supertype hiërarchie van soorten relaties (niet in een deel-geheel hiërarchie). Als die soorten relaties zijn daardoor subtypen van de top soort relatie met de naam ‘relatie’. De stricte taxonomie definieert zodoende ‘overerving’ van kennis, vereisten en van definities. Bovendien maakt het daardoor mogelijk dat software de semantische correctheid van de uitdrukkingen verifieert en logische conclusies kan trekken.

Relaties kunnen meer dan één supertype relatie hebben. In zulke gevallen zullen ze meer dan één textuele definitie hebben die syntactisch een klein beetje verschillen, maar niet qua betekenis.

Het boek ‘Semantic Information Modeling in Formalized Languages‘ (2014) biedt een systematische presentatie en bespreking van de taxonomie van soorten relaties in dit woordenboek. Bovendien biedt het een definitie van de soorten contextuele feiten die context kunnen geven aan uitdrukkingen ten behoeve van eenduidigheid van hun interpretatie. Het boek beschrijft ook semantische patronen die mede richtlijnen geven voor semantisch modelleren. Het boek ‘Semantic Information Modeling Methodology‘ biedt meer richtlijnen voor de toepassing van de Gellish geformaliseerde talen.


Soorten relaties


De soorten relaties en hun definities zijn beschreven in het fysieke woordenboek (op papier) met de naam ‘Taxonomisch Woordenboek van Relaties’. Voor een website met de Engelse versie wordt vooralsnog verwezen naar https://www.formalenglish.net/dictionary.html.
De Nederlandse versie kan op verzoek beschikbaar gemaakt worden.