sábado, 2 de enero de 2021

Diferencias entre taxonomías y las ontologías

A lo largo de los años, la gente me ha preguntado en qué se diferencia una taxonomía de una ontología. La respuesta (o al menos una respuesta razonablemente simple) es que "una taxonomía es una ontología en forma de árbol".


Sin embargo, vale la pena profundizar un poco más para comprender lo que eso significa:

A principios del siglo XVIII, un biólogo sueco de nombre Carl Linnaeus inició un proyecto bastante ambicioso. Quería construir una forma de indexar animales y plantas por sus fenotipos, las formas en que se parecen. Su taxonomía original era bastante básica, pero a lo largo de las décadas, finalmente creó un sistema con unos pocos miles de entidades vivientes. Usó la palabra francesa Taxonomie, derivada del término griego para una disposición de conocimiento, y la Taxonomía de Linnaeus continuaría provocando una revolución en la biología a medida que generaciones de científicos incorporaron nuevas especies en ella.


Este es el tipo de taxonomía que la mayoría de la gente conoce de inmediato, y se destaca principalmente por su organización en forma de árbol. Los términos más generales se ubicaron hacia la raíz del árbol, luego en cada rama (nodo) Linneo puso especies más detalladas:


Animales => Vertebrados => Mamíferos => Carnívoros => Animales felinos => Gatos domésticos.  


La teoría detrás de esta organización era que los animales estaban más especializados cuanto más avanzados estaban (más lejos del tronco). No es sorprendente que fuera uno de los cimientos de la base de la selección natural, aunque este modelo era bastante primitivo. El árbol también estableció un sistema de clasificación de especificidad, con cada grado del árbol indicando más especificidad hasta que golpea las hojas, que contienen las especies asociadas.

Esta taxonomía es importante porque contiene tanto los términos de interés (carnívoros, por ejemplo) como un conjunto de reglas generales que indica cómo se relacionan los términos entre sí. Existen taxonomías similares: el Sistema Decimal Dewey o el esquema organizativo más reciente de la Biblioteca del Congreso, que de manera similar desglosa las ramas generales de conocimiento o comprensión en un esquema o arreglo particular.

Los esquemas de clasificación son de particular importancia tanto para la programación como para la inteligencia artificial. La mayoría de los objetos, cuando se analiza directamente, se pueden considerar como listas de propiedades atómicas (como la longitud) y propiedades categóricas (como colores o texturas), o de estructuras compuestas que pueden desglosarse de forma similar (como el dirección de una casa). Una propiedad categórica determinada puede considerarse como una lista de cadenas, aunque semánticamente, esas listas pueden ser entidades por derecho propio. En XML y JSON. (Por ejemplo, una lista de estados de EE. UU. O provincias canadienses se consideran enumeraciones o valores categóricos, pero cada estado o provincia también puede tener información de anotación adicional, como la fecha de fundación o la población en un momento determinado.


La ontología como asignatura general significa el estudio de las cosas (griego logos +  ontos ). Como concepto matemático, una ontología es la colección de términos o conceptos dentro del alcance de la ontología más el modelo que describe las relaciones y restricciones de esos conceptos. Las ontologías generalmente se expresan matemáticamente como gráficos, con el concepto de que un gráfico podría (aunque no tiene que) crear un ciclo cerrado. Estos gráficos también son direccionales: hay una dirección preferida para recorrer el gráfico. Los matemáticos se referirían a estos como gráficos cíclicos dirigidos (DCG).

Una taxonomía es, en general, un gráfico acíclico dirigido (DAG), lo que significa que no son posibles bucles en el gráfico. Los DAG también se conocen como árboles . Además, tanto los DAG como los DCG se pueden etiquetar; cada nodo y borde puede tener un identificador específico.

La mayoría de las taxonomías tienden a ser de naturaleza arbórea, trabajando desde una raíz muy general hasta hojas muy especializadas. En consecuencia, son gráficos acíclicos o DAG. Una ontología es más generalizada (puede tener bucles dentro del gráfico de una ontología) y, como tales, son DCG. Lo importante a tener en cuenta aquí es que todos los DAG son subconjuntos de DCG. Esto significa dos cosas: primero, una taxonomía es una ontología, segundo, no todas las ontologías se pueden representar como taxonomías sin introducir el concepto de referencia.

En cualquier taxonomía moderna, cada nodo del gráfico debe identificarse mediante una dirección única o GUID de algún tipo. En el lenguaje de las bases de datos, esto es lo que se conoce como clave principal. Si otro nodo tiene una conexión o borde que tiene el valor de esta clave, se dice que este nodo tiene una referencia a la clave (o tiene una relación de clave externa). Una tabla en una base de datos relacional debe tener (si está diseñada correctamente) al menos una clave primaria, pero puede tener múltiples referencias de clave externa. Si no se crea ningún bucle, se dice que la base de datos es acíclica. En una base de datos relacional, el motor de la base de datos no permitirá activamente ningún bucle que se cree, por lo que una base de datos relacional en teoría también debería ser un DAG.

Irónicamente, un documento XML, un documento JSON o un conjunto de triples RDF pueden tener relaciones que formen gráficos cíclicos. Sin embargo, una vez que esto sucede, ya no son como árboles. En términos taxonómicos, esto sería como agregar una relación "Ver también" que conectaría al gato con el perro. La mayoría de las taxonomías que son estrictamente arbóreas también tienen la misma relación que se extiende en ese árbol, como Cat "es más especializado que" Carnivore, Carnivore es más especializado que Mammal y así sucesivamente. (Los matemáticos dirían que el gráfico tiene un  cierre transitivo sobre la propiedad "es más especializado que".

Entonces, una buena definición de trabajo es que una taxonomía es una ontología que es (en su mayoría) un gráfico acíclico dirigido etiquetado con un solo cierre transitivo que contiene todos los nodos en ese gráfico. Ante los ojos de la persona con la que estás hablando, puedes decirlo de manera más simple como "una taxonomía es una ontología en forma de árbol". 


Fuentes.

Artículo:  "En qué se diferencian las taxonomías de las ontologías" Publicado en https://www.datasciencecentral.com/ por Kurt Cagle el 19 noviembre 2020. Consultado el 14/12/2020.

URL: https://www.datasciencecentral.com/profiles/blogs/understanding-how-taxonomies-differ-from-ontologies


No hay comentarios:

Publicar un comentario