Las personas realizamos constantes procesos de clasificación, desde los más sencillos (determinar a qué clase pertenece una fruta) hasta cuestiones complejas como determinar, a raíz de la información que contiene un TAC, si una persona padece o no cáncer. José Antonio Sanz Delgado, ingeniero informático por la UPNA, ha desarrollado en su tesis doctoral diferentes algoritmos para resolver de modo automático este tipo de problemas de clasificación. “Además, —señala— los sistemas de clasificación que proponemos tienen la capacidad de razonar la decisión que han tomado”, indica.
Esto es debido a que las reglas que los sistemas utilizan para tomar una decisión están formadas por palabras que las personas usamos habitualmente. Un ejemplo de estas reglas sería el siguiente: “si los ingresos son elevados y su puesto es fijo, entonces concederle préstamo” Pero, ¿cómo sabe el ordenador qué es un ingreso elevado? Para esto se utiliza la lógica difusa, que es una de las mejores herramientas para modelar la información imperfecta o imprecisa. “En la lógica difusa —explica el profesor Sanz Delgado— cada palabra tiene asociada una función de pertenencia, que nos indica el grado en que un dato pertenece a esa palabra. Por ejemplo, si una persona tiene unos ingresos de 2.000 euros mensuales, podemos decir que tiene unos ingresos medianamente elevados y, por tanto, le asociaremos un grado de pertenencia de 0,6”.
La principal novedad de su trabajo de investigación consiste en que por primera vez se han utilizado los conjuntos difusos intervalo-valorados: “Siguiendo con el ejemplo del concepto de ingresos elevados, le asociaremos un intervalo como grado de pertenencia; es decir, en lugar de 0,6, le asignamos el intervalo 0,55 a 0,7. Mediante este tipo de conjuntos afrontamos de forma más natural el problema de que la misma palabra no significa lo mismo para todas las personas y contextos. Por ejemplo, el concepto de “persona alta” no será lo mismo para mí que para Pau Gasol. Por eso, cuestionamos la definición de las funciones de pertenencia y asignamos un número al que llamamos grado de ignorancia”. Junto a esto, en la tesis se utilizan algoritmos evolutivos para maximizar el efecto positivo que tiene considerar el grado de ignorancia en el sistema de clasificación.
El núcleo de la tesis está compuesto por cuatro artículos, publicados en revistas indexadas en Journal Citation Report, en los que se presenta la nueva metodología junto con un estudio experimental exhaustivo del trabajo. “Hemos demostrado estadísticamente cómo nuestras propuesta nos permiten mejorar los resultados del mejor clasificador existente en la actualidad”, destaca Sanz Delgado.
Su tesis doctoral, “Sistemas de clasificación basados en reglas lingüísticas utilizando conjuntos difusos intervalo-valorados y ajuste de la ignorancia”, ha estado dirigida por los catedráticos Humberto Bustince, del Departamento de Automática y Computación de la UPNA, Francisco Herrera, de la Universidad de Granada, y el profesor Alberto Fernández de la Universidad de Jaén. La calificación obtenida ha sido de sobresaliente cum laude.
José Antonio Sanz es profesor ayudante del Departamento de Automática y Computación de la UPNA y miembro del grupo de investigación “Inteligencia artificial y razonamiento aproximado”. Ha participado en siete proyectos de investigación de I+D; es coautor de cuatro artículos publicados en revistas científicas y de diversas contribuciones a congresos, de ámbito nacional e internacional.