Gizakiok etengabe ari gara sailkapen prozesuak egiten: sailkapen errazenetatik (fruta bat zein motatakoa den zehaztea), bestelako gai konplexuagoetara (TAC batek duen informazio batean oinarrituz, pertsona batek minbizia duen edo ez zehazteraino). José Antonio Sanz Delgado NUPeko Informatika ingeniariak mota horretako sailkapen problemak modu automatikoan ebazteko hainbat algoritmo garatu ditu bere doktoretza tesian. “Gainera, —azaldu du— ordenagailuen bidez sailkatzeko proposatzen ditugun sistemek ahalmena dute hartzen duten erabakia arrazoitzeko”.
Sistemek erabaki bat hartzeko erabiltzen dituzten arauak gizakiok erabili ohi ditugun hitzez osatuta daudelako gertatzen da hori. Hona hemen arau horien adibide bat: “diru-sarrera handia badu, eta bere lanpostua finkoa bada, orduan mailegua eman”. Baina, nola daki ordenagailu batek dirusarrera jakin bat handia dela? Horretarako logika lausoa erabiltzen da; izan ere, informazio ez osatua edo zehazgabea modelatzeko tresna hoberenetako bat baita. “Logika lausoan —azaldu du Sanz Delgado irakasleak— hitz bakoitza pertenentzia funtzio bati lotuta dago, eta horrek adierazten digu datu bat zein mailatan dagokion hitz jakin horri. Adibidez, pertsona batek 2.000 euroko diru-sarrera badu hileko, esan dezakegu diru-sarrera nahiko handia duela eta, hartaz, 0,6ko pertenentzia mailarekin lotuko dugu".
Bere ikerketa lanaren berrikuntza nagusia da estreinakoz erabili direla tarte/balioespen multzo lausoak. “Diru-sarrera handien kontzeptuaren adibidearekin jarraituz, pertenentzia mailari tarte bat lotuko diogu; hau da, 0,6a esleitu beharrean, 0,55etik 0,7rako tartea esleituko diogu. Mota honetako multzoen bidez, modu naturalean aurre egiten diogu honako arazo honi: hitz berak ez du esanahi bera pertsona guztientzat eta testuinguru guztietan. Esaterako, “pertsona altua izatea” kontzeptuak ez du esanahi bera niretzat edo Pau Gasolentzat. Horregatik, zalantzan jartzen dugu pertenentzia funtzioen definizioa, eta ezjakintasun maila deitzen dugun zenbaki bat esleitzen diogu”. Honekin batera, tesian bilakaera-algoritmoak erabiltzen dira sailkatzeko sisteman ezjakintasun maila kontuan hartzeak daukan aldeko eragina ahalik eta handiena izan dadin.
Tesi honen muina lau artikulutan osatua dago. Journal Citation Report-en aldizkari indexatuetan argitaratu dira, eta horietan azaltzen da metodologia berria, lanaren azterketa esperimental xehakatuarekin batera. “Estatistikoki frogatu dugu gure proposamenek bidea ematen digutela gaur egun dagoen sailkatzaile hoberenaren emaitzak hobetzeko”, nabarmendu du Sanz Delgadok.
Bere doktoretza tesiak “Hizkuntza arauetan oinarritutako sailkatze sistemak, tarte/balioespen multzo lausoak erabiliz eta ezjakintzasun maila doituz” izenburua du eta NUPeko Automatika eta Konputazioa Saileko Humberto Bustince eta Granadako Unibertsitateko Francisco Herrera katedradunek, eta Jaengo Unibertsitateko Alberto Fernández irakasleak zuzendu dute. Tesiak bikain cum laude kalifikazioa erdietsi du.
José Antonio Sanz NUPeko Automatika eta Konputazio Saileko irakasle laguntzailea da eta “Adimen artifiziala eta arrazonamendu hurbila” ikerketa taldeko kidea. I+Geko zazpi ikerketa proiektutan parte hartu du, eta beste batzuekin batera, aldizkari zientifikoetan argitaratutako lau artikulu eta biltzarretako hainbat ekarpen egin ditu, bai nazio mailan bai nazioartean.