Mikel Galar Idoate Nafarroako Unibertsitate Publikoko (NUP) Estatistika, Informatika eta Matematika Saileko irakasle eta ISCko kideak “Large-Scale Data Analytics with Python and Spark” liburua idatzi du Isaac Triguero Velázquez Granadako Unibertsitateko eta Nottinghameko Unibertsitateko irakaslearekin batera. Lana Cambridge University Pressek argitaratu du, munduko argitaletxe ospetsuenetako batek.
Egileek azaldu duten bezala, lan horretan nabarmentzekoa zera da: ikaskuntza automatikoari buruzko ikuspegi argia izateaz gain, datu kopuru handien aurrean ikaskuntza-algoritmoak nola aplikatu irakasten duela. “Beste liburu batzuetan ez bezala, oinarrizko printzipioetan zentratzen da, eta ez ditu irakurleak josten garapen horien euskarri diren teknologiei buruzko gehiegizko xehetasun teknikoz”, adierazi dute.
Testuliburu praktiko hori egileen irakaskuntza-esperientzia zabalean oinarriturik dago, eta eskala handiko datu-analisiak nola egin eta big datarako ikaskuntza-automatikoko soluzioak nola diseinatu irakasten du. Oinarrien ikuspegi batez baliatuz, testuliburu honek –ongi probatu dute ikasgelan argitaratu aurretik– ikasleak gidatzen ditu eskala handiko datuekin lan egiteko funtsezko printzipio eta paradigmetan eta eskala handiko datuak aztertzeko esparruetan barna (Hadoop, Spark), eta big data ustiatzeko ikaskuntza automatikoa nola inplementatu ere azaltzen du.
“Ez dago beste lanik datuen zientzian lan egin behar duten pertsonek ezagutu behar dituzten printzipioak azaltzen dituenik irakurleak larritzeko bezainbesteko xehetasunik gabe. Ikaslearen konpromisoa maximizatzearren, azalpen oso argiak konbinatzen ditu mundu errealeko adibideekin, kodifikazioko ariketa praktikoekin eta laborategiko ariketekin”, adierazi dute egileek. Diotenez, “baliabide didaktiko ezin hobea da datuak ikaskuntza automatikoaren bidez eskala handian aztertzeari buruzko ikastaroak egiteko informatikaren eta datuen zientzien sailetan”.
Liburua Jupyter Notebook koadernoetan idatzia dago erabat, Python programazio lengoaian. Koaderno horiek programazio-kodea testuarekin eta azalpenekin konbinatzen dute, eta, hala, edukiaren ulermena errazten. “Horren ondorioz, liburu osoa da exekutatzeko modukoa, ikasleek bertan idatzitako guztia probatzeko modua izan dezaten. Hori dela eta, guztientzat eskuragarri daude kode osoa ez ezik laborategiko ariketa batzuk ere, zenbait zailtasun mailatakoak eta errazenetik zailenera ordenaturik, eta baita irakasleentzako eduki gehigarri batzuk ere (diapositibak eta ariketa orokorren eta laborategiko ariketen soluzioak)”, erantsi dute.
Egileen curriculum laburra
Mikel Galar (Iruñea, 1986) ingeniari informatikoa eta NUPeko doktorea da. Gaur egun, Konputazioaren Zientzien eta Adimen Artifizialaren arloko irakasle titularra da NUPeko Estatistika, Informatika eta Matematika Sailean. Halaber, Smart Cities Institutuko (ISC) ikertzailea eta Konputazio Zientzien eta Adimen Artifizialaren Tracasa Katedraren zuzendaria ere bada.
Bere ikerketa-lanak machine learninga eta big data ditu ardatz, eta arlo horretako 100 argitalpen baino gehiago ditu idatziak, osotara 9.000 aipamen izan dituztenak besteren testuetan. Argitalpenetako 3 konputazio-zientzien arloan aipamen gehien dituzten argitalpenen % 1ean daude. Neuraptic AI-ren sortzaileetako bat da, eta ikertzaile nagusia da edo izan da zenbait proiektutan; osotara 2 milioi eurotik gorako finantzaketa publikoa zein pribatua jaso du haietarako. 2011z geroztik, irakasle dabil konputazio zientziekin, adimen artifizialarekin, machine learningarekin eta big datarekin lotutako irakasgai batzuetan. 2020an, irakasleen bikaintasun saria jaso zuen NUPen. 3 doktoretza-tesiren zuzendari izana da, eta orain beste 5en zuzendari dabil.
Isaac Triguero (Granada, 1986) ikertzaile senior nabarmena da Granadako Unibertsitateko Konputazioaren Zientzien eta Adimen Artifizialaren Sailean, eta Datuen Zientziaren arloko irakasle titularra Nottinghameko Unibertsitateko Konputazio Zientzien Eskolan.
Bere ikerketa-lanaren ardatza big data da, eta arlo horretako 90 argitalpen baino gehiago ditu eginak, zeinek 4.400 aipamen baitituzte; bere 5 artikulu konputazio zientzien arloan aipamen gehien dituzten argitalpenen % 1ean daude kokatuak. Big dataren arloko proiektuetako ikertzailea da edo izan da zenbait enpresatan, hala nola E.ON eta Unilever enpresetan. 2019an, irakasleen bikaintasun saria jaso zuen Granadako Unibertsitateko Konputazio Zientzien Eskolan. Era berean, testuliburu bat argitaratu du Python bidezko programazio kontzeptualari buruz. Doktoretzako bost ikasleren zuzendari izan da, eta orain martxan diren beste 6 lan ari da gidatzen.