Dades, codi i recursos

Dades, codi i recursos

Els principals resultats del treball no són tant unes conclusions analítiques tancades, sinó sobretot la metodologia desenvolupada i els recursos generats durant el projecte. D’una banda, s’ha dissenyat una metodologia sistemàtica per identificar, extreure i preparar les guies docents de la URV amb l’objectiu de poder-les analitzar mitjançant tècniques de mineria de text orientades als Objectius de Desenvolupament Sostenible (ODS). D’altra banda, el projecte posa a disposició de la comunitat un conjunt complet de recursos reutilitzables: el corpus de dades extret, els fitxers estructurats, el codi utilitzat per al web-scraping i el processament, i la documentació necessària per replicar o ampliar el procés.

Dades recopilades pel gratat web (web-scraping)

Les dades del gratat web es publicaran periòdicament, cada cop que es repeteixi el procés, al repositori Zenodo. També hi ha la intenció de repetir el gratat de manera sistemàtica a l'inici de cada curs acadèmic per mantenir la sèrie de seguiment actualitzada. Consulta:

El punt d'arxiu del corpus és el registre Zenodo Web-scraped corpus of URV teaching guides for SDG-oriented text mining, amb DOI de concepte https://doi.org/10.5281/zenodo.17652176. La versió publicada actual del primer paquet real d'scraping és la 2025.11.27: https://doi.org/10.5281/zenodo.17652441.

Per a l'explotació pública al web, aquestes dades no es consumeixen directament des de Zenodo, sinó a través d'una API JSON estàtica que prepara els fitxers i metadades que alimenten les visualitzacions. API pública: https://geourv.github.io/urv-sdgs-api/. Repositori de l'API: geourv/urv-sdgs-api.

Codi

El codi d'anàlisi del projecte (urv-sdgs-tracker) encara no és públic, però es preveu publicar-lo aviat. Mentrestant, per a més detalls metodològics o tècnics, la persona de contacte és Benito Zaragozí (benito.zaragozi@urv.cat).

La capa web de visualització (urv-sdgs-dashboard) també es manté en evolució contínua.

Entre el tracker i aquest dashboard hi ha una capa intermèdia de publicació, urv-sdgs-api, que serveix les dades i metadades ja preparades per al frontend: https://geourv.github.io/urv-sdgs-api/.