Què fa que una imatge sigui bonica? Un nou conjunt de dades permet estudiar l’estètica visual amb menys interferència interpretativa
- Investigadors del CVC i la UAB presenten Minimum Semantic Content (MSC), un recurs obert per analitzar com les propietats visuals de baix nivell influeixen en la percepció de la bellesa.
- Publicat a Scientific Data, el treball presenta una base de dades més controlada per analitzar la relació entre característiques visuals i preferències estètiques amb menys interferències interpretatives.
Per què algunes imatges ens semblen belles i d’altres no? La recerca en estètica empírica fa anys que intenta respondre a aquesta pregunta analitzant grans bases de dades d’imatges i comparant-ne les propietats visuals amb les valoracions dels observadors. Tanmateix, la majoria dels conjunts de dades utilitzats fins ara combinen dos nivells d’informació difícils de separar: les característiques visuals de baix nivell i el contingut semàntic d’alt nivell.
Les característiques de baix nivell inclouen propietats purament perceptives com el contrast, la luminància, la saturació, la textura, la simetria o l’estructura espacial. En canvi, el contingut semàntic fa referència a la interpretació de l’escena, com ara la presència de persones, objectes, accions o significats culturals. Aquesta combinació dona lloc al conegut “semantic gap”, la discrepància entre la informació visual que conté una imatge i el significat que li atribueixen els observadors humans. Aquest fenomen pot introduir biaixos en la predicció de la preferència estètica, ja que les valoracions sovint depenen més del significat que de les propietats visuals en si mateixes.
El nou conjunt de dades Minimum Semantic Content (MSC) s’ha desenvolupat precisament per reduir aquest problema i permetre un estudi més acotat de l’estètica visual. Ha estat creat per investigadors del Centre de Visió per Computador (CVC), la Universitat Autònoma de Barcelona (UAB) i la University of Saint Andrews, i inclou 10.426 imatges d’escenes naturals amb contingut semàntic reduït i homogeni. Cada imatge ha rebut 100 valoracions estètiques individuals d’observadors no experts, provinents d’un conjunt aproximat de 10.000 participants reclutats mitjançant proveïment participatiu. El treball s’ha publicat en obert com a Data Descriptor a la revista Scientific Data.
L’objectiu del conjunt és permetre separar amb més precisió la contribució de les característiques visuals de baix nivell —més directament mesurables— de la influència del significat d’alt nivell, que tendeix a introduir variabilitat subjectiva i cultural. Per aconseguir-ho, s’han exclòs deliberadament imatges amb persones, animals, objectes fabricats, text o símbols amb càrrega semàntica, i s’ha treballat amb escenes naturals com vegetació, roques, cels o superfícies d’aigua. Segons l’equip investigador, aquest disseny permet aproximar millor l’anàlisi de la bellesa visual a les propietats perceptives, reduint la interferència de factors interpretatius: “La majoria de les bases de dades utilitzades en estètica computacional no són neutrals: contenen pistes semàntiques i significats culturals que poden influir fortament en la manera com les persones jutgen la bellesa. Amb MSC hem volgut crear un recurs que permeti aïllar millor la part perceptiva de l’experiència estètica”, explica el Dr. Alejandro Párraga, investigador del CVC i la UAB i autor de l’article.

Figura 1. Exemples d’imatges extretes del conjunt de dades Minimum Semantic Content (MSC)
El conjunt també incorpora versions “beautified” (estèticament millorades) i “uglified” (èstèticament degradades) d’una part de les imatges, generades amb una eina pròpia anomenada Uglifier, que modifica propietats visuals de manera controlada sense introduir nou contingut semàntic. Aquesta estratègia permet ampliar de forma sistemàtica el rang de preferències estètiques i millorar la cobertura de tot l’espectre de valoracions. “Això no elimina del tot la semàntica, però sí que la redueix i l’homogeneïtza prou per formular preguntes més precises sobre la relació entre les estadístiques de la imatge i la preferència estètica”, afegeix el Dr. Párraga.
Els resultats de validació mostren que aquesta redistribució té un impacte important en els models d’anàlisi comenta el Dr. Penacchio, també investigador del CVC i la UAB i autor de l’article: en comparar MSC amb bases de dades tradicionals, es modifiquen els resultats en el 84% de les mètriques d’imatge analitzades, i en aproximadament un 20% dels casos la relació observada entre característiques visuals i preferència estètica s’inverteix. Aquest fet suggereix que part del coneixement previ en estètica computacional podria estar condicionat per biaixos en la selecció i distribució de les dades.

Figura 2. Exemple de l’abans i el després d’utilitzar l’eina “uglified”
En conjunt, MSC proporciona una nova base per estudiar la percepció estètica amb un control més estricte del contingut semàntic. En reduir i homogeneïtzar els elements interpretatius de les imatges, el recurs permet analitzar amb més precisió el paper de les propietats visuals en la formació de les preferències estètiques. Això el converteix en una eina útil per aprofundir en l’estudi dels mecanismes perceptius que intervenen en la percepció de la bellesa visual.
La base de dades s’ha publicat en accés obert a través de l’Open Science Framework i inclou les imatges, les anotacions de valoració estètica i el programari de validació. Les imatges són de domini públic o estan sota llicències que permeten la seva reutilització i distribució, facilitant així la seva adopció per part de la comunitat científica.
Article de referència: Penacchio, O., Javed, A., Raducanu, B. et al. The Minimum Semantic Content (MSC) Dataset: A Large, Balanced Resource for Computational Aesthetics Research. Sci Data 13, 470 (2026). https://doi.org/10.1038/s41597-026-06816-0








