Home / Blog / De relaties tussen tags op pornosites kwantitatief onderzocht

De relaties tussen tags op pornosites kwantitatief onderzocht

LATER LEZEN

xHamster s Video CategoriesAls er in de mainstream media over porno wordt gesproken, wordt vaak gedaan alsof het gaat om homogene inhoud: steeds min of meer hetzelfde script, waarin acteurs die er min of meer hetzelfde uitzien op min of meer dezelfde manier seks hebben. Iedereen die wel eens porno kijkt weet dat dit misleidend is. Een kenmerk van het hedendaagse porno-aanbod is juist de enorme diversiteit. Dit komt mede door het internet, dat het mogelijk heeft gemaakt meer niches te bedienen.

Internetporno betekent ook dat miljarden gebruikers sporen achterlaten waardoor onderzoekers makkelijker naar structuren en patronen kunnen kijken. In een recente studie [abstract] in het gloednieuwe tijdschrift Porn Studies wordt dat ook gedaan. Franse statistici onderzochten de steekwoorden (tags) van duizenden video’s van de sites XNXX en XHamster – volgens de onderzoekers de twee belangrijkste pornosites en representatief voor het gehele aanbod online.

Methode
Porno op het web is er in verschillende vormen, bijvoorbeeld cartoons over porno of websites die interactie mogelijk maken zoals het grote LiveJasmin.com (een webcamsite). Videoplatforms zijn voor de deze onderzoekers de beste keus, omdat zij goed gestructureerde data aanbieden: iedere clip heeft een URL, steekwoorden en andere meta-data zoals het aantal views, datum van uploaden, comments, stemmen en beschrijving.

De onderzoekers richten zich op categorisatie van porno en dus niet op consumptie, productie of beelden. Ze zijn daarbij geïnteresseerd in de relaties tussen die tags, door te kijken naar overlap in  steekwoorden bij dezelfde filmpjes. Ze verkennen verschillende methoden om vat te krijgen op hun datasets, die overigens online beschikbaar zijn onder een creative commons-licensie.

Soorten tags
De tags worden door de uploaders toegewezen. Deze steekwoorden kunnen verwijzen naar praktijken (‘BDSM’, ‘blowjob’), karakteristieken van de acteurs (nationaliteiten, geografische regio, huidskleur, religie), locaties (bus, slaapkamer, in de natuur), hulpmiddelen (bed, dildo), filmtechnieken (verborgen camera, hd) etc. Die veelzijdigheid laat al de semantische diversiteit van porno zien.

Bij XHamster moeten uploaders kiezen uit een vooraf opgestelde lijst steekwoorden (top down). Bij XNXX mogen uploaders zelf een woord kiezen (bottom up). Desondanks is er grote overlap in de tags tussen de twee sites. Volgens de onderzoekers is dat een aanwijzing dat dit algemeen voor online porno geldt.

Resultaten
De onderzoekers keken eerst naar frequenties: hoe vaak bepaalde tags en woorden in titels voorkomen. Ze hielden daarbij rekening met typefouten en afkortingen. Die komen meer voor in titels dan in steekwoorden, omdat uploaders met het taggen hun best doen aan te sluiten bij anderen. Dit zijn de meest voorkomende tags:

Frequenties

Sommige tags komen vaak samen voor, zoals ‘amateur’ en ‘blowjob’. De onderzoekers zijn geïnteresseerd in hoe nabij zulke steekwoorden zijn. Ze kijken daarbij naar afwijkingen van wat je statistisch kunt verwachten. Op basis van frequentie verwacht je veel overlap tussen ‘midget’ en ‘blowjob’, maar niet tussen ‘midget’ en ‘funny’. Die laatste overlap zit wel in de dataset, wat betekent dat dit theoretisch relevant is. Zo vinden ze interessante inzichten over nationaliteiten:

Nationaliteiten

Vervolgens hebben ze een netwerkanalyse uitgevoerd. Hieruit komen duidelijke clusters naar voren, bijvoorbeeld op leeftijd (‘milfs’, ‘teens’, ‘matures’, ‘grannies’), praktijken (‘latex’, ‘spanking’, ‘facesitting’), context (‘beach’, ‘voyeur’, ‘flashing’, ‘public’) of nationaliteit (‘Thai’, ‘Chinese’, ‘Korean’, ‘Asian’). Er zijn ook meer heterogene clusters, zoals ‘blowjobs’, ‘black’, ‘ebony’ en ‘threesome’. In deze figuur valt ook op hoe geïsoleerd het cluster homo, bi en trans is. Dit laat zien hoezeer heteroseksualiteit de niet-benoemde norm is op deze sites.

Netwerkanalyse

Tot slot analyseerden de onderzoekers niches door te kijken naar steekwoorden die alleen samengingen met een klein aantal andere tags. De hoogst scorende niches zijn ‘hentai’ [erotische manga] en ‘cartoons’. Die niches zijn niet per se zeldzaam. Zo is ‘men’ een niche maar is dit ook het op een na meest frequente kanaal. Niches gaan simpelweg om specialisatie.

Conclusie
Dit onderzoek maakt het mogelijk om nader vast te stellen hoe praktijken, nationaliteiten, locaties en technieken hun plek vinden in het porno-landschap. De onderzoekers hadden graag de ‘paden’ geanalyseerd die gebruikers volgen om tot niches te komen, maar dat viel helaas buiten de mogelijkheden van deze studie. Pornowebsites zitten volgens de onderzoekers op een goudmijn van data. Sommige sites maken daar in hun marketing gebruik van. Zo rapporteert PornHub sinds 2013 regelmatig inzichten. Deze studie, met de beschikbaar gestelde datasets, is een eerste stap op weg naar vele analyses. Die zullen meer inzichten opleveren in het ongelooflijk gevarieerde pornoaanbod.

TAGS
DEEL DIT BERICHT