Porno, filmtitels en open data
Wat is er te halen uit een catalogus van 800.000 pornofilmtitels? Binnen het project Sexualitics houdt een team van vijf onderzoekers zich daarmee bezig. Met één van de tools die ze ontwikkelden, Porngram, wordt de ontwikkeling van woordgebruik in filmtitels gevisualiseerd. De dataset is hier te vinden. Uit de onderzoekspaper:
The development of the web has increased the diversity of pornographic content, and at the same time the rise of online platforms has initiated a new trend of quantitative research that makes possible the analysis of data on an unprecedented scale. This paper explores the application of a quantitative approach to publicly available data collected from pornographic websites. Several analyses are applied to these digital traces with a focus on keywords describing videos and their underlying categorization systems. The analysis of a large network of tags shows that the accumulation of categories does not separate scripts from each other, but instead draws a multitude of significant paths between fuzzy categories. The datasets and tools we describe have been made publicly available for further study.
Keywords: online pornography; computational social sciences; sexual categories; network analysis
Over onderstaande zoekopdracht: zo’n 15 jaar geleden verzorgden we vanuit een eigen bedrijf het entertainmentgedeelte van sites als Wanadoo en Sonera Plaza. Op een gegeven moment ontstond daarbij in alle meligheid over berichten als biologische-groentetuin-in-garage-van-Noel-Gallagher, de fictieve film Transexual Horse Lover. Ik had nooit gedacht dat die titel nog eens van pas zou komen. 🙂
bron: Nerdcore
Afbeelding: visualpanic via Compfight cc
Slechts zijdelings gerelateerd, maar ik moest aan dit berichtje denken, over het bezoek aan Pornhub tijdens de Superbowl: PornHub Tracked Porn Views During the Super Bowl