Getwist en Gezeur

Getwist en Gezeur header image 2

Mavens en Connectors, Memes en het Metatale algoritme

October 28th, 2007 · No Comments

Toen Metatale lanceerde in april, was er heel wat te doen over het achterliggend algorithme. In persoonlijke babbels en in de commentaren op de vele blogposts formuleerde Bart van Metatale het algoritme telkens min of meer op deze manier:

stel dat ik op mijn blog slechts twee bezoekers heb. Die twee bezoekers respecteren mij, en nemen vaak over op hun blog wat ik schrijf. Als die twee bezoekers elk een blog hebben met duizenden bezoekers - wie heeft er dan meer invloed?
Waar we over nadachten: waaraan kan je zien dat het ene blog door het andere beïnvloed is?

Mijn eigen interpretatie/veronderstelling was iets als:

Metatale zoekt de “oorspronkelijke bron” van “memes“. Een meme in blogland kan een nieuwsfeit of een concept zijn. Door het analyseren van linkstructuur (dus het volgen van links die uiteindelijk verwijzen naar degene die het eerst met het nieuwtje uitpakte, of de historiek van (het voorkomen van) nieuw opgedoken woordparen of frases kan je achterhalen wie het “meme” uitvond of binnenbracht. Eerder de “Mavens” dan de “Connectors“.

Mavens telkens in een bepaald kennisdomein, want zoals Bart tot in den treure herhaalde:

Invloed is onlosmakelijk verbonden met thema en locatie. Een ‘algemene’ lijst van invloed zegt niets. De echte waarde van MetaTale zal erin liggen dat je invloedslijsten per thema/locatie kan genereren. En die zullen betalend zijn.

(Het volgen van links me overigens veel makkelijker te programmeren dan het traceren van woordparen, maar als ik Barts commentaren goed lees gaat het wel degelijk over meer dan alleen linkstructuur.)

Anyway, waarom ik dit allemaal oprakel: bij Nicholas Carr las ik over een research paper dat me aan de hele discussie deed denken:

The problem of detecting contaminants in a public water system is analogous to the problem of figuring out what’s going on in the blogosphere, write a team of Carnegie-Mellon researchers in an award-winning paper called Cost-effective Outbreak Detection in Networks:

Given a water distribution network, where should we place sensors to quickly detect contaminants? Or, which blogs should we read to avoid missing important stories? These seemingly different problems share common structure: Outbreak detection can be modeled as selecting nodes (sensor locations, blogs) in a network, in order to detect the spreading of a virus or information as quickly as possible.

De “memes” worden hier vergeleken met “contaminants”, besmetting of vervuiling van water. Het zoeken van de beste distributie van sensoren is net zoals het selecteren van de blogs die je volgt, een optimalisatieprobleem: welke leeslijst (= selectie van te volgen blogs) geeft je een minimale leeslast (= aantal blogposts - dat is dus niet hetzelfde als het aantal blogs) laat je toch toe van maximaal veel memes (nieuws/ontwikkelingen) op de hoogte te zijn.

Naargelang het gewicht dat je toekent aan één van beide criteria, zal de optimale oplossing verschuiven. Wil je vooral je leeslast beperken, dan kan je zwaar snoeien in je leeslijst, maar als je bv jezelf oplegt niet meer dan 10% van de in omloop zijnde memes gemist te hebben, zal je je leeslijst, hoe optimaal geselecteerd ook, drastisch moeten uitbreiden.

Nu, je kan de metafoor ook omdraaien: in plaats van het zoeken naar de beste plaatsen van sensoren, kan je zoeken naar de beste set plaatsen waar je best je meme/besmetting loslaat om een zo groot mogelijk aantal andere blogs te “beïnvloeden/besmetten“. Ook in de paper waar Nicholas Carr naar verwees, concludeerden ze:

spreading influence under the general Triggering Model is a special case of our outbreak detection formalism. The problems are fundamentally related since, when spreading influence, one tries to affect as many nodes as possible, while when detecting outbreak, one wants to minimize the effect of an outbreak in the network.

… en werd er verwezen naar een paper uit 2003 over “Maximizing the Spread of Influence through a Social Network”. Misschien was dit de inspiratie voor het Metatale algoritme?

Tags: , , , , , , ,

0 responses so far ↓

  • There are no comments yet...Kick things off by filling out the form below.

Leave a Comment