Gebruikers worden steeds afhankelijker van zoeken, maar de resultaten worden niet beter. Integendeel.
Dat komt gedeeltelijk omdat het aantal webpagina’s razendsnel stijgt. Maar ook omdat gebruikers veeleisender worden, en steeds ingewikkeldere vragen willen stellen. De huidige lichting zoekmachines bereikt langzaam maar zeker haar plafond.
Semantische zoekmachines kunnen deze problemen oplossen. HTML5 is een grote stap in de richting van het Semantic Web.
“O Deep Thought Computer, we want you to tell us the answer to life, the universe and everything.”
Deep Thought paused for a moment's reflection. “Tricky”, he said finally.
“But can you do it?”
“Yes, said Deep Thought, “I can do it.”
Vrij uit The Hitchhiker’s Guide to the Galaxy
Het Semantic Web in het kort
Web 2.0 gaat over mensen, het Semantic Web over machines. Het bestaande web heeft mensen nodig om de taken uit te voeren voor het zoeken en verzamelen van informatie. Computers kunnen dit niet doen omdat webpagina’s speciaal voor mensen ontworpen zijn.
Het Semantic Web verandert dit door webpagina’s zo te presenteren, dat machines het zoeken en verzamelen zelf kunnen doen.
Voor de duidelijkheid: Ik heb het niet over kunstmatige intelligentie. Computers worden niet aangepast om documenten te kunnen gebruiken, maar documenten worden aangepast om door computers begrepen te worden. Hoe? Door metadata toe te voegen die de betekenis van de inhoud van die documenten verklaart. In het geval van webpagina’s gebeurt dat handmatig, met RDF (Resource Description Framework). Tenminste, dat is de eenvoudigste methode.
Er zijn namelijk nog andere mogelijkheden:
Mogelijke obstakels
De technologie om teksten in documenten automatisch te parsen zal in de praktijk niet zo vaak gebruikt worden. Deze methodes zullen logischerwijs worden ingezet bij specialistische wetenschappelijke of corporate toepassingen, vanwege de hoge kosten aan computerkracht en opslag. Gedetailleerde semantische indexen vragen 100 keer de rekenkracht die voor normaal zoeken en indexeren gebruikelijk is. De opslag wordt met een factor 10 vergroot. Beide factoren hebben een flinke negatieve invloed op de performance.
Voor webzoeken is handmatig labelen veel geschikter. De vraag is: wie gaat dat doen?
Sociale Media
De natuurlijke evolutie van het web via Web 2.0 heeft daar al een handje in geholpen. Sociale Media staat al vol met betekenisvolle relaties.
René houdt van Kitty.
Vakantiefoto’s van Paul uit Chersonissos.
Enorme hoeveelheden gebruikersdata zijn al gedefinieerd en gecatalogiseerd. Bedrijven als Google, Facebook en LinkedIn hebben al wijzigingen doorgevoerd voor het opslaan en categoriseren van al deze data, betekenissen en relaties.
Vele Sociale Media sites hebben door middel van API’s deze data al gedeeltelijk publiek gemaakt. Informatie uit Facebook en Twitter is al direct op de zoekmachine resultatenpagina’s (SERP’s) terug te vinden.
RDFa (RDF in attributes) is de manier om documenten binnen XHTML te verrijken met metadata. Google belooft website eigenaars betere belichting in de SERP’s als ze RDFa gebruiken. Rich Text Snippets voor bepaalde data elementen zoals reviews en evenementen maken het de gebruiker gemakkelijker en zijn daardoor een toegevoegde waarde voor de website eigenaar. Google bepaalt wel zelf voor welke websites en resultaten er dan precies Rich Text Snippets worden toegevoegd.
HTML5 ondersteunt RDFa. Het helpt een groter onderscheid aan te brengen tussen code en betekenis. Zoekmachine Optimalisatie (SEO) zal daarom zeker veranderen op het moment dat zoekmachines RDFa meer gaan ondersteunen.
Wie heeft authoriteit?
In principe zijn we hiermee namelijk weer terug bij de start. Metadata in de HTML(5) code bepaalt weer voor een belangrijk deel hoe webpagina’s worden geïndexeerd. Natuurlijk zullen er mensen zijn die hiervan misbruik proberen te maken. De zoekmachines zullen dat gaan ondervangen door een systeem van authoriteit (trusted websites en agents) te gaan gebruiken.
De vraag wordt dan: hoe kan ik ervoor zorgen dat mijn website als gezaghebbend wordt gezien?
Patrick Bakker schrijft geoptimaliseerde webteksten voor Staaltaal en analyseert voor Siteproof. Siteproof controleert en test websites o.a. op zoekmachine optimalisatie .







{ 2 comments… read them below or add one }
Fijne informatie, thanks! Is het al getest / zijn er voorbeelden van verbeterde ranking na optimalisatie met RDFa?
Ik geloof niet dat de ranking hiermee verbetert. De Rich Text Snippets zijn natuurlijk wel heel interessant, ze vallen meer op dan de normale resultaten. En bieden toegevoegde waarde voor gebruikers. Google geeft misschien wel een kleine waarde mee voor de ranking, maar tests daarvan heb ik nog niet gezien.