EG-Blog: Wikipedia zal artikelen toegankelijk maken voor software

Wikipedia is een wereldwijde databank aan kennis die opgebouwd werd en nog steeds verder uitgebreid wordt door vrijwilligers in hun vrije tijd. Maar de Wikipedia Foundation, een non-profit organisatie dat onder andere Wikipedia beheert, is nu aan het bedenken hoe Wikipedia kan mee evolueren van Web 2.0 tot Web 3.0. In het concept van Web 3.0, ook wel het semantisch web genoemd, is het zo dat internettoepassingen meer op elkaar zijn afgestemd, kunnen samengaan of geïntegreerd kunnen worden. Dit wordt beschouwd als de derde fase in de ontwikkeling van het internet en dus is het de opvolger van Web 2.0. Web 2.0 verwijst naar de duidelijk waarneembare trend op het internet dat iedereen informatie kan toevoegen naar eigen wens. Directe voorbeelden hiervan zijn de sociale netwerksites, Youtube en dergelijke. De eerste fase van het internet, Web 1.0, verwijst naar de opstart van het internet. In deze fase kende men een economische euforie, met name door het grote aantal nieuwe zogenaamde dotcombedrijven.

Maar nu terug naar Wikipedia, het zou de bedoeling worden dat niet alleen meer de gebruiker "verstaat" wat er allemaal op Wikipedia staat maar dat ook de software dit kan. Bijvoorbeeld zouden dit ervoor zorgen dat software begrijpt dat één van de kolommen in de tabel van Lijst van presidenten van de Verenigde Staten datums zijn. Dit zou dat toestaan om applicaties te gaan ontwikkelen die automatisch een tijdlijn zouden kunnen opstellen of vragen over algemene kennis zou kunnen beantwoorden.

Op de conferentie 2010 Semantic Technology in San Francisco vorige maand, demonstreerde de directeur van de Wikipedia Foundation, Erik Möller, de eerste stappen die de foundation ondernomen heeft om de mogelijkheden te ontdekken van het bijvoegen van meer semantiek structuur aan Wikipedia. Daar hebben ze ook een oproep gedaan aan de 'Semantic Web Community' voor hulp bij het toegankelijk maken van de data van Wikipedia voor software en computers. Het grote voordeel bij deze vernieuwing is dat software dan kan gebruik maken van de data aanwezig in de meer dan 15 miljoen Wikipedia artikels.

Het is namelijk zo dat semantiek informatie eigenlijk al reeds bestaat in Wikipedia en er zijn al reeds mensen die dit gebruiken in hun applicaties. Maar het is zo dat tot nu toe de beheerders van Wikipedia hier niet echt een helpende hand bij waren. Maar hier komt nu verandering is.

De eerste doelstelling van Erik Möller is om de infoboxes in Wikipedia (dit zijn de kaders die altijd rechts bovenaan een artikel staan, die een samenvatting van de belangrijkste informatie van het artikel bevatten) toegankelijk te maken voor software. De tweede doelstelling is de service WikiPics. Deze service wanneer je een afbeelding zoekt om niet meer naar termen te zoeken maar naar concepten te zoeken. Bijvoorbeeld indien men 'horse' in typt dan wordt de databank doorzocht naar afbeeldingen die vallen onder de term 'horse' maar ook 'cheval' en 'Pferd'. Dit levert veel meer relevante afbeeldingen op.

Erik Möller verteld wel dat er 2 mogelijke struikelblokken zijn voor dit project, namelijk als eerste is dat het nog onduidelijk is of dat er momenteel wel software bestaat die deze taak aan kan. En de tweede struikelblok is of dat dit wel gewenst is door de 'Wikipedia Community'. Want dit blijft natuurlijk de drijvende kracht achter de verdere ontwikkeling van Wikipedia.

via [technologyreview]

Pagina's

zaterdag 10 juli 2010

Wikipedia zal artikelen toegankelijk maken voor software

Geen opmerkingen:

Een reactie posten