Message 00132 [Homepage] [Navigation]
Thread: oxderawT00132 Message: 1/1 L0 [In date index] [In thread index]
[First in Thread] [Last in Thread] [Date Next] [Date Prev]
[Next in Thread] [Prev in Thread] [Next Thread] [Prev Thread]

[ox-de-raw] keimform.de: »Wie finden wir uns?«



http://www.keimform.de/2007/01/18/wie-finden-wir-uns/

»Wie finden wir uns?«

Von StefanMz, 18. Januar 2007, 10:05 Uhr

Mehr zufällig als geplant hatte ich die Gelegenheit am ersten 
ExpertFinder-Workshop 
[http://lsdis.cs.uga.edu/~aleman/efw2007/program/] in Berlin 
teilzunehmen. Dabei ging es um interessante Fragen, die uns auch hier 
umtreiben: »Wie finde ich, wen oder was ich suche? Und wie werde ich 
gefunden?« Hier nun also ein kurzer Bericht vom Workshop.

Die Lösung für solche Fragen ist das semantische Web 
[http://de.wikipedia.org/wiki/Semantisches_Web], dachte man. Das 
internationale Standardisierungsgremium W3C 
[http://de.wikipedia.org/wiki/W3c] versucht sich schon eine Weile an 
der Definition einer Infrastruktur [http://www.w3.org/2001/sw/], aber 
irgendwie kommt das semantische Internet nicht aus dem Knick. Warum? 
Das liegt in der Natur der Semantik, würde ich sagen.

Kleiner erkenntnistheoretischer Ausflug

Semantik bedeutet Bedeutung. Es geht um die Bedeutungen der Welt, die 
die Menschheit hergestellt oder als Vorgefundenes in ihre Lebenspraxis 
bedeutungsvoll integriert hat. Diese Welt-Bedeutungen lassen sich nicht 
formal definieren, weil sie – sobald man sie von unser Lebenspraxis 
trennt – tot sind. Alle, die sich nun mit Semantik theoretisch oder 
praktisch vergnügen, machen nun genau das: Sie fixieren Bedeutungen in 
einer abgeschlossenen »Blockwelt« 
[http://en.wikipedia.org/wiki/Blocks_world] mit definierten Syntax 
[http://de.wikipedia.org/wiki/Syntax] -Semantik 
[http://de.wikipedia.org/wiki/Semantik] -Beziehungen. In solchen 
Miniwelten kann man nun formal (syntaktisch) mit bedeutungsvollen 
(semantischen) Einheiten umgehen, etwa maschinell lesen und 
verarbeiten. Nehmen wir als Beispiel eine »Miniwelt mit Hausnummern«, 
wer HTML ein wenig kennt, kann das gut lesen:

     ...
     <hausnummer>42</hausnummer>
     ...

Das Problem bei solchen Miniwelten ist, dass die Semantik eigentlich nur 
außerhalb der Miniwelt _verstehbar_ ist, nämlich in unserer 
Lebenspraxis. Es gibt also eine quasi undefinierte (weil 
undefinierbare) Referenz nach "außen". Wenn in der Miniwelt zum 
Beispiel steht: "42", dann funktioniert das nur, weil wir wissen, was 
Häuser sind, was Nummern sind und dass es (hierzulande) üblich ist, 
Häusern Nummern zu verpassen, um sie besser finden zu können etc. 
Innerhalb der Miniwelt sind beides – "hausnummer" und "42" – nur 
Zeichen. Solange wir wissen, wir wir solche Miniwelten zu benutzen 
haben, ist das alles kein Problem. Wir tun dies ohne dauernd. Schwierig 
wird es, wenn mehrere Miniwelten aufeinander treffen: Sehr häufig 
passen die Semantiken nicht zueinander, weil sich die impliziten 
Verweise in unsere Lebenspraxis nicht decken.

Damit sind wir beim Grundproblem: Im semantischen Web lassen sich 
beliebig viele »informatische Ontologien« 
[http://de.wikipedia.org/wiki/Ontologie_%28Informatik%29] definieren, 
die jeweils ein eigenes Vokabular 
[http://de.wikipedia.org/wiki/Kontrolliertes_Vokabular] verwenden und 
in einer bestimmten Domäne [http://de.wikipedia.org/wiki/Dom%C3%A4ne] 
funktionieren, aber untereinander oft nicht kompatibel sind. Nehmen wir 
an, in einer bestimmten Lebenspraxis werden Wohnorte nicht über 
Hausnummern, sondern über Landschaftsmarken (früher üblich) gefunden. 
Dann taugt die Miniwelt mit der formal definierten Hausnummer nicht 
mehr. Hinzu kommt ein zweites Grundproblem, das ich aber nicht so hoch 
hängen will: Die Selbstreferenzialität. Welche Ontologie enthält denn 
die definierten Ontologien, also sich selbst?

Ganz allgemein gesagt haben wir es mit einem _Semantik-Paradoxon_ zu 
tun: Das platte World Wide Web ist ein großer Haufen Zeichenmüll, der 
nur mit Brute-Force [http://de.wikipedia.org/wiki/Brute_force] (aka 
Google) handhabbar ist. Viel cleverer wäre es, wenn das WWW kapiert, 
was ich will. Es müsste also "semantisch" funktionieren. Das WWW als 
Abbildung (eines Ausschnitts) der Lebenspraxis ist nun aufgrund des 
oben beschriebenen Problems grundsätzlich nicht vollständig semantisch 
definierbar. Es gibt keine Welt-Ontologie. Oder anders gesagt: Es gibt 
nur eine Welt-Ontologie, und das ist unsere Lebenspraxis.

Nun ja, das ist nicht so schlimm und für manchen vielleicht auch 
trötzlich. Es wäre ja trotzdem schon viel gewonnen, wenn wir in einigen 
Bereichen ein paar Miniwelten zur Verfügung hätten, auf den wir 
operieren könnten. Wir müssten uns nur entspannen und von der 
Vorstellung Abschied nehmen, man könnte die Welt »repräsentieren«. Es 
wäre ja schon ganz schick, wenn Miniwelten unser _Werkzeug_ sein würden 
und wir also die Syntax-Semantik-Beziehungen genauso ansehen: Was wäre 
wirklich nützlich für uns? Statt: Wie bilden wir die Welt ab? 
Pragmatisch geht die Reise ohnehin genau in diese Richtung. Nun also 
zum Workshop.

Chaos der Ontologien

Auf dem ExpertFinder-Workshop spielten drei 
Ontologie-Beschreibungssysteme (aka: Miniwelten) eine Rolle:

- FOAF [http://de.wikipedia.org/wiki/FOAF] (»Friend Of A Friend«,
  gesprochen in einem Wort analog "loaf") ist ein Format zur
  Beschreibung von Personen. Wichtigstes Feld ist "knows", was auf
  andere Personen verweist. So lassen sich Bekanntschaftsnetzwerke
  nutzbar (surfbar, grafisch darstellbar etc.). Vergleichbar ist FOAF
  mit vCard [http://de.wikipedia.org/wiki/Vcard], was wohl (fast) alle
  E-Mailprogramme nutzen.

- SIOC [http://en.wikipedia.org/wiki/SIOC] (»Semantically Interlinked
  Online Communities«, gesprochen wie "Schock") ist ein Format zur
  Erfassung von Online-Diskussionen in Blogs, Foren oder Mailinglisten.
  SIOC lässt sich gut mit FOAF verbinden.

- SKOS [http://de.wikipedia.org/wiki/SKOS] (»Simple Knowledge
  Organisation System«, gesprochen wie geschrieben: "Skoss") ist eine
  W3C-Spezifikation [http://www.w3.org/2004/02/skos/] zur Darstellung
  hierarchischer Informationsstrukturen, Thesauri, Taxonomien etc.

Mit hinzunehmen würde ich auch noch:

- DOAP [http://en.wikipedia.org/wiki/DOAP] (»Description Of A Project«,
  gesprochen wie "dope") ist ein Format zur Beschreibung von Freien
  Softwareprojekten. Genutzt wird DOAP von Software-Registern wie
  CodeZoo [http://www.codezoo.com/], SWIK [http://swik.net/], 
  CheeseShop [http://cheeseshop.python.org/pypi] etc.

Das Problem aller dieser Formate ist ihre zu geringe Verbreitung. 
Ein "Henne-und-Ei-Problem": Es nutzen noch nicht viele, so dass die 
eigene Beteiligung Nutzen verspricht; ein höherer Nutzen erfordert die 
Beteiligung von mehr Nutzern. Kurz: Die kritische Masse 
[http://de.wikipedia.org/wiki/Netzwerkeffekt] ist nicht da. Ähnlich bei 
den Anwendungen: Es gibt viel wenig, weil sie zu wenig nachgefragt 
werden und vice versa.

Gleichzeitig existieren zum Beispiel neben FOAF mit der vCard Formate, 
die durchaus intensiv benutzt werden. Allerdings sind diese ähnlichen 
Formate nicht ohne weiteres ineinander überführbar. So wurde auf dem 
Workshop diskutiert, welchen Weg man gehen kann. Interessant war für 
mich zu beobachten: Ein Ami schlug einen pragmatischen Weg vor (»Nimm 
dir einen Graduate Student und lass dir ein Programm schreiben«), 
während der Österreicher eine saubere Abbildung (»Ich will eine 
allgemeine Lösung auf der Basis eines deklarativen Mappings«) vorzog. 
Irgendwie passt es doch immer wieder...

Was heisst das für uns?

Es gibt am 18.2.2007 ein Treffen 
[http://www.keimform.de/2007/01/05/bildung-eines-serviceknotens-fuer-ein-kommunikationsnetz-von-solidargemeinschaften/], 
um über die Frage der besseren Vernetzung von Projekten 
der »Solidarischen Ökonomie« (was immer das ist...) zu sprechen. Ich 
fürchte, da kommt nur wieder der übliche Kanon raus: Noch ein Wiki, 
Blog, Newsletter etc. Bringt es das? Bringt es was, sich am Kampf um 
Aufmerksamkeit zu beteiligen, anstatt zu gucken, wie wir untereinander 
zeitsparende Netzwerke knüpfen können? Ich halte es für 
vielversprechender, die schmale Kraft in die eigene P2P-Vernetzung 
[http://de.wikipedia.org/wiki/P2P] zu stecken, als ungelesene Infos in 
die Welt zu blasen. Oder wenn denn Info-Fluten sein muss (es gibt ja 
gute Gründe), dann wenigstens in einer Weise, dass die Informationen 
wiederverwendbar sind. Dazu müssen sie maschinenlesbar sein. Die 
vorgestellten Miniwelt-Formate bieten sich an. Allerdings setzt das die 
Bereitschaft voraus, sich mit neuen Techniken zu befassen – erstmal nur 
eine Herausforderung für das Denken.

-- 
Start here: www.meretz.de



[English translation]
Thread: oxderawT00132 Message: 1/1 L0 [In date index] [In thread index]
Message 00132 [Homepage] [Navigation]