Collaborative Tagging und Folksonomies – eine Bilanz

Unter Collaborative Tagging, Gemeinschaftlichem Indexieren ( = Social Tagging) wird eine bestimmte Vorgehensweise verstanden, bei der eine Gemeinschaft von Usern eines selben Systems dessen Objekte mit Metadaten, also Kategorisierungen und Schlüsselwörtern, charakterisiert. Allgemein sind diese Objekte Filme, Musikdateien, Bilder, Bookmarks, Weblogs, Wiki-Seiten oder Textdokumente. Meist wird von sogenannten Tags gesprochen – dieser Begriff stammt aus dem Bereich der Auszeichnungssprachen wie XML, (X)HTML, SGML und diese besitzen die Eigenschaft, die Semantik in diversen Elementen festzulegen (Back, Gronau, Tochtermann, 2009, S. 39).

In Systemen, die eine gemeinschaftliche Indexierung zulassen, gibt es meist keine Regelungen, wie Wörter als Tags verwendet werden dürfen. Es hat sich etabliert, dass jeder Benutzer bestimmte triviale Relationen wie meineFotos oder Urlaub2012 in seiner Begrifflichkeit frei verwendet, woraus resultiert, dass viele Anwender dieselbe Marke benutzen. Die Begrifflichkeiten Tag und Marke können synonym verwendet werden.

Eine Wortwolke oder auch Tag Cloud ist eine Form der Visualisierung einer Folksonomy, was später noch erläutert wird. Einzelne, unterschiedlich gewichtete Marken werden je nachdem entweder größer oder kleiner hervorgehoben, aber im Prinzip ist die Schriftgröße durch die Häufigkeit des Auftretens der einzelnen Begriffe bestimmt (vgl. Ebd., S. 39-41).

„Für eine Wortwolke der Kategorien eines Weblogs würde die Benutzungshäufigkeit beispielsweise der Anzahl von Weblog-Einträgen entsprechen, die einer Marke zugeordnet sind. Eine hierarchische Indizierung lässt sich dadurch erreichen, dass Marken selbst wieder gruppiert und mit Charakterisierungen versehen werden. Hier wird von einem Markenverbund (Tag Bundle) gesprochen“ (Ebd., S. 41).

Objekte mit ähnlichen Indizierungen können also zu Gruppen verbunden werden, diese Gruppen werden wieder in Untergruppen eingeteilt und so weiter. Eine automatische Benennung dieser Gruppen erfordert wieder Menschenverstand, da die Computer noch nicht so weit sind, eigenständig komplexe semantische Zusammenhänge zu verstehen. Auch bei einer automatischen Textanalyse ist kein Auskommen ohne zusätzliche Ontologien, also kontrolliertem Vokabular, um Ambiguitäten von Begriffen zu erkennen. Die Erkennung von Synonymen ist ohne eine menschliche Kontrolle ebenfalls nicht möglich.

Für Audio- oder Bilddateien gibt es allerdings eine Möglichkeit der Indizierung, nämlich anhand ihrer Eigenschaft (.jpg, .png, .wav…), wobei Dateien mit demselben Charakteristikum oder ähnliche Elemente gruppiert und zusammengefasst werden können, zum Beispiel anhand ihrer Größe (Ebd., S. 42f.).

-Exkurs Beginn-

Das Media-Type-Sniffing, auch Content-Sniffing genannt, muss jedoch an dieser Stelle erwähnt werden.

„Um das Risiko des Content-Sniffing bei gültigen Bildern voll und ganz einschätzen zu können, sollten Sie Folgendes wissen: Es ist nicht besonders schwer, Bilder zu erstellen, die korrekt ausgewertet werden, aber in den rohen Bilddaten vom Angreifer ausgewählte ASCII-Zeichenfolgen – zum Beispiel HTML-Auszeichnungen – transportieren. Tatsächlich ist es erschreckend einfach, Bilder zu konstruieren, die beim Validieren, Filtern, Skalieren und erneuten Komprimieren mit einem bekannten deterministischen Algorithmus im damit erzeugten Binärstream aus heiterem Himmel eine beinahe beliebige Zeichenfolge sichtbar werden lassen. Kurz: Das serverseitige Absichern des Bildes führt zur Entfaltung des eigentlichen Schadcodes“ (Heiderich, S.7.).

-Exkurs Ende-

Es gibt also viele Bereiche, in denen eine Kombination der soeben erwähnten Methoden sinnvoll erscheint, weil sie sich gegenseitig ergänzen. Man könnte nun für einen bestimmten Bereich eine Ontologie schaffen, in die andere Benutzer ihre verwendeten Tags einordnen dürfen und diese von den Anwendern generierten Tags könnten dann zusätzlich automatisiert mithilfe von Textanalysemethoden erzeugte Begriffe erweitert werden.

Folksonomies 

Weiterführend ist wichtig zu erwähnen, dass die Begriffe Social Tagging und Folksonomy eng miteinander verwoben sind, daher wird Letzteres nun näher erläutert. Der Begriff Folksonomy leitet sich ab aus dem englischen folk sowie dem griechischen nomia und ist ein aus diesen Teilen zusammengesetztes Kunstwort, das eine bestimmte von Personen generierte Handhabung beschreibt. In Abgrenzung zur Taxonomy stellt die Folksonomy eine Ordnung dar, welche nicht vorherbestimmt ist sondern erst durch die Eingaben eines jeden Benutzers Bedeutung erlangt (vgl. Carlin, Sascha, 2006, S. 48ff).

„Im Gegensatz zu professionell gepflegten Systemen [wie Thesauri und Ontologien] gehen Folksonomies formale Aspekte völlig ab. Es fehlen Verweise und Verknüpfungen, Siehe-Auch-Hinweise und ähnliches. Es fehlen auch hierarchische Gliederungen, die Abhängigkeiten zu Ober- und Unterbegriffen deutlich machen.“ (Ebd., S. 48.)

Eine weitere Definition besagt, dass der Informationsarchitekt Thomas Vander Wal den Begriff der Folksonomy einführte,

„(…) quasi [als] die pluralisierte Stimme des Volkes, die durch die Tagging-Aktivitäten der Einzelnen eine neue Sinnebene erzeugt. Es gibt keine Experten, die die Bedeutung und Ordnung der Dinge festlegen, sondern einen dezentralen, unkoordinierten, sozial-kumulativen Prozess“ (vgl. Gaiser, Birgit/Hampel, Thorsten/Panke, Stefanie, 2008, S. 20f).

Einen weiteren Unterschied stellen die grundsätzliche Hierarchielosigkeit sowie die Offenheit der Folksonomies dar, denn diese können intuitiv von jedem Benutzer gepflegt werden. Es gibt keine Synonymkontrolle und wenn eine Person der Meinung ist, dass eine Ressource einen bestimmten Begriff benötigt, kann dieser einfach hinzugefügt werden. Social Tagging vereint also zwei der bedeutendsten digitalen Entwicklungen in sich, zum einen die Neuorganisation von Informationen im weitesten Sinne und zum anderen deren soziale Verbreitung und Verwendung.

Vor- und Nachteile

Folksonomies bieten sowohl eine einfache Möglichkeit, massige Webressourcen zu speichern als auch eine persönliche und webbasierte Wissensorganisation. Der Einstieg in eine Folksonomy, das Tagging-Konzept und auch die Grundlage der Verwendung sind für den Endnutzer einfacher zu verstehen als in kontrollierten Systemen, in denen eine Fachausbildung als Pflicht angesehen wird. Der Einstieg ist natürlich trivial der Lernerfolg steigt jedoch nicht unbedingt an, da es auch nicht viel komplexer wird für den Benutzer. Klassifikationssysteme werden im Allgemeinen als Werkzeug zur themenbasierten Recherche verwendet, Folksonomies jedoch dienen einer unkompliziert überschaubaren Wissensbildung, also eher dem Entdecken von Zusatzmaterial. Die Schnelllebigkeit der Sprache wird bei letzterem System auch besser berücksichtigt, da es einmal die Sprache des Nutzers widerspiegelt und stets aktuell gehalten wird, da jeder Zugang zu diesem System haben kann. Sie entwickeln sich unabhängig von der Gemeinschaftlichkeit, hin zu einzelnen Interessen. Durch diese Art der Entwicklung von Folksonomies erhalten die Benutzer eine direkte Rückmeldung auf ihre eigene Indexierung einer Ressource und können – wie vor einem thematisch geordneten Regal bei einer haptischen Suche stehend – neue Quellen entdecken, die sie interessieren. Hier findet dann eine Mischung aus privater und professioneller Nutzung statt, da Fachleute und Laien dieselben Rechte haben, Ressourcen beliebig zu indexieren (vgl. Carlin, 2006, S. 62ff).

Neben den Vorteilen sind auch die Nachteile von Folksonomies zu beachten. Zunächst ist das Problem des vielfachen Auftretens von Polysemen anzuführen, also die gleiche Bezeichnung für unterschiedliche Konzepte, wie beispielsweise die Tags Läufer, Bank, Flügel, Zug und Feder. Ein Läufer kann einen Teppich bezeichnen oder eine Person, die eben läuft – eine Bank entweder eine (Sitz-)Bank oder eine (Geld-)Bank – ein Zug entweder eine umgangssprachliche Bezeichnung für eine entzündliche Augenkrankheit, eine Lokomotive mit Anhang oder die Substantivierung des Verbs ziehen. Das letzte Beispiel wird nun außen vor gelassen, da die Intention hinter der Argumentation schon jetzt klar sein sollte. Eine Lösungssuche kann durch das Bilden von Hierarchien innerhalb von Folksonomies, also Clustern, funktionieren. Dadurch werden ähnliche Strukturen wie in einem Thesaurus erreicht und eine kaskadierende Suche ist in einem solchen System wahrscheinlich. Allerdings müssten die Vorgänge des Kontrollprozesses der Clusterbildung wiederholt werden, damit die schnellen und wichtigen Veränderungen innerhalb der Folksonomies nicht verpasst werden. Dadurch, dass jedoch noch keine hierarchischen Strukturen darin herrschen, ist keine kaskadierende Suche möglich. Da die Ressource aus der Nutzerperspektive getaggt wird, findet hier eine Vermischung von Aboutness, Isness und Offness statt (vgl. Grossmann, Silke, 2010, S.27-30).

Aboutness, Isness und Offness

Im Folgenden werden diese Begriffe kurz erläutert: Als Aboutness versteht man gemeinhin das Im-Vordergrund-Stehen von Aspekten der eigenen, individuellen Interpretation. In der Germanistik spricht man auch von Illokution, was ein Sammelbegriff für die diversen Arten des individuellen und kontextbezogenen Verstehens ist (vgl. Hindelang, Götz, 2010, S. 16ff.). Die Isness bezeichnet den direkten Kontextbezug zur Information und die Offness ist der Begriff für den Vorgang, welcher entscheidend dabei ist, was die Ressource letztlich in der Realität abbildet.

Ein ebenfalls nicht allzu geringes Problem stellen Pluralformen, unterschiedliche Schreibweisen, darunter auch Rechtschreibfehler und Fremdsprachen dar sowie die Schreibung zusammengesetzter Begriffe wie Tag-Clouds. Es gibt ein Tool namens Technorati, welches automatisch jegliche Trennzeichen entfernt (s. http://technorati.com/tag/). Auf diese Weise ist es also unwichtig, ob nach tagcloud, tag cloud, tag-cloud oder tag_cloud gesucht wurde, es werden alle Ressourcen dazu gefunden.

Da eine hierarchische Struktur wie bei Thesauri jedoch eine Disambiguierung fordert um genaue Ergebnisse zu erzielen, hat dies eine langsame und unindividuelle Speicherung als Folge (vgl. Grossmann, 2010, S. 30ff.).

Mehrdeutigkeiten müssen geprüft und aufgehoben werden, was Zeit und Geld kostet. Daraus ergibt sich die Frage, ob eine automatische Indexierung nicht auf maschineller Ebene lösbar ist? Die Antwort lautet (noch) nein. Lediglich Menschen ist es bisher möglich, einen Kontext zu erschließen.

Zusammenfassend ist zu sagen, dass Folksonomies in jedem Fall, privat wie beruflich, einen Mehrwert darstellen, wobei die Masse an Anwendern eben diese Aufwertung der Metadaten erst erschafft. Folksonomies sind jedoch noch nicht so weit ausgereift, um Tags in Retrievalsystemen und Datebanken verwenden zu können.

Bibliographie

Back, Andrea; Gronau, Norbert; Tochtermann, Klaus: Web 2.0 in der Unternehmenspraxis. Grundlagen, Fallstudien und Trends zum Einsatz von Social-Software. München 2009.

Carlin, Sascha: Schlagwortvergabe durch Nutzende (Tagging) als Hilfsmittel zur Suche im Web. Ansatz, Modelle, Realisierungen. Darmstadt 2006. http://itst.net/wp-content/uploads/2007/02/diplomarbeit-tagging-sascha-a-carlin-volltext.pdf, zuletzt aufgerufen am 14.10.2012.

Gaiser, Birgit/Hampel, Thorsten/Panke, Stefanie (Hrsg.): Good Tags – Bad Tags. Social Tagging in der Wissensorganisation. In: Medien in der Wissenschaft. Band 47. München 2008.

Grossmann, Silke: Einführung in Social Tagging/Computing. Potsdam 2010. http://informationswissenschaften.fh-potsdam.de/fileadmin/FB5/lehrende_uploads/buettner/dokumente/DC_Reader_Tutorial4.pdf, zuletzt aufgerufen am 13.10.2012.

Hindelang, Götz: Einführung in die Sprechakttheorie. Sprechakte, Äusserungsformen, Sprechaktsequenzen. 5. Auflage. Berlin, New York 2010.

http://technorati.com/tag/, zuletzt aufgerufen am 13.10.2012.

Heiderich, Mario: Tangled Web – Der Security-Leitfaden für Webentwickler. Mechanismen der Inhaltserkennung. Heidelberg, 2013. http://www.dpunkt.de/leseproben/3957/8_Mechanismen%20zur%20Inhaltserkennung.pdf, S.7, zuletzt aufgerufen am 10.06.2013.

 

 

Für neue Blogupdates anmelden:


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.