Fachbeiträge
Elektronisch gespeichertes Wissen strukturieren und auffindbar machen
von Christoph Theisinger
Mit dem Trend zu Unternehmensportalen steigt die Menge an Informationen, auf die der einzelne Mitarbeiter zugreifen kann, weiter an. Als Folge der Informationsflut verbringen Mitarbeiter in Unternehmen einen beträchtlichen Teil ihrer Arbeitszeit mit der Suche nach Informationen und finden dabei oftmals die aktuell benötigten Inhalte nicht. Die Konsequenz: Der Mitarbeiter erstellt diese notgedrungen selbst, obwohl sie bereits im Unternehmen vorhanden sind. Das kostet nicht nur Zeit und Geld – im Unternehmen kursieren unter Umständen inkonsistente Informationen zum gleichen Thema. Einen Ausweg aus diesem Dilemma bieten Content-Management-Systeme (CMS), die dabei helfen, das im Unternehmensportal gespeicherte Wissen zu strukturieren und auffindbar zu machen. Der Beitrag von Christoph Theisinger zeigt, wie CMS mittels automatisch generierter Metadaten die Suche nach relevantem Content unterstützen.
Von Christoph
Inhaltsübersicht:
- Suchmaschinen – Wegweiser auf der Datenautobahn?
- Bäume im Wald finden
- Metadaten: Informationen über Informationen
- Hilfe bei der Suche nach relevantem Content
- Reger Informationsfluss im Mitarbeiterportal
- Ausblick
„Wissend ist, wer weiß, wo er findet, was er
noch nicht weiß“ – diese Aussage des Soziologen
Georg Simmel (1858-1918) ist gültiger denn je. Innerhalb der
nächsten zwei Jahre werden die Menschen noch einmal so viel
Wissen produzieren wie seit Beginn der Menschheit. Hohen Anteil
an diesem Informationsüberfluss hat das World Wide Web. Mitarbeiter
in weltweit operierenden Unternehmen nutzen das Netz in Form eines
Intranets oder Portals, um sich mit Kollegen auszutauschen. „Share
Information“ lautet die Devise – viele Unternehmen wollen
auf diesem Wege wertvolle Synergieeffekte nutzen. Doch wie findet
der Mitarbeiter die entscheidenden Informationen auf dem Daten-Highway?
Eine Unternehmens-Website umfasst heute oftmals über 20.000
Seiten. Mit dem Trend zu Unternehmensportalen wird die Menge an
Informationen, auf die der einzelne Mitarbeiter zugreifen kann,
weiter steigen. Laut einer Studie von IDC verbringen Mitarbeiter
heute 25 bis 50 Prozent ihrer Arbeitszeit damit, Informationen zu
suchen. Aber damit nicht genug: In einem Viertel der Fälle
findet der Suchende die gewünschte Information nicht. Die Konsequenz:
Er erstellt diese notgedrungen selbst, obwohl sie bereits im Unternehmen
vorhanden ist. Das kostet nicht nur Zeit und Geld – im Unternehmen
kursieren unter Umständen inkonsistente Informationen zum gleichen
Suchmaschinen – Wegweiser auf der Datenautobahn?
Seit über zehn Jahren gibt es Suchmaschinen, wie wir sie heute
kennen. Eine der ersten mit dem Namen Archie wurde für wissenschaftliche
Zwecke an der McGill Universität in Montreal entwickelt. Seit
1995 finden sich kommerzielle Suchmaschinen im World Wide Web. Doch
nicht nur im Internet breiteten sich die Suchmaschinen aus, auch
unternehmensintern können Mitarbeiter auf unterschiedlichen
Wegen Informationen finden. Heute verfügt der einfachste Texteditor
über eine Suche-Funktion. In der Regel bieten Suchmaschinen
– ob im Internet oder auf dem internen Server – eine
so genannte Volltextsuche an: Der Anwender gibt einen Begriff ein,
der möglicherweise mit logischen Operatoren verknüpft
ist. Die Suche-Funktion durchforstet einen Index sämtlicher
Texte nach diesem Wort – unabhängig vom Zusammenhang.
Für diesen Aufwand benötigen Volltextsuchmaschinen vor
allem leistungsfähige Rechner, viel Bandbreite und viel Zeit.
Typische Beispiele für diese Art von Suche sind die meisten
Suchhilfen im Internet wie zum Beispiel Google, Altavista oder auch
die unzähligen Spezial-Suchmaschinen für bestimmte Sachgebiete.
Benötigt der Mitarbeiter Wissen aus dem internen Datei-System,
kann er beispielsweise über die Suche-Funktion im Windows Explorer
passende Dateien finden. Im Unternehmensportal greift er meist auf
Dokumente zu, indem er über eine integrierte Suchmaschine die
Volltextsuche startet. Alle diese Funktionen haben einen Nachteil:
Es dauert zu lange, bis der Anwender die entscheidenden Informationen
findet. Außerdem erhält er in der Regel zu viele Suchergebnisse,
von denen die meisten wahrscheinlich nicht relevant für ihn
Bäume im Wald finden
Ein besserer Ansatz für die intelligente Suche ist es, das
Wissen im Unternehmen zu strukturieren. Große Unternehmen,
aber auch Bibliotheken nutzen deshalb zur Unterstützung Datenbanktechnologien.
Eine Datenbank gibt dem Anwender definierte Felder vor – in
einer Adress-Datenbank zum Beispiel die Felder „Name“
oder „Telefonnummer“. Einzelne Felder werden in Beziehung
zueinander gesetzt und bilden einen Datensatz. Der Anwender kann
dadurch über unterschiedliche Wege, so genannte Kategorien,
nach relevanten Datensätzen suchen. Nach dem gleichen Prinzip
funktionieren Kataloge im World Wide Web wie beispielsweise Yahoo.
Das System führt den Anwender durch hierarchisch aufgebaute
Kategorien. Er wählt beispielsweise die Oberkategorie „Wirtschaft“
und kann über Unterkategorien die Suche immer weiter einschränken.
Metadaten: Informationen über Informationen
Mit Kategorien arbeiten mittlerweile auch viele Suche-Funktionen
in Mitarbeiterportalen. Jede Suche ist allerdings nur so gut wie
die Informationen, die der Suchhilfe zur Verfügung stehen.
Damit der Mitarbeiter im Unternehmen die Suche-Funktion als Hilfe
und nicht als Last wahrnimmt, müssen die Daten, in denen er
sucht, strukturiert sein. Elektronisches Wissen im Unternehmen erhält
diese Struktur durch so genannte Metadaten.
Metadaten sind Informationen über Informationen. Dazu gehören
unter anderem Informationen zu Autor und Thema, aber auch Schlüsselwörter
und Synonyme. Die Struktur funktioniert ähnlich wie bei einem
Lexikon: Dieses enthält zwar Unmengen von Informationen, aber
niemand muss ein Lexikon von Band 1 bis 25 durchlesen, um eine gewünschte
Information zu finden. Es unterliegt einer bestimmten, dem Anwender
bekannten Struktur. Genauso wird Wissen mit Hilfe von Metadaten
in Unternehmen auffindbar und zugänglich gemacht.
Wissen strukturieren mit Metadaten – mit dieser Methode arbeiten
Bibliotheken bereits seit Jahrhunderten. Wie könnten wir sonst
in einer riesigen Bibliothek genau jene Bücher finden, welche
die Informationen enthalten, die wir benötigen? Hier helfen
Karteikarten mit Schlagworten weiter. Heute liegt immer mehr Wissen
in elektronischer Form vor – sei es auf File-Servern, im Internet
oder im Unternehmensportal. Was liegt also näher, als ein so
effektives System wie die Metadaten-Struktur für digitale Inhalte
verfügbar zu machen und zu automatisieren?
Hilfe bei der Suche nach relevantem Content
Mit dem Thema Metadaten setzen sich mittlerweile vor allem Anbieter
von Content-Management-Systemen auseinander. Und das aus gutem Grund:
Content-Management-Systeme (CMS) wie beispielsweise die TeamSite
von Interwoven sorgen dafür, dass Mitarbeiter elektronisch
gespeichertes Wissen, also Content, in ein Intranet oder Extranet
einstellen bzw. bearbeiten können. Zusätzlich ist das
CMS dafür verantwortlich, alle Mitarbeiter und Anwendungen
in den Prozess der Informationserstellung und Informationspflege
zu integrieren. Es stellt den Anwendern Standard-Formulare zur Verfügung,
um Inhalte zu erstellen, zu importieren oder zu pflegen. Da bietet
es sich an, über Standard-Formulare auch gleich Metadaten oder
Schlagwörter, Synonyme und Zusammenfassungen zu erstellen oder
eine Kategorisierung vorzunehmen. Muss der Mitarbeiter jedes Dokument,
das er in das Content-Management-System einstellt, manuell verschlagworten
und Kategorien zuordnen, kostet dieser Vorgang aber viel zu viel
Zeit. Lösungen wie der Interwoven MetaTagger automatisieren
deshalb das Anreichern von Content mit Metadaten.
Voraussetzung für den erfolgreichen Einsatz solcher Systeme
ist, dass das Unternehmen eine Metadaten-Strategie definiert. Dabei
hat es sich bewährt, ein Projektteam mit Mitarbeitern aus allen
Abteilungen zusammenzustellen, das festlegt, welche Schlagwörter
und Kategorien für die intelligente Suche in der Wissensbasis
des Unternehmens relevant sind. Ist diese Phase abgeschlossen, kann
jeder Mitarbeiter Informationen, die er beispielsweise im Unternehmensportal
publiziert, mit Metadaten versehen. Dabei spielt es zunächst
keine Rolle, ob es sich dabei um Texte, Bilder oder Videoclips handelt.
Erstellt oder importiert der Mitarbeiter ein Dokument, generiert
der MetaTagger von Interwoven die zugehörigen Metadaten und
füllt das Metadaten-Formular automatisch aus. Auch wenn es
darum geht, bereits vorhandenen Content zu klassifizieren, nimmt
die Software die Kategorisierung vor. Die Grundlage dafür bilden
bereits vorhandene Taxonomien. Letztlich können aber nur Menschen
entscheiden, ob bestimmte Feinheiten im Text korrekt in den Metadaten
wiedergegeben sind. Autoren haben deshalb jederzeit die Möglichkeit,
die Vorschläge von MetaTagger zu verändern oder zu ergänzen.
So wird eine nahezu hundertprozentige Genauigkeit sichergestellt.
Lösungen wie der Interwoven MetaTagger automatisieren das Anreichern von Content mit Metadaten. |
Reger Informationsfluss im Mitarbeiterportal
Mitarbeiterportale in global agierenden Unternehmen haben vielfältige
Aufgaben. Unter anderem sollen sie die Zusammenarbeit von Projektteams
sowie das Wiederverwenden von bereits vorhandenen Inhalten fördern.
John Deere, Hersteller von Land- und Baumaschinen, hat für
seine Mitarbeiter und Kunden die Informationssuche auf seiner Website
mit Hilfe der Enterprise-Content-Management-Plattform Interwoven
5 mit dem integrierten MetaTagger vereinfacht.
Das Unternehmen John Deere hatte vor dem Einsatz der Software seine
Dokumente für das Unternehmensportal noch manuell verschlagwortet.
Das kostete einen Mitarbeiter ungefähr zehn Minuten pro Textseite.
Inzwischen hat das Unternehmen mit MetaTagger relevante Schlagwörter
festgelegt. Das CMS ordnet diese Schlagwörter dann automatisch
Inhalten zu und kategorisiert diese. Davon profitieren bei John
Deere sowohl Mitarbeiter als auch Kunden: Die Mitarbeiter können
Inhalte schnell finden und wieder verwenden, wodurch das Unternehmen
Zeit und Geld spart. Die Interwoven TeamSite stellt bereits frei
gegebene Inhalte automatisch den Autoren in den einzelnen Ländern
zur Verfügung, die diese Informationen übersetzen. Und
die Kunden finden auf der Homepage von John Deere jetzt schneller
die gewünschten Informationen wie etwa länderspezifische
Produktbeschreibungen und Preise.
Ausblick
Die Forschung beschäftigt sich nach wie vor stark mit dem
Thema intelligente Suche. So plant die Universität Linz beispielsweise,
Softwarepakete als kleine intelligente Agenten durch’s World
Wide Web zu schicken. Diese sollen das Netz nach benutzerbestimmten
Kriterien durchforsten und aus den Reaktionen des Anwenders lernen.
Auch den Suchtechniken der Zukunft kommt eine Metadaten-Strategie
entgegen: Über Web Services werden diese Agenten mit Content-Management-Systemen
kommunizieren und auf diese Weise dem Mitarbeiter noch optimiertere
Trefferquoten bieten. Je besser Agenten von akkuraten Metadaten
unterstützt werden, desto erfolgsversprechender sind auch solche
High-End-Suchstrategien.
Diese Artikel könnten Sie auch interessieren
Fachbeitrag IT-Tools
Content Management: Auf die Architektur kommt es an
von Michael Moppert
Fachbeitrag Dokumentenmanagement
So einfach wie Telefonieren
von Florian Moser
Fachbeitrag Messen
DMS EXPO 2012 setzt die Segel
Fachbeitrag Messen
Alles, was den Posteingang smart macht – die DMS EXPO hat’s
Fachbeitrag Best Practice