Konzeption und Implementierung eines Ansatzes zur Bestätigung von Meldungen im Social Reporting anhand raum-zeitlicher Regeln

Seidl, Daniel

Konzeption und Implementierung eines Ansatzes zur Bestätigung von Meldungen im Social Reporting anhand raum-zeitlicher Regeln

von Daniel Seidl (Autor:in)

Informatik - Programmierung

Technische Wissenschaften

Zusammenfassung

Social Reporting basiert auf der Idee, dass Mitglieder eines ortsbezogenen sozialen Netzwerks in der realen Welt für Mitglieder des Netzwerks relevante Ereignisse beobachten und Berichte über diese Beobachtungen anderen Nutzern zur Verfügung. Ein grundlegendes Problem des Social Reporting ist die Auswertung der Berichte und hierbei vor allem die Bewertung der Zuverlässigkeit eines Berichts. Es stellt sich die zentrale Frage: Wie sehr kann einem Bericht auf Basis anderer verwandter Berichte vertraut werden und wie lässt sich dieses "Vertrauen" ohne menschliches Eingreifen bestimmen?
Viele Anwendungsszenarien des Social Reporting bilden einen kleinen und klar umrissenen Teil der Wirklichkeit ab. Die Nutzer bilden eine recht homogene Gruppe, die sich auf Basis des entsprechenden Anwendungsfalles nur für bestimmte Informationen interessieren. Ebenso ist auch die Auswertung der verschiedenen Berichte und deren Zuverlässigkeit an einen engen Rahmen gebunden, der eine automatische Verarbeitung mit recht einfachen Mitteln erlaubt. Allerdings ist zu beachten, dass die Bewertungskriterien für die Bestätigung von Berichten durch andere Berichte sehr unterschiedlich ausfallen können und absolut vom betreffenden Anwendungsfall abhängig sind.
Die Folge des Bewertungsprozesses ist ein Bestätigungsgraph - auch confirmation graph
genannt. Dieser bildet das durchaus komplexe Geflecht von bestätigenden und widersprechenden Berichten ab und erlaubt eine Aussage über die Zuverlässigkeit einzelner Berichte. Da in der bisherigen Nutzung des Social Reporting aufbauend auf einen beliebigen Anwendungsfall stets nur komplexe spezifische Regel- und Auswertungssysteme zum Einsatz kamen, wird in der vorliegenden Arbeit ein generischer Ansatz vorgestellt. Mit diesem ist es möglich auch komplexe und völlig unterschiedliche Anwendungsfälle mit einem Regelsystem abzubilden und einen davon ausgehenden Bestätigungsgraphen zu generieren.
Um die Komplexität des vorliegenden Ansatzes gering zu halten, beschränkt sich der Ansatz zunächst nur auf nicht-metrische, temporale und attributive Relationen zwischen Berichten. Eine Erweiterung um soziale Aspekte ist jedoch eine denkbare Möglichkeit um den Funktionsumfang des folgenden generischen Ansatzes auszuweiten.

Leseprobe

Inhaltsverzeichnis

1.1 Aktuelle Entwicklungen und Anwendungen

Social Reporting ist ein noch recht junger Forschung- und Anwendungsbereich, der bisher

bis auf wenige Ausnahmen keine große Rolle gespielt hat oder spielt. Allerdings zeigt die ak-

tuelle Entwicklung, dass Social Reporting auf dem Weg ist eines der kommenden großen

Themen im Bereich der sozialen Netzwerke zu werden.

Ein sehr bekanntes Beispiel ist das Ushahidi

Projekt: "Ushahidi [...] describes itself as a

tool for people who witness acts of violence in Kenya to report incidents that they have seen.

The incidents are then placed on a map-based view for others to see. Most incidents listed on

the website are verified by local groups working on the ground." (Okolloh, S. 66)

Zu Beginn des Projekts konnten Berichte über aktuelle Gewalttaten per SMS oder direkt

über die Webseite eingeschickt werden. Hierbei mussten jedoch alle Berichte manuell über-

prüft und freigeschaltet werden, was vor allem durch stetiges Wachstum immer mehr Arbeit

bedeutete. Eine Überprüfung der Verlässlichkeit eines Berichts war ebenso ein Problem, da

man immer auf der Suche nach einer sicheren Quelle war, wie zum Beispiel nach einem Re-

port vor Ort, den man telefonisch erreichen konnte und um Bestätigung bitten konnte.

"This is the risk with any crowdsourcing social media tool. 'Truth' is not guaranteed but

the idea behind crowdsourcing is that with enough volume, a `truth' emerges that diminishes

any false reports. To avoid the risk of the website being used for propaganda, reports were

monitored before they went 'live'. Anything that appeared to be patently false, inflammatory

or inaccurate was not posted." (Okolloh, S. 67)

Auch bei diesem Projekt zeigte sich schnell, dass man nur sehr schwer bestimmen kann,

wie sehr man einem Bericht vertrauen darf. Sei es nun die Beobachtung von Wildvögeln oder

auch die Beobachtung und Meldung von Gewalttaten. Die Frage die sich hier immer stellt:

Wie soll man mit Berichten umgehen, deren Zuverlässigkeit umstritten ist?

Sicherlich kann man durch manuelles Eingriff besonders falsche Berichte sofort aussortie-

ren, aber je größer und komplexer ein Anwendungsfall wird, desto schwieriger wird es auch

für einen Menschen eine richtige Entscheidung in dieser Hinsicht zu treffen. Daher ist auch

hier eine automatische Auswertung sinnvoll. So gesehen könnte auch das Ushahidi Projekt

von einem generischen Ansatz zur Bestätigung von Meldungen profitieren.

Inzwischen wird die Software, die hinter dem ursprünglichen Ushahidi Projekt zum Ein-

Siehe: http://www.ushahidi.com/

satz kommt auch für anderen ähnliche Anwendungsfälle eingesetzt: So wurde zum Beispiel

unter dem Titel "Nürnberg steigt (bald) auf"

eine Plattform zur Verbesserung des Fahrradwe-

genetzes in Nürnberg gestartet. Nutzer können hier direkt auf einer Karte der Stadt Orte für

Verbesserungen der Fahrradwege eintragen.

Alle Anwendungsfälle haben jedoch meist das Problem die eintreffenden Berichte automa-

tisch auswerten zu können. Welche Berichte bestätigen einen anderen Bericht? Welcher Be-

richt widerspricht einem anderen Bericht? Wie sehr kann man einem bestimmten Bericht auf

Basis der anderen Berichte vertrauen? Ein generischer Ansatz, der es einem Nutzer erlaubt

mit einfachen Mitteln ein automatisches Bestätigungssystem für den eigenen spezifischen An-

wendungsfall zu erhalten, ist also ein weiterer wichtiger Schritt für das Social Reporting.

2 Grundlagen

Nachdem die grundlegende Einordnung des vorliegenden generischen Ansatzes im Bezug

auf aktuelle Anwendungen und Entwicklungen bestimmt wurde, müssen zunächst noch einige

Grundlagen für diesen Ansatz festgelegt werden. Auf den folgenden Seiten werden zunächst

einige allgemeine Festlegungen und Einschränkungen beschrieben. Im Anschluss folgen dann

Definition und Struktur eines Bestätigungsgraphen.

2.1 Definitionen, Festlegungen und Einschränkungen

Für die Entwicklung des generischen Ansatzes war es nötig eine Reihe von Festlegungen

und Einschränkungen vorzunehmen und bestimmte Aspekte genauer zu definieren:

· Der generische Ansatz muss eine Vielzahl unterschiedlicher Anwendungsfälle abbil-

den können: Dies beinhaltet während der Entwicklung als Ausgangsbasis genutzte

Fälle (siehe Kapitel 3.1), aber auch jede Art weiterer Anwendungsfälle.

· Der Ansatz darf nur inhaltsgleiche Berichte bei der Anwendung der Bestätigungsre-

geln nutzen. Es muss daher eine klare Regelung getroffen werden, wie inhaltsgleiche

Berichte innerhalb eines Anwendungsfalls zu bestimmen sind (siehe Kapitel 3.2.2).

· Es wird davon ausgegangen, dass Berichte sich grundsätzlich nur bestätigen (Wert

gleich +1) oder widersprechen (Wert gleich -1) können. Dazwischen liegende Werte

Siehe: http://nuernbergsteigtauf.crowdmap.com/

werden zur Minimierung der Komplexität nicht in Betracht gezogen. Zu Beachten ist

jedoch: Da verschiedene Bestätigungsregeln unter Umständen zu mehreren bestätigen-

den oder widersprechenden Kanten zwischen zwei Berichten führen können, muss die

Menge aller Kanten sinnvoll zu einer einzigen bestätigenden oder widersprechenden

Kante akkumuliert werden.

· Der Ansatz soll nicht-metrische, temporale und attributive Relationen innerhalb der

Bestätigungsregeln erlauben. Hierbei ist darauf zu achten, dass alle erdenklichen Mög-

lichkeiten abgebildet werden können (siehe Kapitel 3.2.3 bis 3.2.5).

· Es soll eine einfache Sprache für die Beschreibung eines Regelwerks erstellt werden,

die es dem Nutzer erlaubt auch komplexe Systeme abzubilden. Das erstellte Regel-

werk soll mit Hilfe eines Compilers in ein für den Server nutzbares Format gebracht

werden. Hierfür bietet sich SQL-Code an, der dann direkt vom Server für Anfragen

bei der im Hintergrund liegenden Datenbank genutzt werden kann (siehe Kapitel 3.3).

· Grundlegende Trennung zwischen Server und Client: Der Server auf Java-Basis

nimmt eintreffende Berichte an, validiert deren Integrität und speichert die Berichte

bei Erfolg und erstellt bzw. aktualisiert den Bestätigungsgraphen. Der rudimentäre

Client auf Android-Basis dient nur zum Erstellen von Berichten und zum Versenden

dieser an den Server. Weitere Funktionalitäten werden zur Minimierung der Komple-

xität vermieden.

· Die Serverarchitektur soll einen Austausch des Datenbanksystems ohne große Neupro-

grammierung ermöglichen, auch wenn die Implementierung zunächst nur ein Daten-

banksystem unterstützen wird (siehe Kapitel 4.2).

· Validierungsswerte einzelner Berichte werden auf Basis der eintreffenden Kanten von

anderen Berichten berechnet. Hierzu soll die Serverarchitektur verschiedene Algorith-

men theoretisch unterstützen, wobei in der Implementierung und bei der Evaluierung

nur ein einziger Algorithmus zum Einsatz kommen wird.

2.2 Definition und Struktur eines Bestätigungsgraphen

Der Bestätigungsgraph aller Berichte eines bestimmten Anwendungsfall im Sinne des vor-

liegenden generischen Ansatzes ist ein Graph mit gerichteten und gewichteten Kanten, wobei

die einzelnen Berichte die Knoten

des Graphen darstellen. Hierbei sind

in Anlehnung an die in Kapitel 2.1

getroffenen Einschränkungen nur

die Werte +1 und -1 als Kantenwerte

und zugleich als Bestätigungswerte

oder auch confirmation value

möglich. Hierbei lehnt sich der An-

satz an den Ansatz von Schlieder

und Yanenko (vgl. Schlieder et al.,

2010, S. 5) an. Ein Bestätigungswert c

, r

=-1 sagt aus, dass der Bericht r

dem Be-

richt r

widerspricht. Ein Bestätigungswert c

, r

=1 sagt aus, dass der Bericht r

den Bericht r

bestätigt. Natürlich kann es hierbei vorkommen, dass zwei Berichte sich in

der einen Richtung bestätigen und in der anderen Richtung widersprechen. Dies ist aber

durchaus gewollt, da es zum Beispiel möglich ist, dass einem älterer Bericht von einem neuen

Bericht widersprochen wird, der ältere Bericht jedoch zugleich den neuen Bericht an sich be-

stätigt. Sollte es durch die Regelstruktur dazu kommen, dass mehrere gerichtete Kanten von

einem Report zu einem anderen Report zeigen, so müssen diese auf eine einzelne gerichtete

Kante akkumuliert werden. Dies geschieht einfach dadurch, dass man die Werte aller gerich-

teten Kanten addiert und dann durch die Anzahl der Kanten teilt.

acc

ist der akkumulierte Bestätigungswert. Hierdurch ist es natürlich möglich, dass sich

auch andere Bestätigungswerte als

1 oder -1 ergeben. Dies ist jedoch durchaus so ge-

wollt, um auch genauere Aussagen über den Bestätigungswert zwischen zwei Berichten dar-

stellen zu können. Sollte der Fall c

acc

=0 eintreten, so werden alle gerichteten Kanten ent-

fernt, da keine Aussage über Bestätigung oder Widerspruch getroffen werden kann.

Aufbauend auf den Bestätigungswerten kann dann ein spezifischer Validierungswert

oder auch validation value für einen einzelnen Bericht berechnet werden. Hierfür soll je-

doch wie in Kapitel 2.1 festgelegt ein beliebiger Algorithmus zum Einsatz kommen. Dieser

Aspekt wird in der Implementierung (siehe Kapitel 4) nochmals angesprochen.

Abbildung 1: Beispielhafter gerichteter und gewichteter

Bestätigungsgraph.

3 Generischer Ansatz zur Erstellung eines Bestätigungsgraphen

Das folgende dritte Kapitel beschreibt die Vorüberlegungen des generischen Ansatzes. Zu-

nächst werden eine Reihe von ausgewählten Anwendungsfällen vorgestellt. Die Untersuchung

dieser Fälle dient zur Beantwortung der Frage, welche Typen von raum-zeitlichen und attribu-

tiven Bestätigungsregeln von praktischem Interesse für den generischen Ansatz sind.

Im Anschluss folgt eine Erläuterung der Grundüberlegungen den Aufbau eines Berichts

und eines Regelwerks betreffend. Daran anschließend eine Ausführung der Grammatik, die

zum Erstellen von Regelwerken beliebiger Anwendungsfälle zum Einsatz kommt.

3.1 Ausgewählte Anwendungsfälle

Drei ausgewählte mögliche Anwendungsfälle sollen auf den folgenden Seiten vorgestellt

werden. Dies sind die Beobachtung von Wildvögeln, Storm Chasing und die Meldung von

Gewalttaten angelehnt an das Ushahidi Projekt (siehe Kapitel 1.1).

3.1.1 Beobachtung von Wildvögeln

Die Beobachtung von Wildvögeln und die Dokumentation der Beobachtungen ist weltweit

eine sehr beliebte Tätigkeit. Allein in Deutschland finden sich unzählige Webseiten, die sich

mit dieser Thematik befassen und viele dieser Seiten versuchen auch die Sichtungen zu doku-

mentieren. naturgucker.de

ist zum Beispiel eine sehr große deutschsprachige Seite, die mit

einer Datenbank aktueller Sichtungen aufwartet, wie in Abbildung 2 zu sehen ist:

Siehe: http://www.naturgucker.de/

Abbildung 2: Einblick in die Datenbank von naturgucker.de zur Vogelbeobachtung

Die Erfassung eines Berichts bei naturgucker.de

ist eine sehr gute Grundlage für die Erarbeitung ei-

nes generischen Ansatzes zur automatischen Be-

stätigung von Berichten. Neben der Angabe eines

Ortes ist zudem die Angabe eines Datums und ei-

ner Uhrzeit und natürlich die gesichtete Vogelart

anzugeben (siehe Abbildung 3). Desweiteren ist

die Anzahl der gesichteten Vögel und zusätzlich

eine Beobachtung den Vogel oder die Vögel be-

treffend wie "schwimmend" oder "fischend" zu

machen. Desweiteren gibt es noch die Möglichkeit

detaillierter auf Geschlecht oder dergleichen der

einzelnen Vögel einzugehen.

Hierbei lässt sich bereits sagen, dass ein generi-

scher Ansatz auf jeden Fall den Ort einer Beobachtung und die Zeit einer Beobachtung in Be-

tracht ziehen muss. Die Zeit ist bei naturgucker.de ein Zeitpunkt und kein Zeitintervall. Hier

bleibt die Frage offen, ob ein Zeitintervall oder Zeitpunkt geeigneter für einen Bericht im ge-

nerischen Sinne ist. Desweiteren ist natürliche eine eindeutige Angabe der Beobachtung nötig.

Im Falle der Beobachtung von Wildvögeln bietet sich hier eine Liste mit möglichen Vogelar-

ten an. Zusätzlich scheinen weitere Attribute wie "Anzahl der Tiere" oder "Verhalten" für

einen generischen Ansatz nötig zu sein. Diese müssen jedoch abhängig vom Anwendungsfall

bestimmbar und festlegbar sein.

Bezug nehmend auf mögliche Bestätigungsregeln sind neben nicht-metrischen und tempo-

ralen Relationen auch attributive Relationen wichtig: So lässt sich beispielsweise das Attribut

"Anzahl der Tiere" sehr gut dazu nutzen um an sich inhaltsgleiche Berichte miteinander zu

vergleichen und deren Zuverlässigkeit zu bestimmen. Stehen zwei Berichte zur Überprüfung

an, von denen der eine Bericht von zwei Elstern berichtet und der andere Bericht von fünfzig

Elstern, so findet sich hier ein gravierender Unterschied, der erklärbar sein muss. Dieser Um-

stand lässt sich sicherlich sehr gut in Bestätigungsregeln nutzen um die Verlässlichkeit eines

Berichts zu bestimmen. Für den generischen Ansatz bedeutet dies, dass Regeln sich auch di-

rekt auf für den Anwendungsfall spezifische Attribute beziehen können müssen.

Abbildung 3: Berichtserfassung bei

naturgucker.de

3.1.2 Storm Chasing

Vor allem in den Vereinigten Staaten ist Storm Chasing eine sehr beliebte und ebenso auch

oft sehr gefährliche Beschäftigung. Nach Vasquez definiert sich Storm Chasing wie folgt:

"Storm chasing, in its simplest terms, is the art and science of meeting with a thunder-

storm, for any reason. Tornadoes are widely regarded as the main target for storm chasing

activity, but anything photogenic, unique in structure, or awe-inspiring fits the definition of a

chase target." (Vasquez, 2008, S. 1)

Storm Chaser wie sich die Anhänger des Storm Chasing nennen sind also immer auf

der Suche nach besonderen Wetterphänomenen, wobei vor allem Tornados im Fokus stehen.

Hierbei muss man jedoch beachten, dass viele Wetterphänomene nur kurzfristiger Natur sind

und deshalb auch eine sehr schnelle Verbreitung des Berichts darüber nötig ist, was der vor-

liegende generische Ansatz durch seine automatische Auswertung unterstützen kann.

Ebenso wie bei der Beobachtung von Wildvögeln sind auch hier drei Informationen von

großer Bedeutung: Der Ort der Beobachtung, das Zeitintervall der Beobachtung und natürlich

die Beschreibung der Beobachtung. Daneben sind auch hier weitere Attribute denkbar, wie

beispielsweise Informationen über Windgeschwindigkeit oder Regenfall.

Mit Blick auf mögliche Bestätigungsregeln zeigt sich an diesem Anwendungsfall sehr

schön, dass vor allem räumliche und temporale Relationen eine Rolle spielen: Stehen sich

zwei Berichte gegenüber, die das gleiche Zeitintervall und die gleiche Region beschreiben,

dabei allerdings der eine Bericht ein Unwetter meldet und der andere Bericht ein Aufklaren

des Himmels, so stehen diese beiden Berichte zunächst im Widerspruch. Es muss also in den

Bestätigungsregeln die Möglichkeit geben, nicht-metrische und temporale Relationen sinnvoll

und in ihrer Gesamtheit abbilden zu können. Denkbar sind hierbei vor allem überschneidende

Zeitintervalle. Aber auch direkt aneinander grenzende Zeitintervalle können sinnvoll sein.

Daneben haben Wettererscheinungen wie Unwetter die Eigenschaft, dass sie in recht kurz-

er Zeit große Strecken zurücklegen und dabei auch verschiedene Regionen nach und nach

durchqueren. So ist es denkbar, dass ein späterer Bericht in einer Nachbarregion das gleiche

Unwetter beschreibt, diese jedoch einfach nur weiter gezogen ist. Der neuere Bericht würde

dann durch den älteren bestätigt werden, wobei dem älteren Bericht möglicherweise durch

den neueren Bericht widersprochen wird.

Bei den nicht-metrischen Relationen muss eine Abfrage möglich sein, inwiefern die Regio-

nen zweiter Berichte zueinander in Beziehung stehen: Überschneiden sich diese beiden Re-

gionen? Grenzen die beiden Regionen direkt aneinander? Auch hier bietet es sich an nicht nur

auf diesen Anwendungsfall bezogen sinnvolle Relationen zur Verfügung zu stellen, sondern

über eine umfassende Möglichkeit aller denkbaren nicht-metrischen Relationen zu verfügen.

3.1.3 Meldung von Gewalttaten

Bereits in Kapitel 1.1 wurde auf das Ushahidi Projekt verwiesen, dass sich vor allem auf

dem afrikanischen Kontinent um die Meldung und Sichtung von Gewalttaten kümmert: "Ush-

ahidi [...] describes itself as a tool for people who witness acts of violence in Kenya to report

incidents that they have seen." (Okolloh, S. 66)

Ebenfalls in genannten Kapitel wurde bereits darauf verwiesen, dass der hier vorliegende

generische Ansatz auch eine Option zur Erweiterung des Ushahidi Projekts wäre. Betrachtet

man das Projekt und dessen Ziel genauer, so erkennt man, dass auch hier die Prüfung der Ver-

lässlichkeit einzelner Berichte in großes Problem ist. Ein geeignetes Regelwerk zur automati-

schen Überprüfung und der Auswertung der Berichte ließe sich sicherlich erarbeiten.

Auch hier spielen nicht-metrische Relationen eine Rolle, wobei zwei inhaltsgleiche Berich-

te sich eher in der gleichen Region abspielen und regionsübergreifende Relationen eher selten

sein mögen, da eine Gewalttat in der Regel regional sehr gebunden ist. Temporale Relationen

spielen hingegen eine sehr viel wichtigere Rolle, da eine zeitliche Einordnung von zeitlich

eher kürzeren Ereignissen sehr wichtig für die Bestätigung ist. Hier sind umfangreiche tempo-

rale Relationen nötig, die nicht nur ein einfaches Überschneiden der Zeitintervalle beinhalten,

sondern auch weitere Relationen wie "zeitgleicher Beginn" oder "zeitgleiches Ende".

Allgemein sind auch hier wieder grundlegende Informationen für einen Bericht nötig: Dies

beinhaltet Ort und Zeit der Gewalttat, sowie eine Beschreibung der Gewalttat. Mit diesen In-

formationen muss es dann möglich sein inhaltsgleiche Berichte zu bestimmen um darauf auf-

bauend mit Hilfe der Bestätigungsregeln des Regelwerks die Verlässlichkeit der einzelnen ge-

meldeten Gewalttaten bestimmen zu können.

3.2 Struktur eines Berichts und Relationen zwischen Berichten

Rückblickend auf die bisherigen Ausführungen besteht im Social Reporting grundsätzlich

der folgende Sachverhalt: Nutzer generieren Berichte oder im weiteren Text auch "Reports"

genannt zu einem ausgewählten Anwendungsfall. Diese Reports werden zu einem zentralen

Server gesendet und dort ausgewertet. Bei Bedarf werden die Daten im Anschluss für die Nut-

zergemeinschaft aufbereitet und nutzbar gemacht. Für einen generischen Ansatz zur Auswer-

tung von Reports muss daher zunächst auch ein generischer Ansatz für den Aufbau von Re-

ports ausgearbeitet werden. Darauf aufbauend muss eine grundlegende Struktur für Bestäti-

gungsregeln erarbeitet werden, die anschließend für die Implementierung des Systems kon-

kretisiert und spezifiziert werden muss. Die Grundüberlegungen hierzu finden sich auf den

folgenden Seiten.

3.2.1 Grundlegender Aufbau eines Berichts

Bei genauerer Betrachtung der Anwendungsfälle, die in Kapitel 3.1 vorgestellt wurden,

zeigt sich, dass alle Reports unabhängig von ihrem eigentlichen Anwendungsfall eine

grundlegende Struktur teilen. Jede Beobachtung eines Sachverhalts ist einfach ausgedrückt

die Antwort auf folgende Frage:

Was wurde wann und wo beobachtet?

Die Frage nach dem "was" wird durch die Beschreibung der Beobachtung, die Frage nach

dem "wann" durch das Zeitintervall der Beobachtung und die Frage nach dem "wo" durch die

Position der Beobachtung beantwortet. Da nur mit diesen drei Informationen eine Beobach-

tung ausreichend dokumentiert ist, erscheint es logisch, dass auch diese drei Informationen

die grundlegende Struktur eines Reports bilden müssen.

In den folgenden Kapiteln 3.2.2 bis 3.2.4 wird nun genauer auf diese fortan als "Grundat-

tribute" bezeichneten Informationen eingegangen. Vor allem bezugnehmend auf die vorge-

stellten Anwendungsfälle werden mögliche Relationen zwischen Berichten betrachtet und

mögliche Funktionen zur Beschreibung dieser Relationen herausgearbeitet.

3.2.2 Beschreibung der Beobachtung

Um verschiedene Reports eines Anwendungsfalles miteinander vergleichen zu können,

muss man zunächst bestimmen können, welche Reports grundsätzlich inhaltsgleich sind. Um

beim Beispiel "Storm Chasing" (siehe Kapitel 3.1.2) zu bleiben: Reports über eine besonders

interessante Wolkenformation haben in der Regel nichts mit einem Report über eine Tornado-

sichtung zu tun. Diese Reports sind nicht inhaltsgleich und sollen daher auch nicht auf eine

mögliche Bestätigung oder einen möglichen Widerspruch untersucht werden.

Stattdessen sollen nur Reports, die grundsätzlich die gleiche Thematik beschreiben, auch

wirklich für eine gegenseitige Untersuchung in Betracht gezogen werden. Hierfür dient die

Beschreibung der Beobachtung, wobei sich auch zugleich ein Hindernis zeigt: Frei verfasste

Beschreibungen haben in der Regel das Problem, dass sie nur schwer automatisch auf seman-

tische Ähnlichkeit untersucht werden können.

Um dieses Problem zu umgehen gibt es zwei Möglichkeiten: Man versucht entweder ein

umfangreiches System aufzubauen, dass je nach Anwendungsfall semantische Ähnlichkeiten

bestimmen kann oder man schränkt die Beschreibungsmöglichkeiten derart ein, dass der Nut-

zer nur noch aus einer vorgegeben Liste auswählen kann. Beide Ideen haben ihre Vor- und

Nachteile. Im ersten Fall erhält man die Möglichkeit, dass Nutzer sehr genau ihre Beobach-

tung beschreiben können, läuft aber Gefahr die einzelnen inhaltsgleichen Reports nicht mehr

bestimmen zu können. Im zweiten Fall ist das Bestimmen von inhaltsgleichen Reports ein-

fach, da nur bestimmte Beschreibungen abhängig vom Anwendungsfall dem Nutzer zur

Verfügung stehen und diese eindeutig zuzuordnen sind. Im Gegenzug verliert man jedoch die

potenziell sehr genaue Beschreibung der Beobachtungen durch den Nutzer.

Im vorliegenden generischen Ansatz wird vor allem auch aus Gründen der einfacheren

Handhabung und Implementierung die zweite Möglichkeit gewählt. Der Nutzer erhält beim

Erstellen eines Reports eine Liste möglicher Beschreibungen um die primäre Zuordnung der

Beobachtung zu beschreiben. Zusätzlich wird ein Freitextfeld zur Verfügung gestellt um die

Beobachtung sekundär zu konkretisieren. Dieser Freitext wird jedoch nicht zur Bestimmung

inhaltsgleicher Reports genutzt, sondern dient nur als zusätzliche Informationsquelle für Nut-

zer des Systems bei der Sichtung von Reports.

3.2.3 Zeitintervall der Beobachtung

Da Beobachtungen nur selten genau in einem Augenblick passieren, sondern immer inner-

halb eines Intervalls geschehen selbst wenn dieses Intervall nur eine Sekunde beträgt ist es

sinnvoller für die Zeit einer Beobachtung einen Anfang und ein Ende zu ermöglichen. Zudem

sind temporale Relationen deutlich eingeschränkt, wenn man nur Timestamps nutzt, da eine

"Gleichzeitigkeit" von zwei Beobachtungen bzw. Reports so nur noch schwer realisierbar ist.

Nur sehr wenige Beobachtungen werden genau im gleichen Augenblick geschehen und eben-

so wenige Reports werden von Nutzer genau im gleichen Augenblick erfasst.

James F. Allen beschrieb bereits 1983 drei-

zehn Möglichkeiten, wie zwei temporale Inter-

valle zueinander in Beziehung stehen können.

(vgl. Allen, 1983). Wie leicht auf Abbildung 4

zu erkennen ist lassen sich diese dreizehn mög-

lichen Relationen auf sieben Relationen verein-

fachen, da viele nur die inverse Relation einer

anderen Relation darstellen. Da hiermit nach

James F. Allen alle möglichen temporalen Re-

lationen zweier Zeitintervalle abgedeckt sind,

erscheint es auch hier nur logisch die Vorarbeit

von Allen für den vorliegenden generischen Ansatz bei der Erstellung von Bestätigungsregeln

zu übernehmen. Allerdings ist eine kleine Erweiterung nötig.

Um ein weiteres Mal auf den Anwendungsfall "Storm Chasing" zurückzugreifen: Ein Tor-

nado ist eine Wettererscheinung, die zeitlich recht kurz anzutreffen ist. Es reicht also nicht aus

zu wissen, dass eine andere Sichtung eines Tornados davor war, da eine solche Sichtung auch

mehrere Wochen zurück liegen kann und man sich hierbei sicher sein kann, dass es sich hier-

bei niemals um den gleichen Tornado handelt. Daher ist eine Erweiterung der Relation "befo-

re" um eine maximale Abweichung nötig, so dass man z.B. die Möglichkeit hat die Relation

"maximal 30 Minuten davor" oder "maximal 30 Sekunden davor" nutzen zu können. Die Wer-

te werden in Sekunden angegeben.

3.2.4 Position der Beobachtung

Da die Entwicklung des hier vorgestellten generischen Ansatzes den Fokus auf nicht-me-

trische Positionen setzt also je nach Anwendungsfall festgelegte Regionen nutzt wird die

Position der Beobachtung nicht als absolute geographische Koordinate auf einem zuvor aus-

gewählten Referenzellipsoiden angesehen.

Abbildung 4: Dreizehn mögliche temporale

Relationen nach Allen (vgl. Allen, 1983, S. 835).

Details

Seiten
Erscheinungsform: Erstausgabe
Erscheinungsjahr: 2011
ISBN (Paperback): 9783955494322
ISBN (PDF): 9783955499327
Dateigröße: 1.4 MB
Sprache: Deutsch
Institution / Hochschule: Otto-Friedrich-Universität Bamberg
Erscheinungsdatum: 2015 (Februar)
Note: 1
Schlagworte: Bestätigungsgraph Zeitintervall AtoCC Spatial Database Generic Social Report Confirmation Software
Produktsicherheit: BACHELOR + MASTER Publishing

Autor

Daniel Seidl (Autor:in)