Fragebögen und Befragungen

Dieses Projekt untersucht, wie man mithilfe einer allgemeinen Ontologie zum Weltausschnitt "Fragen und Antworten" eine möglichst allgemeine Software für Umfragen/Befragungen entwickeln kann. Wissenschaftliche Begleitung: Hochschule für Philosophie München. Finanzierung: Bundesministerium für Wirtschaft & Technologie (ProINNO II-Förderprogramm).

Beabsichtigte technologische Entwicklung

Statistische Erhebungen und Befragungen sind für markt- und marketingorientierte Unternehmen (aber auch für Wirtschaftsverbände, Vereine, politische Parteien, Zeitungen usw.) von erheblicher Bedeutung. Die Gewinnung von Informationen anhand von Primärbefragungen wird von immer mehr Unternehmen genutzt, um damit z.B. ihre Produktpolitik entscheidend zu verbessern. So gibt es spezielle Befragungsmethoden mit denen die Neuentwicklung von Produkten und deren Bepreisung ermittelt werden können.

Solche Befragungen und statistischen Erhebungen werden durch Unternehmen, Verbände usw. (Auftraggeber) aber nur noch selten Inhouse geplant, durchgeführt und ausgewertet, sondern werden outgesourced und an professionelle Agenturen (Auftragnehmer) übertragen.

Die Bereiche, in denen Erhebungs- und Auswertungstools erstellt werden, betreffen im Wesentlichen Konsumenten- / Kundenbefragungen (Qualitätssicherung, Panel- / Warenkorbuntersuchungen) und Mitarbeiterbefragungen. Die Auftraggeber sind hier kleinere sehr spezialisierte Beratungsunternehmen wie auch große Marktforschungsinstitute mit einem breiten Spektrum an Auswertungsanforderungen und differenzierten Themenbereichen innerhalb des Gebiets Markt- und Meinungsforschung.

Derzeit zeichnet sich der Stand der Technik bei der Erstellung eines Fragebogens und bei der Auswertung der Daten durch folgende Schritte aus: Für die Auftraggeber wird eine Software erstellt, die Fragebögen anzeigt, verwaltet und konstruiert und auch entsprechende statistische Auswertungen auf Basis der gesammelten Daten durchführt. Als Ausgabeformate werden hier die gängigen Formate wie Online-Ausgabe in HTML genauso verwendet wie PDF-/Word-Druckformat, MS Excel-/CSV-Daten oder MS Powerpoint-Daten. Auf Basis dieser Daten werden Diagramme und Abbildungen erstellt, die in Dokumente eingebaut und in Besprechungen und Gesprächen verwendet werden.

Hier zeigt sich sowohl auf Kunden- (Auftraggeber) wie auch auf Entwicklerseite (Agentur) das Problem, dass Software und Datenmodell oftmals stark an eine bestimmte Befragungsart gekoppelt und nicht flexibel einsetzbar sind. Typische Probleme (die eine flexible Nutzung von Fragebögen und deren Auswertung erschweren) sind z.B. begrenzte Anzahl von Fragearten, Reduktion auf eine oder nur sehr wenige Skalen, geringe Orientierung an wissenschaftlichen Aspekten bei der Gestaltung des Fragebogens, zu starke Fokussierung von Formatierungsvorschriften statt auf Abbildung von Beziehungsstrukturen zwischen Fragen, Auswertungen und Berichtsgestaltungen. Gerade bei den Auswertungen und Berichterstattungen sind die Ergebnisse zu sehr an bestimmten Fragetypen orientiert. Insgesamt sind die heute eingesetzten Methoden und Auswertungen bei der Marketingforschung zu starr und zu unflexibel und wenig auf den speziellen Kontext ausgerichtet.

An diesem Punkt setzt das Entwicklungsvorhaben der Comelio GmbH an.

In den vergangenen Jahren wurden durch verschiedene Hersteller relativ allgemeine relationale Datenmodelle entwickelt, in verschiedenen Projekten angewandt und leicht variiert auf unterschiedliche Befragungsarten und Fragetypen angepasst. So wurden Software, Auswertungsalgorithmen und Fragebogenkonstruktionen ermöglicht, die auch bei veränderter Nutzung teilweise nur wenige änderungen erforderten. Allerdings sind diese Beziehungen rein relational durch eine Datenbank geprägt und in Algorithmen hinterlegt.

Es fehlt ein Metamodell für Befragungen und deren Datenstrukturen, die mit den konkreten Fragen und Eigenschaften sowie deren wechselseitigen Beziehungen in Einklang gebracht werden. Comelio will eine ontologiebasierte, universell einsetzbare Regelmaschine zur Generierung innovativer Befragungs- und Auswertungssysteme entwickeln. Letztlich geht es um die Bereitstellung einer Ontologie, die als Metamodell für eine Regelmaschine bei der Festlegung von Fragebögen, Durchführungs- und Auswertungsstrategien zum Einsatz kommen soll.

Fragebogensoftware DomOnto

Ziel des Entwicklungsvorhabens ist es, zusammen mit der Hochschule für Philosophie in München eine Ontologie für die Erstellung, Verwendung und Auswertung von Fragebögen zu entwickeln und in einer möglichst universell einsetzbaren Regelmaschine zu nutzen. Dabei sollen Möglichkeiten und Grenzen herausgearbeitet werden, tatsächlich eine allgemein einsetzbare Regelmaschine mit konfigurierbaren Skalen, Skalentransformationen und wechselseitigen Fragebeziehungen als Prototyp zu entwickeln. Weitere Nutzungsarten können bei der Entwicklung der Algorithmen und der Revision der Ontologie geprüft und ggf. erschlos-sen werden.

Ein weiteres Ziel des Entwicklungsvorhabens ist das Einbetten von Auswertungen in eine "Auswertungsontologie". Die Erfahrung zeigt, dass Auftraggeber typische Auswertungen bevorzugen, die sich ontologisch klassifizieren lassen könnten. Auf der anderen Seite hat sich auch herauskristallisiert, dass im Markt Differenzierungsmöglichkeiten bestehen, was die Gestaltung von speziellen Diagrammen für die Ergebnisdarstellung betrifft. Eine noch offene Fragestellung ist somit die Auswertung der Fragen. Hier soll untersucht werden, ob eine Ontologie entwickelt werden kann, in der Fragetypen und Skalen mit gängigen Auswertungsverfahren, Berechnungen, Transformationen und Darstellungen (Tabellen, Diagrammen) sinnvoll verknüpft werden können.

Die Berechungsmöglichkeiten bei den Auswertungen sollen für (noch zu bestimmende) Skalen ontologisch abgebildet und mit entsprechenden Formeln und Abfragen hinterlegt werden, um dynamische Diagramme erstellen zu können. Das ontologische Auswertungsinstrument soll unterschiedliche Aspekte und Zielsetzungen (die gerade mit der grafischen Ausgabe von Auswertungen (Dateiformate, Formatierungen, Anzeigearten) einher gehen) einfangen und möglichst verallgemeinern können. Dies soll letztlich in einem Software-Framework abgebildet werden und für eine hohe Zahl an Datenauswertungen tragbar sein.

Ob möglicherweise sowohl die Metadaten für die Fragestrukturen wie auch die Auswertungs-varianten, Berechnungen etc. in einer Ontologie zusammengefasst werden können, ist ein Teil der zu leistenden Forschungs- und Entwicklungsarbeiten. Es wird auch versucht zwischen den beiden Ontologien Wechselbeziehungen aufzubauen, um die Dynamik bei der Fragebogenerstellung, Bereitstellung der Fragen für den User und die Auswertungen noch zu steigern.

Die zentralen Punkte des Entwicklungsvorhabens noch einmal zusammengefasst:

  • Es soll eine Regelmaschine entwickelt werden die ontologiebasiert ist und sich dynamisch an Befragungskontexte und Probanden anpasst. Aus einem Datenpool (welcher in einer Datenbank bevorratet ist) sollen Fragen dynamisch dem Kontext entsprechend generiert werden. Schließlich soll die Regelmaschine auch bei den Auswertungssystemen kontextbezogen und dynamisch arbeiten. Durch die Ontologie sollen die in der Datenbank enthaltenen Daten erst ihre Bedeutung erhalten, die für die Fragebogenerstellung notwendig ist. Die Ontologie soll hier die notwendige und innovative Flexibilität und Dynamik bieten.
  • Die Regelmaschine soll in einer umfassenden Lösung ein Metadatenmodell (die Ontologie) nutzen, um in der Datenbank vorhandene Fragen und Antworten jeweils zuzuordnen. Zudem soll die Regelmaschine erstellte Fragebögen, deren Anzeige und deren Konfiguration verwalten.
  • Die Regelmaschine soll des Weiteren die Ontologie für die Auswertungen und Berechnungsarten nutzen, um den Antworten, die zu den Fragen gegeben werden, entlang der Vorgaben aus dem Fragebogen und der Berichtsanforderungen passende Berechnungen, Auswertungen und Ausgaben zuzuordnen. Aus ontologischer Sicht wäre dies lohnenswert und sinnvoll. In diesem Vorhaben ist vorgesehen, über eine API für externe Erweiterungen hinsichtlich der Ausgabegestaltung und Auswertungen eine zusätzliche Flexibilität einzurichten.

Auf Basis der Gesamtstruktur ist die Regelmaschine zu entwickeln, die es dem Kunden ermöglichen soll, dynamische Fragebögen zu generieren und auch die Auswertung kontextspezifisch vornehmen zu können. Beide Ontologien – für ein Frage-Antwort-Modell, als auch für die Auswertungen – sollen unabhängig voneinander sein, jedoch beide auf dem selben Datenmodell aufsetzen. Aus dem zu entwickelnden Datenmodell soll wiederum ein passendes Datenbankschema entwickelt werden, das in der Lage ist, die Daten in geeigneter Form abzulegen. Die Unabhängigkeit der Ontologien soll die Möglichkeit sicherstellen, dass beispielsweise auch über externe Schnittstellen in das System importierte Ergebnisse aus Umfragen kontextsemantisch ausgewertet werden können.

Fragebogensoftware DomOnto

Funktionalitäten und relevante Parameter

Ein technisch erfolgreicher Projektabschluss setzt auf Seiten der Comelio GmbH voraus, dass die nachfolgenden technischen Funktionalitäten und Parameter erreicht werden:

  • Erarbeitung eines allgemeinen Schemas, das das Datenmodell für die Strukturen von Fragen und Antworten abbildet. Dieses muss neutral und möglichst allgemein formuliert sein, um die Regelmaschine dynamisch und flexibel für unterschiedliche Kontexte einsetzen zu können.
  • Entwicklung einer Ontologie für die gegenseitige Abstimmung und Zuordnung von Fragen, Fragegruppen, Skalen, Antworten und Beziehungen zwischen Objekten. Dieses Metamodell soll letztlich für die Erstellung eines allgemein geeigneten Datenmodells genutzt werden.
  • Sicherstellung einer dynamischen Zuordnung der korrekten Datensätze an den jeweiligen Probanden auf Basis des Kontextes. Dabei sind die Strukturierung/Aufbau und die Anzeige der Fragebögen, die Flusskontrolle und die Validierung der Angaben zu beachten. Eine solche kontextabhängige und dynamische Zuordnung von Informationen soll auch direkte Auswirkungen auf die spätere Auswertung der Daten haben.
  • Erstellung und Modellierung einer weiteren Ontologie für die Datenauswertung (Berechnungen, Formeln, Vergleichsmöglichkeiten in Hierarchien und nach Merkmalen aus dem Codebuch), welche unabhängig von der Frage-Antwort-Ontologie agieren und Daten aufbereiten kann.
  • Eine Response-Zeit der Regelmaschine in angemessener, für den Nutzer vertretbarer Zeit (in Abhängigkeit der Größe der Datenbasis im Sekundenbereich).
  • Dokumentation und Speicherung der Erstellung von exemplarischen und nützlichen Diagrammarten, Erfassung der Nutzenhistorie, zielführende Auswertungsmethoden sollen gespeichert und in ihrem Ranking verbessert werden.
  • Laufende und permanente Verbesserung der Auswertungsverfahren durch automatisches Nichtbeachten für den Kontext irrelevanter Informationen und Integration von bewährten Auswertungsmechanismen.
  • Speicherung von Beziehungszusammenhängen zwischen Hierarchie, Gruppe und Bedingung, Erstellung und Speicherung einer Logik zwischen Datenzugriff und Stammdaten, Verwendung dieser Zusammenhänge für künftige Befragungen. Das System der Befragungen soll sich schrittweise verbessern, indem irrelevante Daten und Pfade ausselektiert und zielführende Zusammenhänge besonders berücksichtigt werden.
  • Abgleich und Nutzung von Metadaten als Grundlage für die semantische Zuordnung der Faktenlage in einem allgemeinen Frage-Antwort-Modell
  • Dynamisierung der Regelsysteme für das Anrufen von Antwortdaten und Verarbeitung der Ergebnisse, diese Dynamisierung soll auch bei der Erstellung und Zuordnung von Fragen gelten
  • Abbildung von Fragen und deren Beziehungen untereinander, um diese Informationen schrittweise auch in die Ontologie einzubringen. Zusätzlich werden dadurch auch die Bedeutung der Frage und der dahinterliegende Kontext bekannt werden. Mit dieser Bedeutung soll dann weiter gearbeitet werden, um dynamisch den Fragebogen während der Befragung entwickeln zu können. So soll es ermöglicht werden, auch komplexe Befragungsstrukturen in einer Ontologie einzufangen und abzubilden. Es soll auch eine Komponente entwickelt werden, die aus dem Weltmodell in der Ontologie die benötigen Daten aus der Datenbank für die einzelnen Objekte abruft und verfügbar macht.

In einer traditionellen Software gibt es einen festgelegten Fragebogen, der über ein Konfigurationsmenü festgelegt wird und dessen Daten in einer XML-Struktur oder in einer relationalen Datenbank hinterlegt sind. In einer ontologisch basierten Vorgehensweise soll auch weiterhin ein Fragebogen gestalten werden, doch die für die Auswertungen und die Fragebogenkonstruktion notwendigen Bedeutungsinformationen sollen zusätzlich noch hinterlegt werden. So soll erreicht werden, dass unterschiedliche Fragearten mit den gleichen Algorithmen über die Ontologie verarbeitet werden können.



Die zu entwickelnde Regelmaschine soll aus vier Teil-Modulen bestehen, die Abfragen auf dem Metamodell und deren Zuordnungen in der relationalen Datenbasis ausführen. Die Regelmaschine soll weiter für typische Anwendungsfälle Lösungen und Strukturierungen vorhalten, die im konkreten Fall angewendet werden können.

Im Einzelnen sind dies:

  • In der geplanten Software soll es möglich sein, die Beziehungen zwischen Fragen und ihren Skalen zu erfassen, um diese für spätere Auswertungen nutzen zu können. Die zu entwickelnde Ontologie wird hierbei genutzt, um den konkreten Ausprägungen entsprechende Metamodell-Elemente zuzuweisen.
  • In diesem Zusammenhang soll das System befähigt werden, im Rahmen des Kontextes Fragen automatisch zu generieren und diesen Fragen relevante Eigenschaften wie Skalenniveau und Formulierung kontextabhängig zuzuordnen. Die Fragen und ihre Eigenschaften sollen zusätzlich auch dem Metamodell zuzuordnen sein. In einer konventionellen Lösung würde man hier ohnehin nur aus einem begrenzten statisch vorgegebenen Frageartenkanon konkrete Fragen erfassen.
  • Umfragedurchführung: Auch die Umfragedurchführung richtet sich direkt an den Benutzer. Die Regelmaschine generiert kontextspezifisch Fragebögen oder Fragebogenteile, die den Usern dann angezeigt werden. Die Kontextsemantik speist sich aus den vorherigen Antworten des aktuellen oder vorhergehender User. Denkbar sind hier auch sonstige Beziehungen zwischen den Fragen und ihren Eigenschaften.
  • Im Kern sollen auf Basis der Ontologie und den Beziehungen, die zwischen den Objekten im Metamodell vorgegeben sind, passende Strukturen und Zusammenhänge aufgebaut werden. Diese dynamische Generierung von Inhalten ist ebenfalls neuartig, da im Normalfall in gängigen Systemen die Fragebögen statisch konstruiert und lediglich angezeigt werden. Hier ist lediglich der angezeigte Fragetext dynamisch ausgewählt, wenn Fragebögen z.B. mehrsprachig konzipiert sind.
  • Berichtsformaterfassung: Antworten gehören zu Fragen und beziehen sich auf die entsprechenden Skalen. Die Informationen werden mit für die Skalen geeigneten Techniken ausgewertet. Bei der Berichtsformaterfassung ist es das Ziel, Reihenfolgen von ausgewerteten Fragegruppen und ggf. auch Bedingungen bei der Auswertung automatisch zu erfassen, um anschließend Berichte zielführender anzufertigen. Dieser Teil ist besonders innovativ. Dies ist damit zu begründen, dass hier potenzielle Kunden der Regelmaschine ihre unternehmenseigenen und teilweise auf bestimmte Auswertungstechniken beruhenden Ergebnisdarstellungen benötigen und die Anzahl der Möglichkeiten unüberschaubar ist. Dennoch wird angestrebt, dass Standardauswertungsverfahren und Diagramme dynamisch und kontextbezogen generiert werden können. Damit wird diese Regelmaschine in der Anwendung allen starren und unflexiblen Lösungen überlegen sein.
  • Auswertung: Auf Basis der typischerweise in einer XML-Struktur erfassten Berichtsformatierung erfolgt dann die eigentliche Auswertung. Diese ist natürlich abhängig von der Berichtsformatierung und der Ontologie, in der die Skalen, Berechnungsarten etc. für die möglichen Fragen hinterlegt sind.

Die Ontologie ist eine komplexe Wissensrepräsentation, die mittels Abbildung von den vorhanden Datenquellen (Fileserver, Domänenmodell, Objekten, Skalen, Fragen) aufgebaut wird. Die Daten sollen mit Hilfe einer Reihe von Inferenz- und Integritätsregeln in relevante Datenstrukturen angeordnet werden, um daraus die Fragebögen zu generieren. Hier werden die Daten beschrieben und anhand von konkreten Fragen und Antworten zu Objekten des Metamodells zugeordnet.

In der nachstehenden Liste sind weitere angestrebte technische Parameter zusammengefasst, die in dem angedachten Entwicklungsvorhaben erreicht werden sollen.

Allgemeines Datenmodell
Ontologie mit OWL (W3C-Standard) oder XTM (ISO-Standard), welche die allgemeinen Strukturen von Fragen und Antworten mit ihren Beziehungen untereinander, ihren jeweiligen Eigenschaften und den Beziehungen der Eigenschaften erfassen und beinhalten soll.
Framework für Ontologie-Verarbeitung
In .NET ist zurzeit kein von Microsoft angebotenes Framework vorhanden. Daher ist es notwendig, für die vereinfachte Suche, Speicherung und Verarbeitung in einer Software-Komponente ein solch allgemeines Framework zu entwickeln. Hierbei kommt voraussichtlich auch die .NET-Programmiertechnologie zum Einsatz.
Datenspeicherung
Die Datenspeicherung erfolgt im Prototyp im MS SQL Server als relationale Datenbank, die die konkreten Fragen und Antworten enthält. Möglicherweise kommt hier eine teilweise Speicherung in XML hinzu, um die komplexen Strukturen, die sich ergeben können, vereinfacht und allgemein abbilden zu können.
Befragungssteuerung
Es wird eine Software-Komponente benötigt, um die Steuerung der gesamten Befragung (Ablauf, Formularanzeige/-aufbau, Validierung, Zurückstellen von Fragen) auf Basis der Ontologie und der vorhandenen konkreten Fragen einzurichten. Befragungserfassung und -zuordnung Es wird eine Softwarekomponente erforderlich sein, welche die Zuordnungen zwischen der allgemeinen Ontologie und den konkreten Fragen/Antworten und Skalen bietet und diese relational oder in einer anderen geeigneten Datenstruktur erfasst.
Auswertung
Es wird eine Software-Komponente benötigt, um die Steuerung der gesamten Befragung (Ablauf, Formularanzeige/-aufbau, Validierung, Zurückstellen von Fragen) auf Basis der Ontologie und der vorhandenen konkreten Fragen einzurichten. Es wird eine Softwarekomponente erforderlich sein, welche die Zuordnungen zwischen der allgemeinen Ontologie und den konkreten Fragen/Antworten und Skalen bietet und diese relational oder in einer anderen geeigneten Datenstruktur erfasst.

Die möglichen Auswertungen sind teilweise auch von den allgemein in der Ontologie modellierten Datenstrukturen abhängig. Dabei sind insbesondere die Antwortstrukturen und die Skalen, auf denen die Antworten abgebildet werden, und die Datentypen, in denen sie erfasst werden, dafür maßgeblich beeinflussend, welche Techniken und Algorithmen für eine Auswertung zum Einsatz kommen. Mathematische und einfache statistische Operationen, der Einsatz einer Formelsprache oder skalenbasierte Transformationen sind hier zu modellieren und können dann auch für eine Reihe von ausgewählten Auswertungen genutzt werden.
Erweiterbarkeit
Insbesondere im Bereich der Auswertung muss man davon ausgehen, dass in gar keinem Fall alle denkbaren und benötigten Diagrammarten entwickelt werden können. Die Entwicklung und der Einsatz von Befragungssoftware umfassen auch immer Aspekte der Auswertung in Form von tabellarischen und Matrix-Auswertungen sowie in Form von grafischen Diagrammen. Hier gibt es eine Reihe von Anforderungen, die meistens nur mit individuell entwickelten Diagrammen und Auswertungsalgorithmen zu lösen sind. Daher ist es notwendig, eine objektorientierte API/Schnittstelle für die Entwicklung von Diagrammen zu bieten.

Verwendung

Wenn diese Funktionalitäten erreicht werden, kann dem Markt ein Befragungstool angeboten werden, das in seiner Dynamik und Flexibilität absolut neuartig sein wird. Damit wird es sich von vorhandenen Lösungen der Wettbewerber erheblich differenzieren und auch in seiner Anwendungsbreite neuartig sein. Auch in der Zusammenarbeit mit der Hochschule München wird für das Vorhaben ein wirklicher Neuheitsgrad erreicht, der einen nachhaltigen technischen Vorsprung erwarten lässt.

Im Zentrum einer Umfragesoftware stehen die beiden Objekte Frage und Antwort. Softwaretechnisch lassen sich entsprechende Systeme bereits sehr spezialisiert für ein einzelnes Gebiet hin entwickeln oder man versucht, Fragearten, Skalen und mögliche Antworten abzubilden. Es ist eine Reihe von Anbietern am Markt vorhanden, die explizit damit werben, ihre Software-Lösung eigne sich für einen speziellen Befragungsbereich. Dennoch ist zwischen den verschiedenen Produkten im Bereich der Ausgaben (Diagrammarten, statistische Berechnungsverfahren, Dateiformat) und im Bereich der Fragearten immer auch ein gewisser Anteil an Gemeinsamkeiten zu finden.

Die wesentlichen Einschränkungen von existierenden Befragungssoftwareprodukten sind:

  • Begrenzung auf für einen Themenbereich typischen oder sinnvollen Fragetypus
  • Speicher- und Datenstrukturen, die für einen bestimmten Themenbereich optimiert sind, aber im Wesentlichen nicht die allgemeinen Eigenschaften und Beziehungen von Fragen und Antworten modellieren
  • Notwendigkeit, Fragebögen vollständig eigenständig zu gestalten und deren Abfolge formularbasiert anzugeben
  • Ungünstige Datenmodellierung für Bedingtheiten und Beziehungen zwischen Fragen
  • Teilweise keine Unterstützung von Fragehierarchien, unterschiedlichen Frageskalen und einer umfangreichen Fragetechnikauswahl
  • Teilweise zu wenig Unterstützung, um die Erfahrungen und Erkenntnisse der Fragebogentheorie optimal nutzen und umsetzen zu können

Erfolgsaussichten

Im Rahmen des Forschungsprojekts soll nun vor allem erreicht werden, keine rein statisch strukturierte Software zu entwickeln, die explizit nur für Kundenumfragen oder Befragungen von Mitarbeitern zum Einsatz kommen kann. Vielmehr soll durch eine intelligente semantische Modellierung eine erhebliche – in der Form noch nicht existente – Flexibilität erreicht werden. Primäre Maßgabe ist dabei, eine Lösung zu realisieren, die universell einsetzbar ist, was im Wesentlichen durch die Ontologie-Orientierung gelöst werden soll.

Es ist sehr anspruchsvoll, eine flexible Software-Architektur und entsprechende Algorithmen und Verfahren zu entwerfen, die es ermöglichen, nahezu beliebige Frage-Antwort-Strukturen für Fragebögen abzubilden und entsprechend auch auszuwerten. Es gibt zwar eine Reihe von Standard-Anwendungen, die teilweise auch unter einer Open-Source-Lizenz vertrieben werden. Die Anwendungen erfüllen allerdings viele Anforderungen hinsichtlich Dynamik und Flexibilität nicht und sind daher nur für sehr wenige und sehr spezialisierte Befragungsprojekte einsetzbar. Aus dieser Differenzierung erwächst allerdings kein besonderer Vorteil. Stattdessen lässt sich im Falle von Projektübernahmen immer wieder feststellen, dass gerade bei der Modellierung der Datenstrukturen und der zugehörigen Algorithmen zu spezialisiert für einen Themenbereich gearbeitet wurde und dass daher häufig Hindernisse bei der erfolgreichen Projektdurchführung entstehen.

Durch die Erfahrungen der letzten Jahre hat die Comelio GmbH eine Reihe von Techniken entwickelt, um Software zwar thematisch orientiert zu entwickeln, aber dennoch für Veränderungen und Erweiterungen für komplexe Fragestrukturen und auch Beziehungen zwischen Fragen sowie Auswertungstechniken offen zu sein. Es fehlten allerdings bis jetzt die notwendigen personellen und gerade auch finanziellen Mittel, intensiv daran zu arbeiten, über eine Ontologie die allgemeinen Strukturen, die einer Befragungssoftware zu Grunde liegen, als Kern der Datenstrukturen vorzugeben und die tatsächlichen Fragen, Antwortmöglichkeiten und insbesondere die Beziehungen zwischen Fragen abzubilden. Das Ziel soll eine Software mit Ontologie und Regelmaschine sein, die möglichst universell einsetzbar ist. Ob es definitiv möglich ist, eine für alle möglichen Befragungsstrukturen und -techniken einsetzbare Software zu entwickeln, ist grundsätzlich offen, doch für die bisher umgesetzten Projekte ist es wiederum sehr wahrscheinlich. Typische Einsatzbereiche wären dann auch hier Konsumenten- und Kundenbefragungen als typische Meinungsbefragungen und vergleichende Umfragen als reine Datenerhebung mit offenen Themenbereichen.

Kooperationspartner Hochschule für Philosohpie, München

Der Lehrstuhl Herrn Prof. Brüntrup und die Comelio GmbH engagieren sich im Rahmen einer Kooperation für die Entwicklung einer ontologiebasierten Software-Lösung, welche die Modellierung einer Ontologie für Frage- und Antwort-Strukturen erfordert. Die Comelio GmbH erstellt u.a. individuelle Software-Lösungen im Bereich Business Intelligence oder erweitert Standard-Produkte von Microsoft und Oracle für Berichts- und Expertensystemen ein. Im Forschungsprojekt soll versucht werden, eine Daten- und Softwarestruktur zu entwickeln, mit deren Hilfe konkrete Fragen und mögliche Antworten zu den allgemein beschriebenen Frage-/Antwort-Strukturen in der zu Grunde liegenden Ontologie in Beziehung gesetzt werden. Dies soll dazu führen, dass sich Fragebögen, Validierungen und Standard-Auswertungen vereinfachen und teilweise automatisch durchführen lassen.

Der innovative Kern des Vorhabens liegt in der dynamischen und kontextbezogenen Generierung von Fragebögen und Auswertungsalgorithmen. Hiefür muss eine übergeordnete Ontologie gefunden werden, die zusammen mit der Hochschule entwickelt werden soll. Die Zusammenhänge von Hierarchie, Gruppe, Bedingung usw. müssen gebildet und erfasst werden. Darüber hinaus werden durch Comelio mehrere Module entwickelt, die softwaretechnisch aufeinander abgestimmt werden müssen. Hierzu zählen u.a.: ein Modul zur automatischen Ableitung von individuellen Befragungen aus der Datenontologie, ein Auswertungs- und Berichtsmoduls, ein Bearbeitungs- und Zugriffsmodul.

Der Lehrstuhl von Herrn Prof. Dr. Godehard Brüntrup SJ wird das Entwicklungsvorhaben der Comelio GmbH wissenschaftlich untersetzen und begleiten. Seitens der Hochschule sollen die theoretischen und anwendungsspezifischen Grundlagen geliefert werden, um eine spätere rechnergestützte Semantik als ein Netz aus Begriffen und Relationen ermöglichen zu können. Die Hochschule wird sich an aktuellen, formalen Forschungsmethoden aus den Sozialwissenschaften und bereits ausgearbeiteten Softwareontologien orientieren und die notwendigen Grundlagen aus der einschlägigen Literatur gewinnen. Befragungs- und Auswertungsontologien sind aber nicht die paradigmatischen ontologischen Gegenstandsgebiete (Physik, Biologie, Psychologie). Die innovative Herausforderung des Projekts besteht darin, in einem Bereich, der ontologisch viel weniger ernstgenommen wurde, durch die ontologische Methode zwei sehr allgemeine Kategorienschablonen zu finden, anhand derer generisch Umfragen erstellt und ausgewertet werden können.

Entscheidend werden darüber hinaus die gemeinsame Konzeption zu Beginn des Vorhabens, der theoretisch-konzeptionelle Entwurf des Entwicklungsprozesses für Comelio sowie die abschließende Untersuchung und Unterstützung der Hochschule bei den Prototypentests sein. Für die Hochschule für Philosophie ist es ein Ziel, Forschungen mit umfangreichem Praxisbezug im Bereich der Schnittstelle zwischen philosophischer Ontologie, Informatik und Sozialwissenschaften zu intensivieren und diese in entsprechenden Veröffentlichungen zu artikulieren. Ontologie war von je her eine Domäne der Philosophie. In den letzten Jahrzehnten wurde sie systematisch für die Informatik fruchtbar gemacht. Da im vorliegenden Projekt (Fragen und Auswertungen) zwei Ontologien benötigt werden, wird eine bestehende Arbeitsgruppe von zwei post-graduierten Studenten mit besonderen Qualifikationen im Bereich formaler Sprachen und mathematischer Logik in Zusammenarbeit mit Prof. Brüntrup das Projekt leiten und durchführen. Von daher ergibt sich die im Antrag ausgewiesene Notwendigkeit von zwei halben Stellen. Um sich in der anspruchsvollen Fragestellung des Projekts auf einen weitestmöglichen Pool von Denkansätzen stützen zu können, wird ein Hauptseminar an der Hochschule für Philosophie mit Studenten verschiedenster Fachrichtungen den Zusammenhang von allgemeiner Ontologie und Informatik zum Thema haben. Es ist zu erwarten, dass dabei ambitionierte Essays entstehen, die konkrete Problemlösungen zu speziellen Umfrageontologien entwerfen und genau analysieren. Sollten diese Entwürfe für das Entwicklungsprojekt von Comelio praxisrelevant werden, ist auch im Kontext des Seminars mit einer Veröffentlichung zu rechnen. Insbesondere dann, wenn ein solcher Essay in eine ausführliche, projektrelevante Abschlussarbeit ausgeweitet wird.

Projektplan

Vorgehen

Entwicklungsvorbereitung

Zu Beginn des Vorhabens muss das Projekt exakt durchgeplant und dessen Teilstücke aufeinander abgestimmt werden. In diesem Zusammenhang ist vor allem die Zusammenarbeit und der genaue zeitliche Rahmen mit der Hochschule zu präzisieren, da die Arbeiten von Comelio darauf aufbauen.

Am Ende des ersten Arbeitspaketes soll in einem Feinkonzept ein präzis herausgearbeiteter Arbeitsplan stehen und die technischen Entwicklungsbereiche klar definiert und abgegrenzt sein.

Analyse verwertbarer Standards zu Ontologien und Schnittstellen

Im Rahmen des zweiten Arbeitspakets werden die am Markt frei verfügbaren Lösungen und Konzepte zu Ontologien auf eine mögliche Verwendung innerhalb dieses Entwicklungsvorhabens untersucht und bewertet. Im weiteren sollen auch mögliche – bzw. notwendige – Schnittstellen für die geplante Entwicklung evaluiert werden. Dies ist notwendig um einerseits einen möglichst breite Aufstellung – und damit eine hohe Marktakzeptanz – der geplanten Entwicklung zu erreichen, andererseits sollen spätere kostenintensive Lizenzzahlungen vermieden werden.

Darüber hinaus soll im Rahmen dieses Entwicklungsvorhabens zusammen mit der Hochschule evaluiert werden, wie sich die zu entwickelnden Ontologien programmatisch bestmöglich umsetzen und in die Regelmaschine einbinden lassen.

Konzept zur dynamischen und kontextbezogen Zusammenhangserkennung zwischen Fakten

Im dritten Arbeitspaket sollen die Grundlagen für die dynamische kontextsemantische Verknüpfung zwischen den einzelnen Informationen gelegt werden. Die Grundlage bildet ein vom Hochschul-Partner zu entwickelndes Datenmodell für die Frage- und Antwortstrukturen, das von Comelio umfassend weiterentwickelt wird.

Dazu müssen die sich ableitenden Beziehungszusammenhänge zwischen Hierarchie, Gruppe, Bedingung, Datenzugriff und Stammdaten erfasst und gespeichert werden. Die darüber gewonnenen Informationen bilden wiederum die Basis für die Verwendung für künftige Befragungen.

Ziel der Konzeption ist ein System, mit dessen Hilfe einzelne Befragungen sich iterativ verbessern, indem irrelevante Daten und Pfade ausselektiert und zielführende Zusammenhänge besonders berücksichtigt werden.

In diesem Zusammenhang sind Fragestellungen zur Strukturierung/Aufbau/Anzeige der Fragebögen sowie der Flusskontrolle und der Angabenvalidierung in dem Konzept zu berücksichtigen.

Entwicklung einer Datenontologie für eine Regelmaschine

Die Entwicklung der eigentlichen Struktur für eine Datenontologie für die zu entwickelnde Regelmaschine ist höchst anspruchsvoll und stellt ein zentrales Entwicklungspaket in diesem Vorhaben dar. Aus diesem Grunde ist dies in mehrere Teilpakete unterteilt.

Einsatz von Semantischen Technologien

Modellierung der Ontologien

Basierend auf den ersten Ergebnissen der wissenschaftlichen Forschungen der Hochschule soll im ersten Unterpunkt ein Grundmodell für eine geeignete Datenontologie entwickelt werden. Dies ist nach derzeitigem Erkenntnisstand herausfordernd, da die zu entwickelnde Ontologie speziell auf den Anwendungsfall der Fragebogengenerierung und Datenerhebung zuge-schnitten werden soll. Inhaltlich muss die Ontologie jedoch selbst mit jedem beliebigen Interviewthema befüllt und bearbeitet werden können. Dies bedeutet, dass die Strukturen einerseits weitgehend flexibel, andererseits jedoch nicht zu komplex gestaltet werden dürfen, um etwaige Performanceprobleme bereits auf konzeptioneller Ebene zu vermeiden.

Konzept zur Verknüpfung der Ontologien

Im Rahmen des Arbeitspaketes soll ein geeignetes, leistungsfähiges Mapping (Verknüpfung) zwischen der Ontologie für das allgemeine Frage-Antwort-Modell und der Ontologie für die Auswertung und Berechnungen/Ergebnisausgabe entwickelt werden. Dazu ist eine Methodik zu entwickeln und umzusetzen, die den Austausch von strukturierten Daten zwischen den beiden Ontologien ermöglicht.

Der Realisierung voraus geht dabei eine Evaluierung möglicher Abfragesprachen bzw. Transformationsmethoden. So sind nach derzeitigem Erkenntnisstand beispielsweise XPath und Xlink mögliche Ansatzpunkte für ein geeignetes Mapping.

Entwicklung eines Moduls zur automatischen Ableitung von individuellen Befragungen aus der Datenontologie

Aufbauend auf den Ergebnissen aus dem Arbeitspaket zur Entwicklung einer geeigneten Ontologie-Struktur soll in diesem Schritt ein Modul entwickelt werden, das einen automatischen Abgleich von Metadaten als Basis der semantischen Zuordnung der vorhandenen Informationen in einem allgemeinen Frage-Antwort-Modell gestattet. Dies gestaltet sich aller Voraussicht nach hoch anspruchsvoll, da dieses Modul die technologische Grundlage für eine kontinuierliche Verbesserung der Auswertungsverfahren durch ein automatisches Erkennen irrelevanter Informationen darstellt.

Im weiteren sollen die Erkenntnisse aus dem zweiten Arbeitspaket aufgegriffen und als ein Fundament für die Entwicklung eines dynamischen Regelsystems genutzt werden. Motivation und Anspruch sind dabei eine hohe Dynamisierung bei der Erstellung und Zuordnung der Fragen bei der Datenerhebung sowie bei der Verarbeitung und Auswertung der gewonnenen Daten.

Die Erkenntnisse der Hochschule aus dem Arbeitspaket zur Entwicklung einer innovativen Befragungsmethodik für ein ontologiebasiertes Befragungssystem werden hier durch Comelio softwaretechnisch umgesetzt.

Entwicklung eines Bearbeitungs- und Zugriffsmoduls für die Datenontologie

Aufbauend auf den Ergebnissen der vorangegangenen Arbeitspakete soll ein Modul entwickelt werden, das einen Zugriff und eine Bearbeitung der zugrundliegenden Datenontologie erlaubt. In diesem Zusammenhang sind Werkzeuge zu entwickeln, die auch einem weniger geübten Anwender eine Modellierung und Anpassung von geeigneten, anwendungsfallspezifischen Ontologien und Regeln gestatten.

Anspruchsvoll und neuartig ist dieser Aspekt, da die zu realisierenden Werkzeuge speziell auf den Anwendungsbereich der Datenerhebung und Auswertung der Fragebögen zugeschnitten werden sollen.

Entwicklung eines Konzeptes zur persistenten Datenvorhaltung    

Im Rahmen des fünften Arbeitspaketes soll ein Konzept für das Programmmodul entwickelt werden, das eine dauerhafte und unveränderbare Datenerhebung über eine zu entwickelnde Datenschnittstelle gestattet. Die Umsetzung der Datenverwaltung soll es ermöglichen, dass die genutzte Datenquelle ausgetauscht werden kann, ohne umfangreiche änderungen an Programm-Interna vorzunehmen. Das Modul bietet somit Schnittstellen für den Datenimport und -export sowie zur Datensicherung über verschiedene Medien.

Eine dauerhafte, nicht-flüchtige Datenspeicherung ist notwendig, um eine nachträgliche Nachvollziehbarkeit der Datenerhebung zu gewährleisten. Dies ist vor allem unter Beachtung der automatisierten Relevanz-Erfassung und Gewichtung erforderlich, um eventuelle Interpretationsspielräume aufzuspüren, kontrollieren bzw. einzugrenzen.

Entwicklung eines neuartigen ontologiebasierten Auswertungs- und Berichtsmoduls

Basierend auf den Ergebnissen der Forschungsleistungen des Hochschulpartners soll in diesem Arbeitspaket ein innovatives Datenauswertungs- und Berichtsmodul entwickelt werden. Durch dieses Modul soll ein Anwender später in der Lage sein, ontologisch verknüpfte Er-gebnisse aus einer Datenerhebung aufzubereiten und zu analysieren.

Bei der Komponente für die Berichtserfassung ist es das Ziel, Reihenfolgen von verwerteten Fragegruppen zu erfassen und dann über einzelne Themenbereiche Berichte auszugeben. Dabei soll das Modul so umgesetzt werden, dass beliebige – bzw. beliebig komplexe – Auswertungstechniken in der geplanten Entwicklung realisiert werden können.

Für den Test über die Mächtigkeit des Moduls und einer ordnungsgemäßen Funktionsweise sollen im Rahmen dieses Arbeitspaketes auch einige Standardauswertungstechniken und Diagramme umgesetzt werden.

Entwicklung und programmatische Umsetzung von Schnittstellen

Basierend auf den gewonnenen Ergebnissen aus dem vorangegangenen Arbeitspaket sowie den Resultaten des zweiten Arbeitspaketes müssen die elementare Schnittstellenmodule programmatisch umgesetzt werden.

Anspruchsvoll ist dieses Arbeitspaket, da bei einem zu erwartenden hohen Datenaufkommen aus Datenerhebungen Konsistenzprüfungen durchzuführen sind. Gleichzeitig muss das Programm jedoch auch genügend leistungsstark sein, um die Daten innerhalb eines angemessenen Zeitraums verarbeiten zu können. Diese Konsistenzprüfungen sollen dabei automatisiert durch die zu entwickelnde Regelmaschine geleistet werden.

Im weiteren muss für eine optimale kontextsemantische Verarbeitung beim Import von konventionellen Datenerhebungen dem Anwender die Möglichkeit gegeben werden, die zu importierenden Daten mit zusätzlichen Metadaten zu versehen. Zugleich müssen jedoch über eine leistungsstarke Verlaufsfunktion änderungen an der Datenbasis erfasst werden, um mögliche Manipulationen an den Fakten zu vermeiden.

Entwicklung eines Konzeptes zur Zusammenarbeit aller zu entwickelnder Module

In den vorangegangen Entwicklungsschritten sind die einzelnen Komponenten getrennt voneinander entwickelt worden. Im Rahmen des achten Arbeitspaketes soll nun ein Konzept entwickelt werden, das eine Zusammenarbeit zwischen den einzelnen Programmmodulen ermöglicht.

Comelio strebt dabei an, dieses Konzept möglichst modular, offen und universell zu gestalten, damit eine mögliche Erweiterung und Anpassung des Gesamtsystems bzw. der problemlose Austausch einzelner Programmteile ohne großen Aufwand möglich ist.

Nach derzeitigem Erkenntnisstand erweist sich diese modulare Grundkonzeption als anspruchsvoll, da die Regeln und Ontologien als zentrale Bestandteile des Gesamtsystems derart flexibel umgesetzt werden sollen, dass diese mit beliebigen und (nahezu) unbegrenzt umfangreichen Inhalten befüllt werden sollen. Gleichzeitig muss die Regelmaschine die Daten genügend schnell und ressourcenschonend verarbeiten können.

Programmatische Umsetzung eines Prototypen

Im Rahmen dieses Arbeitspaketes sollen die entwickelten Konzepte und Module zu einem leistungsfähigen Gesamtsystem kombiniert und integriert werden. Bereits an dieser Stelle auftretende konzeptionelle Defizite in der Regelmaschine sollen – sofern möglich – bereits frühzeitig angegangen und korrigiert werden.