Thesis2006

Natural Language Web Mapping Service unter OGC Standard: am Beispiel von einer NLMapping Middleware für die Integration des EDEN NLP Tools in der Pilot-Stadt Bremen

In: XXX

Abstract

Diese Diplomarbeit wurde im Rahmen des EU-Projekts EDEN (Electronic Democracy European Network) erstellt. In diesem Projekt geht es um die Entwicklung von elektronischen Werkzeugen zur Vereinfachung der Beteiligung von Bürgerinnen und Bürgern an Planungs- und Entscheidungsprozessen in Politik und Verwaltung. Das zu entwickelnde EDEN-Toolkit umfasst insgesamt sieben Subsysteme. Eines davon wird Natural Language Map (NLMap) genannt. Damit soll u.a. bei regional- und stadtplanerischen Prozessen eine Kommunikation auf der Basis geographischer Informationssysteme (GIS) mit Hilfe natürlichsprachiger Eingaben ermöglicht werden, die User müssen komplexere Fragen nicht mit booleschen Operatoren (UND, AND, OR...) verknüpfen, sie suchen online nach die Karten und die Dokumentationen durch eine Fragestellung in natürliche Sprache (im Gegensatz zu Formalen Sprache). Der Beitrag dieser Diplomarbeit besteht darin, eine flexible, effiziente, natürlichsprachliche Schnittstelle zu entwickeln, die mit der OGC-Schnittstelle vom GeoServer beim Amt für Stadtplanung und Bauordnung kommunizieren kann und die die EDEN NLP Tools mit deutscher Grammatik benützt, sowie die Kartensuch-Funktionen des Waller-Heerstrasse Projekts vom Amt für Stadtplanung und Bauordnung Bremen zu integrieren. Damit wird den Bremer BürgerInnen ein benutzerfreundlicher Zugang zu Stadtplanungen und Bauordnungen in Bremen ermöglicht. Um es genauer zu beschreiben, gibt der Nutzer z.B. eine Anfrage in deutscher Sprache im Web Browser ein: "Bitte zeigen Sie mir alle Bauplanungen der Waller-Heerstrasse." Dann solle die Bauplanungskarte der Waller-Heerstrasse, alle entsprechenden Dokumente und die Information des Ansprechpartners usw. zurückgeliefert werden. Der Nutzer kann verschiedene Kartenausschnitte wählen, einen Kartenausschnitt vergrößern/verkleinern, die Dokumente online lesen, oder eine Frage direkt an den jeweiligen Ansprechpartner stellen (z.B. per E-Mail), usw. Im zweiten Kapitel "Grundlagen" wird zunächst der Begriff "Natural Language Processing" unter Verwendung der semiotischen Kategorien Syntax, Semantik und Pragmatik erläutert. Dann wird auf Natural Language Systems (NLS) eingegangen. Anschließend werden geographische Informationssysteme definiert und der Stand der Anwendung im Internet sowie Spezifikationen des OpenGIS-Konsortium geschildert. Bei der Behandlung der Anforderungen an den Prototypen im dritten Kapitel wird zunächst das Anwendungsprojekt "Sanierungsgebiet Waller Heerstrasse" dargestellt. Im Rahmen dieses Sanierungsprojekts sollen Bürgerinnen und Bürger per Internet Kartendarstellungen und Sachangaben in eigenen Formulierungen abfragen können. Die an ein entsprechendes System gerichteten Anforderungen werden in den Kategorien Funktionalität, Usability und Interoperabilität gegliedert. Nach den Anforderungen für den Prototypen und die Analyse der bestehenden Infrastruktur wird verschiedene Software für die Entwicklung des Prototypen ausgewählt. In viertem Kapitel werden die Eigenschaften der Software von der bestehenden Infrastruktur und der neu ausgewählten Software vorgestellt. Die Gründe werden erläutert, wieso die jeweilige Software für die Entwicklung des Prototyps benutzt werden. Nach der Analyse der entstehenden Infrastruktur und den Anforderungen an den Prototyp wird ein Prototyp als Middleware entworfen und entwickelt, welche NLMap Middleware genannt wird. Die Architektur und Klassendiagramme werden ausführlich wiedergegeben im Kapitel fünf. Die geforderte Eigenschaften des Prototypen NLMap Middleware werden durch verschiedene Test-Methoden getestet. Alle Tests werden protokolliert und die Ergebnisse werden analysiert. Das wird in Kapitel sechs beschrieben. Zum Ende kommt die Zusammenfassung im Kapitel sieben. Das "Highlight" dieser Arbeit ist Integration des Natural Language Processing (NLP) im Geographischen Informationssystemen (GIS) und die plattformunabhängige, flexible NLMap Middleware System Architektur. Inhaltsverzeichnis: 1.Einleitung1 1.1Hintergrund1 1.2Motivation3 1.3Zielsetzung5 1.4Kapitelüberblick7 2.Grundlage8 2.1Natural Language Processing (NLP)8 2.1.1Begriffe8 2.1.2Probleme und Lösungen9 2.1.3Natural Language System (NLS)13 2.2Geographische Informationssystem (GIS)14 2.2.1Hintergrund14 2.2.2Begriffe15 2.2.3GIS Daten17 2.2.4GIS im Internet19 2.2.5OpenGIS Konsortium (OGC) Spezifikationen22 2.2.6XML im GIS24 3.Anforderungen an den Prototypen26 3.1Sanierungsgebiet Waller Heerstraße Projekt26 3.2Anforderungsanalyse27 3.2.1Funktionalität27 3.2.2Usability28 3.2.3Interoperabilität29 4.Software für den Prototypen30 4.1Software aus der bestehenden Infrastruktur30 4.1.1NLP im EDEN Projekt30 4.1.2AED GeoServer32 4.2Neu ausgewählte Software37 4.2.1Apache XML-RPC Protokoll37 4.2.2Java Servlet Jakarta Tomcat 4.0.440 4.2.3Datenbank Server – MySQL41 5.Der Prototyp NLMap Middleware43 5.1Entwurf43 5.1.1NLMap Middleware Architektur44 5.1.2NLMap Middleware Klassendiagramme47 5.1.3Das NLMap Middleware Komponentendiagramm52 5.1.4Planung der Datenbank54 5.2Implementierung Integration56 5.2.1Die deutsche Grammatik für den EDEN NLP57 5.2.2Parser für die Integration59 5.2.3Probleme und Lösungen59 6.Testen des Prototypen NLMap Middleware65 6.1Funktionalitätstest66 6.1.1Black-Box-Test66 6.1.2White-Box-Test69 6.2Usability Test71 6.2.1Explorativ Test72 6.2.2Vergleichstest75 6.3Interoperabilitätstest76 6.4Performance Test77 7.Zusammenfassung und Ausblick79 7.1NLP Integration im GIS79 7.2NLMap Middleware System Architektur80 7.3Ausblick81 Literaturverzeichnis83

Problem melden

Wenn Sie Probleme mit dem Zugriff auf einen gefundenen Titel haben, können Sie sich über dieses Formular gern an uns wenden. Schreiben Sie uns hierüber auch gern, wenn Ihnen Fehler in der Titelanzeige aufgefallen sind.