Komponenten

Microsoft Research entwickelt Kartensuche nach unstrukturierten Daten

Automatische Bilderkennung hilft im Einsatz gegen Kinderpornografie | Microsoft

Automatische Bilderkennung hilft im Einsatz gegen Kinderpornografie | Microsoft
Anonim

Microsoft Research Indien hat eine Technologie entwickelt, mit der Benutzer Karten auch in Ländern wie Indien durchsuchen können, in denen die Adressen oft nicht in einem strukturierten Format vorliegen.

Das Forschungsprojekt heißt Robuste Ortungssuche, und ein Prototyp der Technologie ist bereits fertig, sagte B. Ashok, Direktor für Advanced Development und Prototyping bei Microsoft Research India, am Mittwoch. Obwohl die Technologie in Indien entwickelt wurde, ist sie generisch und wurde entwickelt, um in jedem Land mit unstrukturierten Adressen eingesetzt zu werden.

Anstatt nach Regeln in der Adresse zu suchen, verwendet der Algorithmus zugrundeliegende Geodaten, um herauszufinden, an welchem ​​Ort Die Begriffe in der Adressfolge stimmen mit überein, sagte Ashok.

[Weitere Informationen: Ihr neuer PC benötigt diese 15 kostenlosen, exzellenten Programme]

In Ländern wie Indien wird ein Standort oft in einer Adresse durch seine räumliche Beziehung beschrieben B. in der Nähe oder gegenüber einer Landmarke, und nicht durch eine formale, hierarchische Adressstruktur, die aus einer Hausnummer, Straßennamen, Stadt, Staat und Postleitzahl besteht.

Sehr oft kann derselbe Ort eine andere Adresse oder eine Referenz haben ein anderes Wahrzeichen, sagte Ashok. Der lokale Postbote weiß, wie Briefe basierend auf diesen unstrukturierten Adressen zuzustellen sind, aber solche unstrukturierten Daten stellen eine Herausforderung für die Software für die Kartensuche dar.

Kommerzielle Kartendienste, einschließlich der von Google, Yahoo und Microsoft, wurden ursprünglich entwickelt Länder wie die USA, die strukturierte Adressen haben, aber sie sind möglicherweise nicht so gut, wenn sie an unstrukturierten Adressen arbeiten, sagte Ashok.

Das Forschungslabor in Bangalore ist in Diskussionen, um den neuen Algorithmus in Microsoft Windows Live Local zu integrieren.

Microsoft Research India verwendet eine Technologie namens räumliche Schnittmenge, um verschiedene Begriffe in der Adresszeichenfolge zu analysieren, um den Speicherort für eine unstrukturierte Adresse wie "2nd Cross, 10th Main, Sadashivnagar, Bangalore" zu ermitteln.

Die Software beginnt mit Begriffe wie "2nd Cross" und "10th Main", verwendet dann die Straßenkreuzungsinformationen, die 2nd Cross mit 10th Main schneidet, um alle Instanzen auf der Karte zu identifizieren, wo das 2nd Cross int Erneut mit 10th Main, sagte Ashok. Der nächste Begriff, Sadashivnagar, schneidet sich mit den Informationen, die an Kreuzungen von 2nd Cross und 10th Main gesammelt wurden, um zu dem Ort zu gelangen, auf den sich die Adresse bezieht, fügte er hinzu.

Die Software wird am Ort ankommen, unabhängig von der Reihenfolge, in der die Begriffe werden in der Adresse präsentiert, und auch wenn der gleiche Ort eine Anzahl von Alias-Adressen hat, sagte Ashok. Es kann auch von Benutzern in mehreren Sprachen verwendet werden. Eine Abfrage in Hindi, einer indischen Sprache, würde zum Beispiel in die Sprache der Karte transkribiert werden, und die Suche wird basierend auf diesen Begriffen nach Ashok durchgeführt.

Begriffe in der Adresse wie "in der Nähe", die das nicht tun konform zu Daten auf der Karte werden ebenfalls verworfen, sagte Ashok.