Android

Google: Wir haben einen Durchbruch bei der Bildsuche

Wem das Internet wirklich gehört

Wem das Internet wirklich gehört
Anonim

Menschen können bei der Mustererkennung hervorragend sein, aber Computer sind nicht sehr schlau beim Identifizieren von Bildern. Unsere Gehirne können sofort Fotos von berühmten Wahrzeichen wie der Freiheitsstatue oder der Chinesischen Mauer identifizieren, aber Computer sind in der Regel ahnungslos, ohne Textmarken als Spickzettel.

Dies könnte sich jedoch ändern, wenn ein Google-Forschungsprojekt in "Computer Vision" schwenkt aus. Der Suchgigant Monday präsentierte auf der Computer Vision and Pattern Recognition (CVPR) -Konferenz in Miami ein Paper zur Landmarkenerkennung. Die neue Technologie ermöglicht es Computern, Id.D. Bilder von mehr als 50.000 Sehenswürdigkeiten der Welt mit 80-prozentiger Genauigkeit, sagt Google.

Google weist darauf hin, dass seine Mustererkennungstechnologie immer noch ein Forschungsprojekt und kein neuer Service ist. Das macht Sinn, da ein Suchwerkzeug, das richtig ist, nur 8 von 10 Versuchen nicht zur Prime Time bereit ist. Dennoch ist das Konzept ziemlich cool und könnte Reisenden einen Segen sein, wenn Google eines Tages die Genauigkeitsrate steigern kann. Die Fähigkeit, ein Foto von einem unbekannten Wahrzeichen zu schießen und Ihr Smartphone oder eine Net-fähige Kamera sofort identifizieren zu lassen, wäre sehr beliebt, denke ich. Natürlich gibt es auch das Potential für wissenschaftliche und Verbraucheranwendungen, an die noch niemand gedacht hat.

Wie funktioniert das? Jay Yagnik, Google's Leiter der Computer Vision Forschung, erklärt in einem Blogbeitrag. Der erste Schritt besteht darin, 40 Millionen GPS-gekennzeichnete Fotos von zwei Google-Diensten, Picasa und Panoramio sowie Online-Reiseführer-Webseiten zu verwenden, um eine Liste von Sehenswürdigkeiten zusammenzustellen. "Als nächstes haben wir Kandidatenbilder für jeden Orientierungspunkt mit diesen Quellen und der Google Bildsuche gefunden, die wir dann mit effizienten Bildanpassungs- und unüberwachten Clusteringtechniken" beschnitten "haben", schreibt er.

Der letzte Schritt war die Entwicklung eines Indexierungssystems für schnelle Bilderkennung. Aber trotz der Klugheit des Projekts bleibt eine genaue Bildsuche schwierig. Wie das Foto unten zeigt, können nicht verwandte Landmarken ähnliche architektonische Merkmale aufweisen. Auch die Aufnahme eines riesigen Banners oder einer Flagge kann zu einer falschen Übereinstimmung führen.

Hoffentlich wird Googles Forschungsprojekt die Bildsuche verbessern, die heute zu sehr vom Tagging abhängig ist. Der nächste Schritt wäre, einen Weg zu finden, um die unzähligen nicht landmarkenartigen Bilder zu identifizieren, aber diese Aufgabe scheint unendlich schwieriger zu sein.