Android

Google Researcher zielt auf strukturierte Web-Daten ab

Google Drive: Save time. Stay focused. (Cloud Next '18)

Google Drive: Save time. Stay focused. (Cloud Next '18)
Anonim

Internet-Suchmaschinen haben konzentrierte sich hauptsächlich auf das Crawlen von Text auf Webseiten, aber Google ist knietief in der Forschung darüber, wie strukturierte Daten analysiert und organisiert werden, sagte ein Unternehmensforscher am Freitag.

"Es gibt eine Menge strukturierter Daten im Web und wir sind es es macht keinen guten Job, es unseren Benutzern zu präsentieren ", sagte Alon Halevy während eines Vortrags auf der New England Database Day Konferenz am Massachusetts Institute of Technology,

Halevy bezog sich teilweise auf so genannte" Deep Web "Quellen B. die Datenbanken, die hinter formgesteuerten Websites wie Cars.com oder Realtor.com stehen. Google hat für einige Zeit Anfragen an verschiedene Formulare gesendet, die resultierenden Webseiten abgerufen und in den Suchindex aufgenommen, wenn die Informationen nützlich erscheinen.

[Lesen Sie weiter: Die besten TV-Streaming-Dienste]

Aber auch das Unternehmen "Ich möchte die Daten in strukturierten Tabellen auf vielen Websites analysieren", sagte Halevy und nannte als Beispiel eine Tabelle auf einer Webseite, auf der die US-Präsidenten aufgeführt sind.

Und es gibt unzählige Tabellen - der Google-Index ist um 14 gestiegen Milliarden von ihnen, nach Halevy. Er "realisierte sehr schnell, dass über 98 Prozent davon nicht so interessant sind", aber selbst nach einer beträchtlichen Filterung bleiben rund 154 Millionen Tabellen wert, sagte er.

Eines der obersten Ziele von Google ist es, Ergebnisse zu liefern, die "Aspekte" organisieren "Eine Suchanfrage, insbesondere eine explorative wie" Vietnam Reisen ", im Gegensatz zu einer Abfrage für eine bestimmte Tatsache wie" Vietnam Bevölkerung ", sagte Halevy. Die vorherige Abfrage würde beispielsweise Informationen über Visabestimmungen, Wetter und Tourpakete liefern.

Die Idee erinnert an den Suchdienst von Kosmix, aber Google möchte laut Halevy weiter gehen. "Kosmix wird dir einen" Aspekt "geben, aber es hängt mit einer Informationsquelle zusammen", sagte er.

Auf der Suche nach "Vietnam Reisen" auf Kosmix gibt es eine Reihe von Ergebnissen, einschließlich Restaurantkritiken von der New York Times, Bilder von Yahoo und Flickr, Shopping-Informationen von Shopping.com und allgemeine Web-Ergebnisse von Google.

"In unserem Fall könnten alle Aspekte nur Web-Suchergebnisse sein, aber wir würden sie anders organisieren", sagte Halevy.