Fundstücke, Lucene GeoSuche

Aus Nutch -> Hadoop

OpenRelevance -> freie Suchindexbeispieldaten

Lucene 3: Umkreissuche einfacher,  Trie Range Datenstruktur

Neo4j; KeyValueStores (MemCache, Projekt Valdemort), BigTableClones (Cassandra), DokDB (CouchDB), GraphenDB (Neo4j); alles NoSQL-DBs

#############

Lucene Umkreissuche – Ansatz: Bei Erzeugung des Index werden Ergebnisse in verschieden große Quadrate einsortiert. Diese werden „hierarchisch“ nummeriert. Z.B. nach Längen-/Breitengrad. Beispiel: Quadrat 4 enthält 40..49; 45 enthält 450..459.

In Kombination mit Trie-Range-Bäumen kann man performante Abfragen bauen. Trie-Range hat nichts mit 3 / drei zu tun, sondern kommt von Retrieval.

Advertisements
Dieser Beitrag wurde unter Uncategorized veröffentlicht. Setze ein Lesezeichen auf den Permalink.

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s