Heute ging es um Volltextsuchmaschinen.
Wir sprechen darüber, was die so grundsätzlich tun und wie man sie von Python aus verwenden kann, oder auch selbst eine implementieren könnte. Weitere Themen waren die Relevanz von Suchergebnissen, SEO und alles Mögliche drumherum. Zudem haben wir unsere Androhung aus früheren Episoden wahr gemacht und sprechen ein wenig über das pathlib Modul aus der Standardbibliothek.
Shownotes
Unsere E-Mail für Fragen, Anregungen & Kommentare:
[email protected]
News aus der Szene
Bald startet der Kartenverkauf für die europython 2020
Python 3.8.2
Modul aus der Standardbibliothek
Pathlib
Metathema
WDR 5 Das philosophische Radio
Volltextsuchmaschinen
Lucene - inzwischen die Standardbibliothek für Volltextsuche
Solr - Ein auf Lucene aufsetzender Suchserver
Elasticsearch - Ein ebenfalls auf Lucene aufsetzender Suchserver
xapian
Sphinx
whoosh Volltextsuche in Python
FTS5 Volltextsucherweiterung für sqlite
Postgresql Volltextfeature
MariaDB Volltextfeature
zombodb
Variable byte encoding
TREC Conference series
BM25 / Okapi
PageRank
RediSearch Volltexterweiterung für redis
Learning to rank
NDCG, MAP, ERR
Django Postgres full text search
Picks
The Algorithms python
read json directly in python: Armin Ronacher's tweet
Python Entwicklungsumgebung Windows
Tutorial: pyenv installation mit powershell