GOOGLE ADS

Mittwoch, 20. April 2022

Ist es möglich, T-SQL-Fuzzy-Lookup ohne SSIS durchzuführen?

SSIS 2005/2008 führt unscharfe Suchen und Gruppierungen durch. Gibt es eine Funktion, die dasselbe in T-SQL tut?


Lösung des Problems

Die Fuzzy-Suche verwendet einen Q-Gramm-Ansatz, indem Zeichenfolgen in winzige Unterzeichenfolgen zerlegt und indiziert werden. Sie können dann die Eingabe durchsuchen, indem Sie sie in gleich große Zeichenfolgen aufteilen. Sie können das Format ihres Index überprüfen und eine CLR-Funktion schreiben, um denselben Indexstil zu verwenden, aber Sie sprechen möglicherweise von einem ziemlichen Stück Arbeit.

Es ist eigentlich ziemlich interessant, wie sie es gemacht haben, sehr einfach, bietet aber eine sehr robuste Anpassung und ist sehr konfigurierbar.

Soweit ich mich an den Index erinnere, als ich ihn mir das letzte Mal angesehen habe, wird jedes Q-Gramm oder jede Teilzeichenfolge in einer Zeile in einer Tabelle (dem Index) gespeichert. Diese Zeile enthält eine nvarchar-Spalte (neben anderen Werten), die als Binärdaten verwendet wird und Verweise auf die übereinstimmenden Zeilen enthält.

Es gibt auch einen offenen Feedback-Vorschlag auf Microsoft Connect für diese Funktion.

Keine Kommentare:

Kommentar veröffentlichen

Warum werden SCHED_FIFO-Threads derselben physischen CPU zugewiesen, obwohl CPUs im Leerlauf verfügbar sind?

Lösung des Problems Wenn ich das richtig verstehe, versuchen Sie, SCHED_FIFO mit aktiviertem Hyperthreading ("HT") zu verwenden, ...