11. Februar 2011 09:16
Hallo Leute
Unsere DB hat ca 13000 Kontakte und 13000 Firmen, ist somit ca 1.5GB gross. Da unser CRM relativ neu ist, wollte ich die Datenqualität mit der Duplikateerkennung optimieren. Ich habe eine Regel gemacht für "Gleiche Firmen mit gleicher Postleitzahl". Das Erkennen von einer beschränken Anzahl Firmen (z.B. alle die mit A beginnen =>1000Firmen) funktioniert einwandfrei. Die Erkennung dauert dann 1-3 Minuten und findet 24 Duplikate, also 12 Firmen.
Wenn ich aber die Regel auf alle Firmen anwenden will, ist der Job ewig in Bearbeitung (z.B. gestern um 13:05 gestartet; heute um 08:00 immer noch nicht fertig). Ich finde verdächtig, dass bei "Gestartet bei" immer die Matchcode-Aktualisierungszeit steht. So wie ich die Lage interpretiere, startet der Job immer wieder, wenn die Matchcode-Aktualisierung gemacht wird (alle 5 Minuten).
Habt Ihr auch schon so komische Erfahrungen gemacht und gibts eine Lösung? Natürlich kann ich alle Firmen nach Anfangsbuchstaben abarbeiten, aber mich reizt die automatische Version schon ein bisschen mehr...
Lieber Gruss
Zuletzt geändert von beco am 1. April 2011 07:46, insgesamt 1-mal geändert.