chris
Guest
|
 |
Neue Suchfunktion? Wer hat Lust?
« on: February 03, 2003, 04:13:22 PM » |
|
Da ich momentan für ein anderes Projekt *hüstel* ein paar Routinen schreibe, wollte ich mal fragen ob einer der üblichen Verdächtigen Lust hat, die Suchfunktion zu verbessern. Konkret sind das Routinen die einen Suchindex anlegen. Um genau zu sein gibt es 2 neue Tabellen. In einer stehen alle Wörter die im Forum vorkommen und in der zweiten Tabelle steht welches Wort wie oft in welchem Posting vorkommt... Das Ganze erzeugt zwar einen grossen Index, den kann man dann aber schneller durchsuchen als bisher  Problematisch wäre, dass jemand die Suchlogik bauen muss. Die Routinen zum indizieren von Postings bastel ich gerade... sie erzeugen das Wörterbuch, die Indizes und können auch Postings wieder aus dem Index & Wörterbuch entfernen... Wenn jemand Lust hat.... man sollte Ahnung von SQL haben und sich mit dem Code von YaBB generell auskennen.
|
|
|
Logged
|
|
|
|
|
chris
Guest
|
 |
Re:Neue Suchfunktion? Wer hat Lust?
« Reply #2 on: February 04, 2003, 11:20:14 AM » |
|
Hmm... ok... mal sehen was daraus wird....
Die Index-Routinen hab ich mittlerweile fertig. Sie fügen einzelne Messages oder ganze Threads zum Index hinzu und können auch Threads/Messages wieder aus dem Index rausnehmen. Dabei wird auch das interne Wörterbuch aktuell gehalten, so dass da wenig Müll drinne sein sollte.
Ich muss nur mal testen wie sich die Index-Grösse bei grossen Boards verhält....
Werde dazu ein Testprogramm schreiben und es auf einen grossen Datenbestand ansetzen ... und ich weiss auch schon wer mein Opfer dafür sein wird *zu Eloya grins*
|
|
|
Logged
|
|
|
|
|
chris
Guest
|
 |
Re:Neue Suchfunktion? Wer hat Lust?
« Reply #4 on: February 05, 2003, 09:43:43 AM » |
|
*grummel* *motz* Hab gestern die Routinen auf einer grossen DB getestet... momentan sind die Routinen leider noch SEHR übel  Ich muss nochmal Einiges da überdenken... ich werde aber wohl heute Abend oder morgen die routinen posten die ich bisher habe... vllt hat ja dann jmnd Lust was damit zu tun *g*
|
|
|
Logged
|
|
|
|
|
chris
Guest
|
 |
Re:Neue Suchfunktion? Wer hat Lust?
« Reply #6 on: February 07, 2003, 08:28:32 AM » |
|
Ja... sorry, Nico  Mein kleiner 1 GHz Athlon zuhause hat 1 Stunde lang gearbeitet gehabt und dann gerade mal die Hälfte meiner 30 MB DB indiziert gehabt.... *grummel* Also wieder von vorne :-/
|
|
|
Logged
|
|
|
|
|
|
chris
Guest
|
 |
Re:Neue Suchfunktion? Wer hat Lust?
« Reply #9 on: February 11, 2003, 11:54:03 AM » |
|
Quote from: Blacky on February 07, 2003, 06:54:32 PM Anregung:
Habt ihr an eine Stopwordliste gedacht ? D.h. eine Liste der Wörter, die nicht indiziert werden sollen - ansonsten könnte ich mir vorstellen, dass jeder Server in die Knie geht, wenn auch Wörter wie "ich", "du", "der", "ein" (die in 90% der Postings vorkommen) indiziert werden.
Jein... daran gedacht hatte ich, aber noch nicht eingebaut (wobei Deine Beispiele eh rausfallen *g* alles mit <4 Buchstaben fliegt automatisch raus) ... hab das mal nachgeholt.... Ergebnis: aus einem 350 KB Testtext (Buch Genesis aus der Bibel und das Umsatzsteuergesetz... fragt nicht! *lach* Sind 2 Referenztexte die das Crypt-Tool der Deutschen Bank benutzt und die einzigen GROSSEN Textfiles die ich hier hatte) wurde eine 60 KB Wortliste.... Das sieht schonmal besser aus als vorher *g* Ich hab die Routinen ein bisschen geändert die die Texte in Wörter aufsplitten und unnötige Zeichen entfernt.... Die aktuelle Stopword-Liste (auf die sich nun die armen phpBB2 User stürzen werden die keine deutsche Liste finden können *muahahahaha*) sieht so aus: Quoteaber allein also auch ausser außer bald beim bisschen bist bißchen dabei dadurch dadurch dafuer dafür dagegen daher dahinter damit danach daneben dann daran darauf daraus darin darueber darum darunter darüber dass dasselbe davon davor dazu dazwischen dein deine deinem deinen deiner deines demselben denn derselben desselben dessen dich dies diese dieselbe dieselben diesem diesen dieser dieses doch dort ebenso eine einem einen einer eines entlang etwa etwas euch euer eure eurem euren eurer eures fuer fuers fürs ganz gegen genau gewesen herein herum hinter hintern ihnen ihre ihrem ihren ihrer ihres jedesmal jedoch jene jenem jenen jener jenes kaum kein keine keinem keinen keiner keines mehr mein meine meinem meinen meiner meines mich nach nachdem naemlich neben nein nicht nichts noch nämlich ober obgleich oder ohne paar sehr sein seine seinem seinen seiner seines seit seitdem selbst sich sind sogar solch solche solchem solchen solcher solches sondern sonst soviel soweit ueber unser unsre unsrem unsren unsrer unsres waehrend waere waeren warum wegen weil weit welche welchem welchen welcher welches wenn weshalb wessen wird womit wurde während wäre wären zwar zwischen zwischens über
|
|
|
Logged
|
|
|
|
|
|
|
|
chris
Guest
|
 |
Re:Neue Suchfunktion? Wer hat Lust?
« Reply #14 on: March 18, 2003, 01:45:08 PM » |
|
OK, das ganze Vorhaben ist in die Tonne gewandert *g*
Ich hab momentan weder Zeit noch nerv mich damit auseinanderzusetzen.....
Nico hat von mir noch ein paar Infos bekommen, falls er sich selber dranmachen will ne bessere Suche einzubauen... *g*
|
|
|
Logged
|
|
|
|