Unterdrücken unsinniger Worte
In jedem Datenbestand kommen unsinnige Worte vor. Die häufigste Quelle sind eingescannte und per OCR in Text umgewandelte Dokumente. Manchmal liegt die Ursache auch an fehlerhaften pdf-Konvertern oder an Abstürzen.
Da eine herkömmliche Suchmaschine den Wortbestand nicht anzeigt, fallen unsinnige Worte dort auch nicht auf. FindWord zeigt alle vorkommenden und somit auch unsinnige Worte an. Normalerweise kann man letztere einfach ignorieren. Wenn sie trotzdem stören, gibt es mehrere Möglichkeiten, damit umzugehen:
- Im Allgemeinen stehen die meisten Unsinns-Worte am Anfang der Wortliste. Daher markiert FindWord beim Laden eines Indexes nicht das erste vorkommende Wort, sondern das erste, das mit drei zusammenhängenden Buchstaben beginnt.
- Auf Wunsch kann FindWord auch wie eine herkömmlich Suchmaschine bedient werden, indem die Wortliste ignoriert wird und alle Worte über die Eingabezeile eingegeben werden. Dann stören keine unsinnigen Worte mehr, aber dann gilt auch die Treffergarantie nicht mehr: wenn ein nicht vorkommendes Wort eingetippt wird, gibt es auch keinen Treffer.
- Normalerweise können Sie unsinnige Worte einfach ignorieren.
Wenn sie trotzdem stören, können Sie sie über einen kleinen Trick aus einem Index
entfernen:
- Zuerst exportieren Sie mittels »Optionen« – »Export« die aktuelle Wortliste in eine Text-Datei (siehe Funktionen > Weitere Funktionen > Wort- / Dateiliste exportieren).
- In dieser Textdatei markieren Sie die meist in Blöcken
vorkommenden unerwünschten Worte und kopieren Sie sie in die Wortausschluss-Datei
C:\Program Files (x86)\FindWord\ANTIWORD.TXT bei Win 7 / Vista, bei Win XP
C:\Programme\FindWord\ANTIWORD.TXT. - Nun legen Sie Ihren Index einfach nochmals neu an und kreuzen dabei das Kästchen »Triviale Worte ignorieren« an. Dann erscheinen die unerwünschten Worte nicht mehr in der Wortliste.