Der Menüpunkt »Optionen« - »HTML-Optionen..« steht nur im erweiterten Modus zur Verfügung.
Er ist zwischen den Trennstrichen angeordnet, da er das Ergebnis des Indexlaufes beeinflußt.
Eine HTML-Datei muß die folgenden Bedingungen erfüllen, um als solche erfaßt zu werden:
- ihre Endung muß ».htm« oder ».html« lauten, und
- sie muß ein öffnendes Body-Tag »<body>« enthalten.
Weitere Prüfungen finden nicht statt, also auch nicht auf z.B. »<html>«, »<title>«, »</body>« etc.
Wenn ein schließendes body-tag »</body>« gefunden wird, hört dort die Erfassung auf und alles, was möglicherweise noch folgt, wird ignoriert.
Weiterhin gilt, daß Text zwischen »<script>« und »</script>« nicht erfaßt wird.
Normalerweise ist die Option »NOFRAMES/TITLE Tags bei der Indizierung berücksichtigen« abgewählt:
Wenn sie angewählt sein sollte (erkennbar am vorangestellten Häkchen), wird auch derjenige Text, der innerhalb der Bereiche
- »<title>« bis »</title>« bzw.
- »<noframes>« bis »</noframes>«
steht, mit erfaßt.
Dies ist im allgemeinen aus folgenden Gründen unerwünscht:
- Der Bereich zwischen »<title>« und »</title>« wird zwar von Browsern als Titelzeile angezeigt, er kann aber im Allgemeinen nicht vom Cursor angesprungen werden.
- Ein »noframes«-Bereich wird von einem Frame-fähigen Browser normalerweise nicht angezeigt; dies kann dazu führen, daß ein in FindWord angeklicktes Wort im Browser nicht dargestellt wird, so daß der Anwender einen Fehler in FindWord vermuten könnte, der gar nicht vorliegt.
- Besonders auffällig ist dieser Effekt, wenn der HTML-Programmierer durch einen Trick versucht, ein höheres Rating in den Suchmaschinen zu erreichen: in diesem Fall wird der »noframes«-Bereich dadurch mißbraucht, daß er schlicht und einfach durch hunderte von Begriffen gefüllt wird, die von den Suchmaschinen verarbeitet werden, ohne daß der Benutzer von diesen Worten weiß, da sie von seinem Frame-fähigen Browser nicht dargestellt werden.