Tags werden grundsätzlich in englischer Sprache angelegt ("Primärtags"). Ausnahmen sind die Tags umlaut, eszett, kurrent, suetterlin, was in der Natur dieser Begriffe liegt. Der Tag sein-or-haben ist eine Mischung aus deutschen und englischen Bestandteilen. Die Tags duden, heidegger sind deutsche Eigennamen und nehmen eine Sonderrolle ein. Ich schlage die Löschung von heidegger vor (ist viel zu speziell).
Zu vielen Primärtags gibt es zusätzlich deutsche Synonyme. In einigen kommen Umlaute vor, die allerdings uneinheitlich wiedergegeben werden. Hier eine (hoffentlich) vollständige Liste:
zahlbarkeit
hoflichkeit
worterbucher
grazismus + graezismus
ubersetzung + uebersetzung
aufzaehlung
frageworter + fragewoerter
anfuehrungszeichen
falle [besonders schlecht, weil Fälle und Falle denkbare Interpretationen sind]
ausdrucke
suetterlin
prateritum
unzahlbar
grossschreibung
Meiner Meinung nach sollten die Umlaute ä, ö, ü grundsätzlich durch ae, oe, ue und nicht durch a, o, u dargestellt werden (ebenso wie �� durch ss ersetzt wird). Allerdings ergibt sich dadurch ein Problem mit der Suchfunktion: Die Umlaute werden intern durch a, o, u ersetzt. Z.B. findet man bei Eingabe von "Übersetzung" nur den Tag "ubersetzung" und nicht den Tag "uebersetzung".
Bei konsequenter Verwendung von ae, oe, ue müsste also dem Suchenden bekannt sein, dass er Umlaute dadurch zu ersetzen hat. Davon kann man leider nicht ausgehen.
Ein ähnliches Problem entsteht bei konsequenter Verwendung von a, o, u. Hier scheitert die Suche, falls der Suchende von sich aus Umlaute durch ae, oe, ue ersetzt.
Ich sehe daher nur zwei Lösungen:
Für jeden Tag mit Umlaut werden zwei Tags angelegt (wie bei ubersetzung + uebersetzung) und dem englischen Primärtag als Synoynm zugeordnet.
Für jeden Tag mit Umlaut wird ein Tag mit dem Schema "uebersetzung-alias-ubersetzung" o.ä. angelegt.
Ich schlage Variante 2 vor.
Sichtbar sind die Alternativnamen der Tags nur bei den Vorschlägen, wenn die Nutzer sie eingeben: