StartSeite | Neues | TestSeite | Teilnehmer | Projekte | Kategorien | Index | Einstellungen | Ändern
Veränderung (letzte Änderung)
(Korrektur, Normalansicht)
Hinzugefügt: 57a58
*** Sorry Helmut, aber der Kommentar bezog sich auf die Anzahl der unbekannten Worte :-) --rae
|
Hinzugefügt: 60a62,66
*** Ich plädiere für mehrere Wörterbücher:
**** eines für jede Sprache
**** eines für zu ignorierende Worte
**** eines für Abkürzungen in jeder Sprache
*** Die Auswahl könnte ja per Pulldown-Menü (oder wie die Dinger auch immer heißen mögen) stattfinden, die jeder erweitern kann.
|
Verändert: 64c70,71
*** Vielleicht eine case-insensitive Prüfung? Die Großschreibung gilt eigentlich nur für ein paar 'Spezialfälle' und sollte daher einer integrierten grammatikalischen Prüfung vorbehalten sein. Falls Du case-sensitiv bleiben willst, solltest Du vielleicht das erste Wort eines Satzes als kleingeschrieben betrachten.
* Wäre es denkbar, die unbekannten Worte im Text selbst zu markieren?
|
Beim Lesen von RechtschreibKontrolle ist mir die Idee einer WikiRechtschreibKontrolle gekommen (bin selber anfällig auf Rechtschreibfehler). Man könnte einen Link z.B. "Kontrolle" auf die Seiten geben und mit folgender Logiik ausstatten:
- der Seiteninhalt wird in Worte zerlegt und in einer Hash-Tabelle A gespeichert (damit ist jedes Wort nur mehr einmal vorhanden).
- Eine aktuelle Wortliste wird aus einem oder mehreren Files (Deutsch, Englisch, Fachvokabel) ebenfalls in eine Hash-Tabelle B geladen.
- Nun werden alle Worte in A auf ihr Vorkommen in B überprüft. Jene, die vorkommen, sind ok. Jene, die nicht vorkommen, werden in ein listenartiges Formular verpackt und dem Benutzer zur Klassifikation angeboten.
- Der Benutzer kreuzt an, welche Worte ok sind (oder klassifiziert nach Deutsch, Englisch, ...) und schickt das Formular zum Aktualisieren der Wortliste ab.
- Die angeklickten Worte aktualisieren die Wortlisten.
So etwas wäre nicht sehr ausgefeilt, wäre aber mir beim Erstellen der vielen WikiWeb-Seiten dienlich und es würden, quasi als Abfallprodukt, Wortlisten entstehen.
--HelmutLeitner
Nun ja, etwas rudimentär, aber ein erster Ansatz. Willst Du das direkt in das Wiki integrieren oder willst Du warten, bis der Prototyp für die RechtschreibKontrolle existiert? -- RalfEbert
Nein, ich möchte damit nicht warten, weil ich jetzt täglich ca. 20-30 Beiträge schreibe. Und von den Rückmeldungen weiß ich, dass meine schludrige Rechtschreibung manche Leser unangenehm berührt. Ich möchte aber nicht Teilnehmer verlieren, die aus meiner mangelnden Aufmerksamkeit für Rechtschreibung auf Minderwertigkeit der Inhalte schließen. Es wäre deswegen für mich notwendig, das bis spätestens bis Mitte März zu realisieren. -- HelmutLeitner
Hm, gibt es Gell-Mann in einer derart großen Menge? Haben die Leute explizit gesagt, daß sie Abstand von dem Projekt nehmen, weil dort "so viele" Rechtschreibfehler sind? Bist Du sicher, daß Du nicht auf diese Leute verzichten kannst? Sind sie in der Tat so fähig/genial/talentiert, daß man eine derartige Einstellung akzeptieren muß? Ich gebe zu, ich reagiere ab und zu auch so --- aber ausschließlich bei Fachpublikationen oder Dienstleistungen. Ich will dir jetzt nicht die WikiRechtschreibKontrolle ausreden, da wir dadurch einen Prototypen für eine Rechtschreibkontrolle hätten. Hilft es dir, wenn ich dir den deutschen Teil meiner aktuelle Datenbasis gebe (ca. 3000 Grundworte, Qualitätsstufe 1)? Das ist zur Zeit meine Spielwiese für Deutsch-Latein. -- RalfEbert
Ja, Ralf, das würde mir sehr helfen. Damit spare ich mir sicher viele Stunden Arbeit. Willst du das ins Wiki uploaden (du hast ja einen Upload-Bereich) und stellen wir einen Link auf eine Resourcenseite oder ist es dir lieber, wenn das nicht frei abrufbar ist (dann schick mir bitte ein E-mail)? --HelmutLeitner
- Gegen eine Veröffentlichung habe ich natürlich nichts, aber es ist halt noch eine grobe Version, die man nicht zu weit herumreichen sollte, bevor ich nicht noch ein paar Tests gemacht habe und wir ein Konzept zur aktualisierung der Daten haben sowie eine zentrale Datenbank haben. Was den Upload angeht --- da gab es mal Probleme, aber ich probiere es nochmal aus. In welcher Form hättest Du es denn gerne? Austauschformat (dann hast Du auch gleich ein komplettes Beispiel) oder als reine Wortliste (mit der du entsprechend weniger Arbeit hast) oder beides? -- RalfEbert
...explizit...Abstand... Nein, so direkt nicht. Aber Jens Schweikhardt, einer der besten deutschen C-Kenner (3-maliger Gewinner des obfucated-C-Contest) hat mir befremdet auf einer Seite - die ich gerade hineingeklopft hatte - drei Fehler reklamiert. Und das hat mich nachdenklich gemacht. --hl
Nun ja, ich sehe das etwas 'lockerer' und nehme solche Effekte als Sieb ;-) --rae
...Austauschformat...Wortliste...oder beides... Wenn es dir keine zusätzliche Arbeit macht, dann bitte als Wortliste (oder beides). --hl
- würdest du eine Stunde als zusätzliche Arbeit bezeichnen? Die Ursache lag darin, daß die API noch nicht vollständig war (es fehlte mal wieder eine Funktion :-( ) und ich keine Dokumentation zu meinen Klassen habe.
- Tja, was will uns der freundliche Herr von nebenan damit sagen? ... -- rae
- Vielleicht solltest Du zum Upload auch '*.tgz' Dateien zulassen. Das Archiv kommt per Mail bei dir an.
*.tgz Was ist das für ein Format? Ich sollte das wahrscheinlich in "mime.types" (Apache) definieren, damit z.B. ein Binärformat nicht als Text am Bildschirm landet... --hl
- '.tgz' ist die Kurzform für '.tar.gz'. Es sollte bei Apache eigentlich bereits bekannt sein, da diese Form, so weit ich das bisher sehe, durchaus ueblich ist. --rae
Es gibt jetzt der ersten, kleinen experimentellen Ansatz, der noch eine Menge offener Punkte aufweist (offen sind die Funktionen nur im FreeDictWiki, bzw. für speziell berechtige Benutzer in anderen Wikis).
Funktionen:
- Am Fuße jeder Seite ein Link "RSK". Hier können nicht erkannte Wörter hinzugefügt werden.
- Am Fuße von "Einstellungen" ein Link "Wörterbuch". Hier können Wörter gelöscht werden.
Aktuelle Probleme:
- Die effiziente Zerlegung des Seiteninhaltes in Worte (ohne Urls etc.)
- Die Groß/Kleinschreibung zu analysieren und im Wörterbuch abzubilden.
- Die Wörter in unterschiedliche Wörterbücher aufzuteilen (eventuell Deutsch, Englisch, Fachwörterbuch)
- Hauptproblem: die ansprechende Gestaltung der dazu notwendigen UIs.
Spezielle Probleme:
- Fremd- und Fachwörter können sehr Themenspezifisch sein (z.B. je nach Wiki oder Anwendung). Wie könnte man dem Benutzer die Auswahl und Navigation bei den Wörterbüchern ermöglichen?
- Es gibt Wörter (wie Variablennamen), die keine übergeordnete Bedeutung haben, die also auch in einem Projektwörterbuch keinen Sinn hätten. Diese tauchen aber notgedrungen beim Kontrollieren einer Seite immer wieder auf. Eigentlich bräuchte man hierfür ein seitenbezogenes "Ignorier-Wörterbuch". ?
Fürs Testen, Tipps und Anregungen wäre ich sehr dankbar! -- HelmutLeitner
- Laß mich mal raten --- du hast es für diese Seite noch nicht ausprobiert, oder?
- Natürlich habe ich es ausprobiert und die gleichen Probleme wie du, teilweise ja oben beschrieben. Aber derzeit keine Idee, wie die am besten zu lösen sind. Deswegen das "Posten" dieser experimentellen Version.
- Sorry Helmut, aber der Kommentar bezog sich auf die Anzahl der unbekannten Worte :-) --rae
- Sollen nur deutsche Worte ins Wörterbuch oder auch die Worte in den anderen Sprachen?
- Das möchte ich von euch wissen. Es können auch 2 oder mehr Wörterbücher sein.
- Ich plädiere für mehrere Wörterbücher:
- eines für jede Sprache
- eines für zu ignorierende Worte
- eines für Abkürzungen in jeder Sprache
- Die Auswahl könnte ja per Pulldown-Menü (oder wie die Dinger auch immer heißen mögen) stattfinden, die jeder erweitern kann.
- Ich tue mich etwas schwer, Worte wie 'Aber' in das Wörterbuch aufzunehmen.
- Ich mir auch. Siehe obige Frage nach geeigneter UI-Gestaltung.
- Vielleicht eine case-insensitive Prüfung? Die Großschreibung gilt eigentlich nur für ein paar 'Spezialfälle' und sollte daher einer integrierten grammatikalischen Prüfung vorbehalten sein. Falls Du case-sensitiv bleiben willst, solltest Du vielleicht das erste Wort eines Satzes als kleingeschrieben betrachten.
- Wäre es denkbar, die unbekannten Worte im Text selbst zu markieren?
--rae
StartSeite | Neues | TestSeite | Teilnehmer | Projekte | Kategorien | Index | Einstellungen | Ändern
Text dieser Seite ändern (zuletzt geändert: 25. März 2001 22:02 (diff))