[Home]Austausch Format Diskussion

StartSeite | Neues | TestSeite | Teilnehmer | Projekte | Kategorien | Index | Einstellungen | Ändern

Siehe AustauschFormat AustauschFormatBeispiel

Kurze Übersicht der Austauschformat-Abschnitte:

[definitions]
...
[type of words]
...
[type of rules]
...
[type of dialects]
...
[local attributes]
...
[global attributes]
...
[classified words]
...

Daraus ergeben sich einige Fragen.


Frage
Ist die Abfolge fix? Können sich Abschnitte wiederholen? --hl

Antwort
Nein, die Abschnitte können beliebig angeordnet sein. Auch können sich die Abschnitte wiederholen. --rae

Grund 1: Eine fixe Abfolge ist im Datenaustausch einfacher zu handhaben.

Grund 2: Bei freier Abfolge könnte ein Kürzel als Feldinhalt auftauchen, bevor es definiert ist.

Antwort
Grund 1
bei fixer Abfolge wären der Datenaustausch zwar einfacher zu handhaben, aber ich befürchte, daß man dadurch etwas an Flexibilität einbüßt.
Grund 2
Das Problem kann über Plausibilitätskontrollen beseitigt werden.

Die freie Abfolge resultiert u.a. daraus, daß man die Daten auch in mehreren Portionen in das System einspeisen können soll. Da ich z.B. die Daten in zwei Durchgängen lese, gab es bisher keine Probleme --rae

Frage
Benötigt man ein einheitliches Kürzelsystem? Wenn ja, warum ist es dann im Austauschformat vorgesehen? Wenn nein, was soll passieren, wenn verschiedene Systeme miteinander kommunizieren, die z.B. unterschiedliche Kürzel verwenden? --hl

Antwort
Die Kürzel müssen einheitlich sein, da diese in der zentralen Wort-Basis verwendet werden. Bei diesen Kürzeln wollte ich mich an linguistische Gepflogenheiten halten, die ich als linguistische Laie allerdings nicht kenne. Die Langtexte sind für die Anwender gedacht. Während s, v, ... noch relativ allgemeinverständlich sind, sind Kürzel wie z.B. so schon erklärungsbedürftig. Diese Erklärungen sollten in der Muttersprache stattfinden, damit die Wahrscheinlichkiet der Fehlinterpretation verringert wird. --rae


Frage
Soll die Datenbank die Kürzel oder die Langtexte unterstützen? --hl

Antwort
Die Kürzel sind für die interne Repräsentation der Datenbanken gedacht und die Langtexte für die Ausgaben der Frontends --rae


Frage
Wo werden eigentlich die definierten Dialekte/Dialektkürzel benutzt? Und warum gibt es dafür einen eigenen Abschnitt? --hl

Antwort
Die Dialekte werden in den Einträgen im Bereich classified words verwendet. Da diese sprachspezifisch sind und frei definiert werden können, haben sie einen eigenen Abschnitt. Man könnte zwar die Dialekte auch direkt in die Einträge schreiben, aber durch die Verwendung von Kürzeln mpöchte ich eine definierte Schreibweise erzwingen, da diese Information später eventuell maschinell ausgewertet werden könnte. In diesem Fall würden sich Schreibfehler über die Gebühr stark auswirken. Dieses Problem wird durch den Einsatz der Kürzel als Kontrollinstrument beseitigt. --rae

Frage
Was ist mit anderen Wortarten (Vorwörter, etc.)? --hl

Antwort
Einige Wortarten, wie z.B. die Artikel, sehe ich als Bestandteil der Worte selbst an. Diese sollten daher nicht aufgeführt werden. Die anderen müssen natürlich selbstverständlich aufgenommen werden. --rae


Frage
Sind die Felder ru: und de: irgendwo erklärt? --hl

Antwort
Das Feld wurde in Verbindung mit br erklärt, da die Syntax identisch ist. Die Description de? Siehe mal unter DefinierteElemente nach. So etwa in der Mitte. --rae


Frage
Kann man bei WikiWeb eigentlich auf einen Teil einer Seite referenzieren? --rae

Antwort
Leider nicht. --hl

Frage
Wäre es denkbar, Clifford Adams einen entsprechenden Vorschlag zu machen? Ich denke nicht, daß ein Verweis in der Art DefinierteElemente->de Probleme bereiten würde. --rae

Antwort
Im Prinzip wäre ich jetzt selbst dazu in der Lage. Du brauchst also nur mich zu überreden. Gib es auf die Seite SupportWiki:WikiAnregungen. --hl


Ich muss zugeben, noch ziemlich im Dunkeln zu tappen. Im Moment kommt mir das ganze weniger wie ein Austauschformat vor, sondern quasi wie eine Serialisierung eines Datenbankobjektes (um es einmal geschwollen auszudrücken). Besonders verwirren mich die verschiedenen Abkürzungen einerseits für Feldnamen (z.B. ty), andererseits für Feldinhalte (z.B. mo) und für Strukturen innerhalb von Feldern und die Syntax, wie das definiert wird. Unter Umständen würde ein komplettes AustauschFormatBeispiel mir beim Verständnis helfen. -- HelmutLeitner

Im Prinzip ist es ja auch die Serialisierung der Datenbank. Ich verwende das Format z.Zt. für die Übermittlung von Korrekturen und die Importieren der Daten in das System.

Es kann sein, daß die Irritation daher rührt, daß die Informationen in der Datei nicht rein Wortspezifisch zu sehen sind, sondern daß auch Informationen für Frontends untergebracht wurden. Ein älteres Beispiel ist ja bereits vorhanden. Das neue kommt am Wochenende per Mailing-Liste. -- RalfEbert


Frage
Was bedeutet der CRC-Code am Anfang der Datei (in [definitions])? Eine Checksumme über die gesamten Daten? Warum ist sie dann am Anfang und nicht am Ende? --hl
Antwort
Die Checksumme steht in dem Bereich definitions, weil dort alle Ausdrücke mit einem = zusammengefaß sind. Wo dieser Bereich im Text liegt, ist im Prinzip egal --rae

Frage
Was wäre der Unterschied (siehe AustauschFormatBeispiel) zwischen:

adj, basic, Klasse, 6, or, im, at, va, qu, be, Art, 3, at, pr, ad
adj, or, Orientierung
adj, im, Eindruck
adj, ei, Eigenschaft
adj, va, Wertbegriff
adj, qu, Eignung
adj, be, Verhalten
adj, at, Attributiv
adj, pr, prädikativ
adj, ad, adverbial

und

adj, basic, Klasse, 6, or, im, at, va, qu, be,
adj, or, Orientierung
adj, im, Eindruck
adj, ei, Eigenschaft
adj, va, Wertbegriff
adj, qu, Eignung
adj, be, Verhalten
adj, basic, Art, 3, at, pr, ad
adj, at, Attributiv
adj, pr, prädikativ
adj, ad, adverbial

?

Antwort
Der Unterschied liegt darin, daß jedes Kürzel immer nur einmal pro Worttyp verwenden werden darf und ich die Daten nach dem basic als langen Text interpretiere, der nur vom Frontend ausgewertet wird. Ein automatisches Anhängen an einen bereits bestehenden Eintrag wäre eine unötige Fehlerquelle. --rae

Frage
Wäre nicht so etwas:

adj.Felder:Klasse,Art
adj.Klasse:or=Orientierung
adj.Klasse:im=Eindruck
adj.Klasse:ei=Eigenschaft
adj.Klasse:va=Wertbegriff
adj.Klasse:qu=Eignung
adj.Klasse:be=Verhalten
adj.Art:at=Attributiv
adj.Art:pr=prädikativ
adj.Art:ad=adverbial

einfacher und lesbarer? --hl

Antwort
Interessante Alternative --- müßte man sich mal durch den Kopf gehen lassen :-) . --rae

Frage
Warum sollen Daten (oder Dateien) mit fehlerhaftem CRC - also mit irgenwelchen Übertragungsfehlern - überhaupt interpretiert werden? Wäre es nicht besser, sie einfach abzuweisen?
Antwort
Z.B. weil es neue Daten sind?


Frage
Wie ist der CRC genau zu berechnen?
Antwort
Hm, schau mal in das Mail-Archiv vom 26. Oktober ... Alternativ lege ich die Funktion noch auf die Seite CyclicRedundancyChecksum.


Non german speakers can translate this page with 'babelfish', which can be found at http://babelfish.altavista.com/translate.dyn.
KategorieAustauschformat


StartSeite | Neues | TestSeite | Teilnehmer | Projekte | Kategorien | Index | Einstellungen | Ändern
Text dieser Seite ändern (zuletzt geändert: 16. Februar 2001 8:15 (diff))
Suchbegriff: gesucht wird
im Titel
im Text