[Home]Austausch Format Beispiel

StartSeite | Neues | TestSeite | Teilnehmer | Projekte | Kategorien | Index | Einstellungen | Ändern

Hier befindet sich ein kommentiertes Beispiel für das Austausch-Format.

Im folgenden wird der Name der Sprache als german angegeben, der verwendete Zeichensatz ist ASCII-8.

[definitions]
language=german
characterset=ASCII-8

Enthält die Datei Referenzen auf Worte einer Fremdsprache, wird diese Sprache mitsamt dem verwendeten Zeichensatz ebenfalls angegeben. Die Variable characterset bezieht sich immer auf die zuletzt angegebene Sprache.

[definitions]
language=german
characterset=ASCII-8
foreignLanguage=english
characterset=ASCII-7

Bei den Worttypen muß das Kürzel unabhängig von der beschriebenen Sprache sein, da über das Kürzel die zentrale Klassifikation der Basisworte geschieht. Daher sollten international übliche Kürzel verwendet werden. Die ausgeschriebene Version ist der Name des Worttyps in der in language angegebenen Sprache, damit diese Namen für Frontends in der jeweiligen Muttersprache des Benutzers angezeigt werden können.

[type of words]
adj, Adjektive
adv, Adverb
v, Verb
s, Substantiv

Unter Dialekte fallen alle Sprachen, die einer zentralen Sprache stark ähneln. Hierbei wird zur Zeit keine besondere Rücksicht auf Länder genommen. So wird z.B. östereichisch als deutscher Dialekt angesehen --- allerdings kann man genausogut sagen, daß deutsch ein östereichischer Dialekt ist. Die Zuordnung hängt einfach davon ab, daß meine Muttersprache nunmal deutsch ist. So werden z.B. das amerikanische und kanadische Englisch auch als Dialekt vom britischen Englisch angesehen. Hier sind sowohl die Kürzel als auch die Umschreibung absolut frei wählbar, da sie keine zentrale Verwendung finden.

[type of dialects]
ö, östereichisch
s, schweizerisch
b, bayrisch

Die Regeln geben an, wie ein Basiswort in die verschiedenen Beugungsformen überführt werden kann. Hierbei gibt es zwei spezielle Einträge: basic und order.

Die Regel basic gibt an, wie die geberierten Worte in einem Frontend tabellarisch dargestellt werden können.

[type of rules]
# Die Nomen sind im Moment durch die vier möglichen Fälle 
# erfasst, wobei es für jedes Geschlecht eigene Regeln gibt.
#
s, basic, 4, 2, Singular, Plural, Nominativ, Genitiv, Dativ,\
                Akkusativ

order gibt an, welche Form der Beugung an welcher Stelle der Regel steht.

s, order, s1, s2, s3, s4, p1, p2, p3, p4

#  maskulin 1
#    Rabatt -> Rabatt, Rabatte
#
#              | Singualar      | Plural       |
#  | Nominativ | der Rabatt     | die Rabatte  |
#  | Genitiv   | des Rabatt(e)s | der Rabatte  |
#  | Dativ     | dem Rabatt(e)  | den Rabatten |
#  | Akkusativ | den Rabatt     | die Rabatte  |
#
s, maskulin 1, der %0, des %0s|des %0es, dem %0!dem %0e, den\
               %0, die %1, der %1, den %1n, die %1
#  maskulin 2
#    Mantel -> Mantel, Mäntel
#
#              | Singualar   | Plural      |
#  | Nominativ | der Mantel  | die Mäntel  |
#  | Genitiv   | des Mantels | der Mäntel  |
#  | Dativ     | dem Mantel  | den Mänteln |
#  | Akkusativ | den Mantel  | die Mäntel  |
#
s, maskulin 2, der %0, des %0s, dem %0, den %0, \
               die %1, der %1, den %1n, die %1
#  maskulin 3
#    Bube -> Bube, Buben
#
#              | Singualar | Plural    |
#  | Nominativ | der Bube  | die Buben |
#  | Genitiv   | des Buben | der Buben |
#  | Dativ     | dem Buben | den Buben |
#  | Akkusativ | den Buben | die Buben |
#
s, maskulin 3, der %0, des %0n, dem %0n, den %0n, \
               die %1, der %1, den %1, die %1
#  maskulin 4
#    Bazi -> Bazi, Bazis
#
#              | Singualar | Plural    |
#  | Nominativ | der Bazi  | die Bazis |
#  | Genitiv   | des Bazis | der Bazis |
#  | Dativ     | dem Bazi  | den Bazis |
#  | Akkusativ | den Bazi  | die Bazis |
#
s, maskulin 2, der %0, des %0s, dem %0, den %0, \
               die %1, der %1, den %1n, die %1

Die lokalen Attribute beziehen sich auf Eigenschaften der Worte, die abhängig von der Sprache sind, wie z.B. das Geschlecht bei Substantiven. Aus diesem Grund muß nur der Worttyp mit den zentralen Kürzeln bezeichnet werden, die Kürzel für die Attribute können frei gewählt werden. Der basic-Eintrag organisiert dabei die Ausgabe der Attribute in einem Frontend.

[local attributes]
s, basic, geschlecht, 3, m, f ,n
s, m, männlich
s, f, weiblich
s, n, sächlich

Da die globalen Attribute im Gegensatz zu den lokalen Attributen die zentralen Eigenschaften des Wortes beschreiben, müssen diese Kürzel ebenfalls in allen Sprachen gleich verwendet werden. Daher sollten die Kürzel international gebräuchlich sein. Der basic-Eintrag organisiert dabei die Ausgabe der Attribute in einem Frontend.

[global attributes]
s, basic, Art, 1, ab, Begriff, 1, na, Inhalt, 7, ac, re, mi,\
          ak, at, co, sm, Numerus, 3, so, po, sp
s, ab, abstrakt
s, na, Eigenname
s, ac, Aktion
s, re, Ergebnis
s, mi, Mittel
s, ak, Handelnder
s, at, Eigenschaft
s, co, Sammelbezeichner
s, sm, Verkleinerung
s, so, nur Einzahl
s, po, nur Mehrzahl
s, sp, Ein- und Mehrzahl
v, basic, Art, 5, st, wo, ac, ma, ev, Form, 3, tr, it, re,\
          Typ, 1, vv, Abart, 1, mo
v, st, Zustand
v, wo, Tätigkeit
v, ac, Vorgang
v, ma, Handlung
v, ev, Ereignis
v, tr, transitiv
v, it, intransitiv
v, re, reflexiv
v, mo, modal
v, vv, Vollverb
adj, basic, Klasse, 6, or, im, at, va, qu, be, Art, 3, at, pr, ad
adj, or, Orientierung
adj, im, Eindruck
adj, ei, Eigenschaft
adj, va, Wertbegriff
adj, qu, Eignung
adj, be, Verhalten
adj, at, Attributiv
adj, pr, prädikativ
adj, ad, adverbial
adv, basic, Typ, 9, mo, te, lo, ca, co, ko, fi, cc, in
adv, mo, modal
adv, te, temporal
adv, lo, lokal
adv, ca, kausal
adv, co, Bedingt
adv, ko, Kongetiv
adv, fi, Final
adv, cc, Konzesiv
adv, in, Instrumental

[classified words]
#
# durch die Regeln bei 'br' wird das Basiswort zu der Wortliste
#
#    aufgeben, gibt auf, gab auf, aufgegeben
#
# transformiert
#
wo: aufgeben|ty: v|br: %0, 3%gibt ~3%0, 3%0gab ~3%0,\
    ~3%0ge3%0|ru: zusamengesetzte Verben 32
#
# Das Wort 'Schafpelz' hat die Alternative 'Schafspelz'
#
wo: Schafpelz/Schafspelz|ty: s|la: m/m|br: %0, %0e/%0, %0e|ru:\
    maskulin 1/maskulin 1
#
# anstelle des Wortes 'sprießen' wird manchmal auch 'sprossen'
# benutzt.
#
wo: sprießen/sprossen|ty: v|br: %0, spriest, sproß,\
    gesprossen/%0, %02t, %02te, ge%0|ru: static 1/static\
    2|de: Keimen oder Wachtum einer Pflanze
wo: Gauner/Spitzbube|ty: s|la: m/m|br: %0, %0/%0, %0n|ru: maskulin 2/maskulin 3

Da der östereichische Begriff Bazi nur in einem bestimmten Kontext für Gauner benutzt wird, kann er nicht direkt als Synonym aufgeführt werden

wo: Bazi|ty: s|la: m|di: ö|br: %0, %0s|ru: maskulin 4|de: scherzhafter Ausdruck für Gauner


Schön langsam wird mir manches klarer, aber (--hl):


Frage
Wo definierst Du das Feld "la"?
Antwort
siehe unter DefinierteElemente, etwas oberhalb von der Mitte.
la enthält die sprachspezifischen Eigenschaften eines Wortes, die z.B. das Geschlecht des Nomens
ga enthält die Eigenschaften des Basiswortes, z.B. das ein Verb intransitiv ist. --rae


Frage
Wie ist die Zeile "wo:Gauner..." zu interpretieren? Werden da zwei Worte in einer Zeile definert?
Antwort
Das ist die Art und Weise, wie ich im Moment Synonyme angebe, die ich in ihrer Gesamtheit als unterschiedliche Schreibweisen für ein Wort ansehe. Darunter fallen also reine Abwandlungen wie z.B. Schaf(s)pelz, aber auch komplett andere Schreibweisen wie Gauner, Ganove, ..., Spitzbube --rae


Frage
Gibt es im Abschnitt [classified words] noch andere Datensätze als "wo"? Wenn ja, welche? Wenn nein wäre "wo:" redundant und könnte weggelassen werden.
Antwort
Es gibt keinen Datensatz 'wo'. Ws gibt nur Datensätze, die ein Feld enthalten, das durch die Bezeichnung wo spezifiziert ist und die Schreibweise(n) des Basiswortes in der entsprechenden Sprache angibt. Da der Inhalt dieses Feldes, genau wie die Felder ty, br und ru, das jeweilige Wort sehr genau beschreibt, kommt dieser Eintrag natürlich auch sehr häufig vor. :-)

D.h. die Reihenfolge der Felder ist unspezifiert? Bestimmte Felder sind obligatorisch (z.B. wo), andere Felder sind aber nur in Abhängigkeit von bestimmten, anderen Feldern zulässig?


Frage
Warum zielst Du eigentlich auf diese zweidimensionale Feldanordnung? Es ist ja eigentlich unerheblich, ob so eine Anordnung möglich ist. Wichtig ist ja eigentlich nur die Zuordnung auf bestimmte Wortformen gemäß der Reihenfolge innerhalb des Feldes.

Antwort
Sorry, aber ich kann dir im Moment nicht so ganz folgen ... --rae

Frage
Du definierst doch zweidimensionale Anordnungen. Wozu tust du das?

Antwort
Wenn ich jemandem nicht folgen kann, hilft mir meist auch eine Umformulierung nicht weiter ;-)
Wenn ich deine Frage richtig verstehe, willst Du wissen, warum ich nicht-optimale n-dimensionale Strukturen mit Leerstellen verwende anstatt linearer Listen, die keine Luecken besitzen?
Das haengt mit einem Begriff zusammen, den Du nicht so besonders magst ;-). Im Ernst --- es erleichtert mir den Zugriff auf die Daten und das Debuggen der Software. Es haengt auch mit der Art und Weise zusammen, wie ich entwickle.

Entschuldige meine ungenauen Formulierungen, ich versuch's noch einmal:

... Nur, das alles sind Überlegungen innerhalb einer Menge von Feldern (SN SG SD SA2 PN PG PD PA2), die zweidimensionale Anordnung und "sprachliche" Kontext wirkt auf mich als Fremdkörper in diesem Austauschformat.


Frage
Warum verwendet das AustauschFormat, das so viele Kürzelformen zur Datenreduktion verwendet nicht auch Kürzel für die Regeln? Z.B. "m.1" statt "maskulin 1". Noch dazu, wo das sowieso in vielen Wörterbüchern üblich ist?
Antwort
maskulin 1 ist bereits die Kurzform. Es handelt sich hierbei um einen reinen Arbeitstitel, der später durch eine brauchbare umgangssprachliche Bezeichnung ersetzt wird, wie z.B. Worte, bei denen die Endung '-en' gegen '-et' ausgetauscht werden. Da ich im Moment noch keine Idee habe, wie ich das kurz und bündig formulieren kann, benutze ich im Moment diese Form.
Auf Schreibweisen wie z.B. m.1 will ich verzichten, da zum einen die hier verwendete Schreibweise aufgrund der Unterteilung in Basisregel und Regel nicht deckungsgleich mit der Schreibweise in Büchern ist und ich zum anderen Lizenzstreitigkeiten aus dem Weg gehen möchte (Siehe entsprechende Kommentare von Peter Seitz in der Mailingliste). -- rae


Frage
Könntest Du ein Wort einfügen, welches ein Dialektkürzel (z.B. "ö") verwendet, damit man sieht wie das verwendet wird. -- hl
Antwort
Wo ist der Unterschied von dem verwendeten Dialekt b und Dialekt ö? Aber wenn es der Klarheit dient --- ich habe den Eintrag von 'Bazi' geändert. Wird das Wort eigentlich in Bayern und in Östereich gleich verwendet? -- rae

Danke. Wo hast Du übrigens definiert, dass "di" und "Dialekt" zusammengehören? Würde das nicht in DefinierteElemente gehören?

Tja, offensichtlich vergessen ... -- rae


Non german speakers can translate this page with 'babelfish', which can be found at http://babelfish.altavista.com/translate.dyn.
KategorieAustauschformat


StartSeite | Neues | TestSeite | Teilnehmer | Projekte | Kategorien | Index | Einstellungen | Ändern
Text dieser Seite ändern (zuletzt geändert: 14. Februar 2001 8:38 (diff))
Suchbegriff: gesucht wird
im Titel
im Text