Nun, ich gehe mal davon aus, daß ich nicht der Erste bin, der mit der Deklination von Substantiven im Polnischen - sagen wir mal - bestimmte Schierigkeiten hat.
Frage: Gibt es irgendwo eine Liste von Deklinationen, das heißt eine Liste mit allen möglichen Wortendungen ?
Was ich machen will:
Seit langem habe ich da so eine Idee, die wollte ich gerne umsetzen, also erkläre ich mal was ich konkret machen will:
Ich will ein Programm schreiben, das sich eine Reihe von Webseiten durchliest ( Webseiten von Online Zeitungen sind da ideal ), und sich alle Wörter notiert, auf die es stößt. Da kann man die Frequenz polnischer Wörter bestimmen. Vielleicht kann ich ja mit 5000 Wörtern sagen wir mal 50 % eines Zeitungstextes verstehen, mit weiteren 1000 Wörtern dann 53% usw ....
Background:
Die Liste wird verdammt lang sein ( Realistische Größenordnung: 100 Millionen Einträge, nehme ich an ), also brauch ich eine Datenbank ( habe ich auch ). So weit, so gut ( wie sagt man das eigentlich auf Polnisch ? ).
Da haben wir dann mal Dinge mehrfach drin, zB pan, pani, panu, painstwo, ...... aus denen will ich zwei logische Enträge machen (Dame und Herr), mit anderen Worten, ich will meinem Programm das Deklinieren beibringen.
Nun, intelligent soll das Programm nicht unbedingt werden, es weiß ja nicht einmal, ob ein Wort ein Verb, ein Substantiv, ein Zahlwort, ein Adjektiv usw ist. Also, ich wollte mit den Substantiven anfangen. Ich wollte eine Tabelle benützen, die alle möglichen Endungen von Substantiven enthält. Stößt das Programm nun desöfteren auf gleich Stammwörter mit verschiedenen Endungen, kann es anhand dieser Endungstabelle das Wort besser bestimmen.
Das Gleiche gilt für Verben, das ist es dann eine Konjugationstabelle. das dann später ...
Gibt es so was vielleicht schon, ein Wörterbuch inklusive Deklination , oder ein Deklinator ? Ich will ja nicht unbedingt das Rad neu erfinden ....
Danke im voraus über alle Kommentare zu diesem "Traum" .....