Bei Fragen zur deutschen Rechtschreibung, nach Duden richtigen Schreibweise, zu Grammatik oder Kommasetzung, Bedeutung oder Synonymen sind Sie hier richtig. Bevor Sie eine Frage stellen, nutzen Sie bitte die Suchfunktionen.
> [...]
> Die ursprüngliche Idee für das Parsing war, zuerst alle
> "sch"-Vorkommen durch den [sch] Laut zu ersetzen und
> anschließend alle im Wort übrig gebliebenen "ch" als
> [ch] auszuwerten - das funktioniert aber nicht zuverlässig, denn
> z.B. das Wort "bisschen" würde dann als
> "bis[sch]en" und nicht als "biss[ch]en"
> ausgewertet werden.
> Ist meine Vermutung korrekt, dass jedes deutsche Wort, dass die
> aufeinanderfolgenden Zeichen "ssch" beinhaltet, immer
> ein "ss[ch]" ist und nie ein "s[sch]"?
Gegenbeispiel: Ganztagsschule
> Gibt es eine andere allgemeine Regel oder weitere Ausnahmen, bei
> denen die sch/ch-Unterscheidung scheitern wird? Was gibt es für
> Lösungsansätze für das maschinelle Unterscheiden?
Vor der Rechtschreibreform war es vielleicht etwas einfacher: Da wäre der erstgenannte Ansatz nicht an "bisschen" gescheitert (bißchen), aber beispielsweise an "Häschen". Dafür war "ssch" immer "s[sch]" und nie "ss[ch]", glaube ich. Wenn diese letzte Annahme stimmt, wäre es hinreichend, wenn man in einem Text automatisch die alten ß-Schreibungen wiederherstellen könnte. Dieses und dein Problem dürften von ähnlicher Schwierigkeit sein.
Grüße
Schowagu