(di Luca Panieri - Università IULM di Milano)
Nel corso dei suoi quattro secoli di attestazioni scritte la lingua cimbra non ha mai raggiunto una vera e propria fase di standardizzazione ortografica, paragonabile a quella caratteristica delle lingue nazionali; bensì si sono susseguite consuetudini scrittorie di vario genere, spesso poco congruenti e variabili sia in relazione all’epoca che all’autore del testo. Tuttavia la produzione risalente al XIX e all’inizio del XX secolo mostra una relativa omogeneità nelle scelte ortografiche, almeno su alcuni punti. Con l’implementazione della nuova banca dati lessicale informatizzata (http://dizionario.cimbri7comuni.it/), dovendo raccogliere il lessico cimbro da fonti tanto disparate nelle soluzioni ortografiche, si è reso necessario adottare principi di normalizzazione rigorosi nella lemmatizzazione dei dati lessicali, che eliminassero completamente la disomogeneità ortografica delle fonti stesse e consentissero così un’agevole consultazione dei lemmi.