From 5a0064827efacbe962c03bc5bea384eee89655dc Mon Sep 17 00:00:00 2001 From: sergiusz Date: Wed, 6 Jan 2021 01:54:53 +0100 Subject: [PATCH] Added macrons to regex --- app/templates/Pensa/01_Imperium_Romanum_Pensum_A.html | 4 ++-- app/templates/Pensa/01_Imperium_Romanum_Pensum_B.html | 4 ++-- app/templates/Pensa/02_Familia_Romana_Pensum_A.html | 2 +- text2pensum.py | 2 +- 4 files changed, 6 insertions(+), 6 deletions(-) diff --git a/app/templates/Pensa/01_Imperium_Romanum_Pensum_A.html b/app/templates/Pensa/01_Imperium_Romanum_Pensum_A.html index e84ee34..593fea3 100644 --- a/app/templates/Pensa/01_Imperium_Romanum_Pensum_A.html +++ b/app/templates/Pensa/01_Imperium_Romanum_Pensum_A.html @@ -1,4 +1,4 @@ Nīlus fluvi est. Nīlus et Rhēnus fluvi . Crēta īnsul . Crēta et Rhodus īnsul sunt. Brundisium oppid . Brundisium et Tūsculum oppid .
-Rhēnus fluvi magn est. Tiberis est fluvi parv. Rhēnus et Dānuvius nōn fluvi_ī_ parv_ī_, sed fluvi_ī_ magn_ī_ sunt. Sardinia īnsul magn est. Melita īnsul parv est. Sardinia et Sicilia nōn īnsul parv, sed īnsul magn sunt. Brundisium nōn oppid parv, sed oppid magn est. Tūsculum et Delphī non oppid magn, sed oppid parv sunt.
-Crēta īnsul Graec est. Lesbos et Chios et Naxus sunt īnsul Graec. In Graeciā mult īnsul sunt. In Galliaa sunt mult_ī_ fluvi_ī_. In Italiā mult oppid sunt. In Arabiā sunt pauc_ī_ fluvi_ī_ et pauc oppid.
+Rhēnus fluvi magn est. Tiberis est fluvi parv. Rhēnus et Dānuvius nōn fluvi parv, sed fluvi magn sunt. Sardinia īnsul magn est. Melita īnsul parv est. Sardinia et Sicilia nōn īnsul parv, sed īnsul magn sunt. Brundisium nōn oppid parv, sed oppid magn est. Tūsculum et Delphī non oppid magn, sed oppid parv sunt.
+Crēta īnsul Graec est. Lesbos et Chios et Naxus sunt īnsul Graec. In Graeciā mult īnsul sunt. In Galliaa sunt mult fluvi. In Italiā mult oppid sunt. In Arabiā sunt pauc fluvi et pauc oppid.
A et B litter Latīn sunt. C quoque litter Latīn est. Multī et paucī vocābul Latīn sunt. Ubi quoque vocābul Latīn est. I et II numer Rōmān sunt. III quoque numer Rōmān est. \ No newline at end of file diff --git a/app/templates/Pensa/01_Imperium_Romanum_Pensum_B.html b/app/templates/Pensa/01_Imperium_Romanum_Pensum_B.html index 3dcd711..c63dc3e 100644 --- a/app/templates/Pensa/01_Imperium_Romanum_Pensum_B.html +++ b/app/templates/Pensa/01_Imperium_Romanum_Pensum_B.html @@ -1,2 +1,2 @@ -Sicilia _īnsula_ est. Italia īnsula _nōn_ est. Rhēnus est. Brundisium est. Sicilia et Sardinia _īnsulae_ magnae sunt. Melita īnsula est. Britannia nōn _īnsula_ parva, sed _īnsula_ est. Brundisium nōn , sed magnum est. Est Brundisium in Graeciā? Brundisium _nōn_ est in Graeciā, in Italiā. est Sparta? Sparta est in Graeciā. Sparta oppidum est. Delphī oppidum Graecum est. Euboea, Naxus, Lesbos, Chios _īnsulae_ Graecae sunt. In Graeciā sunt īnsulae. -Quid est III? III est. Quid est A? A littera est. A, B, C Latīnae sunt. Γ littera Latīna est? Γ _nōn_ littera _Latīna_, sed littera est. Īnsula Latinum est. \ No newline at end of file +Sicilia est. Italia īnsula est. Rhēnus est. Brundisium est. Sicilia et Sardinia magnae sunt. Melita īnsula est. Britannia nōn parva, sed est. Brundisium nōn , sed magnum est. Est Brundisium in Graeciā? Brundisium est in Graeciā, in Italiā. est Sparta? Sparta est in Graeciā. Sparta oppidum est. Delphī oppidum Graecum est. Euboea, Naxus, Lesbos, Chios Graecae sunt. In Graeciā sunt īnsulae. +Quid est III? III est. Quid est A? A littera est. A, B, C Latīnae sunt. Γ littera Latīna est? Γ littera , sed littera est. Īnsula Latinum est. \ No newline at end of file diff --git a/app/templates/Pensa/02_Familia_Romana_Pensum_A.html b/app/templates/Pensa/02_Familia_Romana_Pensum_A.html index 01863fe..389ffc7 100644 --- a/app/templates/Pensa/02_Familia_Romana_Pensum_A.html +++ b/app/templates/Pensa/02_Familia_Romana_Pensum_A.html @@ -1,3 +1,3 @@ Mārcus fīli Iūliī est. Iūlia fīli Iūliī est. Iūlius est vir Rōmān. Aemilia fēmin Rōmān est. Iūlius domin, Aemilia domin est. Mēdus serv Graec est, Dēlia est ancill Graec. Sparta oppid Graec est. -Iūlius pater Mārc est. Mārcus est fīlius Iūli_ī_ et Aemili. Mēdus servus Iūli_ī_ est: Iūlius est dominus serv. Iūlius dominus Mēd et Dāv est: Iūlius dominus serv est. Numerus serv magnus est. Dēlia est ancilla Aemili: Aemilia domina ancill est. Aemilia domina Dēli et Syr est: Aemilia domina ancill est. In familiā Iūli_ī_ est magnus numerus serv et ancill. Aemilia māter Marc_ī_ et Qūint_ī_ et Iūli est. Mārcus, Quīntus Iūliaque sunt līberī Iūli_ī_ et Aemili. Numerus līber est trēs. Numerus serv est centum. +Iūlius pater Mārc est. Mārcus est fīlius Iūli et Aemili. Mēdus servus Iūli est: Iūlius est dominus serv. Iūlius dominus Mēd et Dāv est: Iūlius dominus serv est. Numerus serv magnus est. Dēlia est ancilla Aemili: Aemilia domina ancill est. Aemilia domina Dēli et Syr est: Aemilia domina ancill est. In familiā Iūli est magnus numerus serv et ancill. Aemilia māter Marc et Qūint et Iūli est. Mārcus, Quīntus Iūliaque sunt līberī Iūli et Aemili. Numerus līber est trēs. Numerus serv est centum. In pāginā prīmā capitul secund multa vocābula nova sunt. Numerus capitul nōn parvus est. \ No newline at end of file diff --git a/text2pensum.py b/text2pensum.py index c50958e..2aef827 100644 --- a/text2pensum.py +++ b/text2pensum.py @@ -10,7 +10,7 @@ for filename in sys.argv[1:]: html_input_head = '' html_span_tail = '' - content = re.sub(r'(\s|\"|)([a-zA-Z\-\ÿ]+|)_([a-zA-Z\-]+)_(\.|\,|)', r'\1' + html_span_head + r'\2' + html_input_head + r'\3' + html_input_tail + r'\4' + html_span_tail, content) + content = re.sub(r'(\s|\"|)([a-zA-Z\-\ÿ]+|)_([āēīōūa-zA-Z\-]+)_(\.|\,|)', r'\1' + html_span_head + r'\2' + html_input_head + r'\3' + html_input_tail + r'\4' + html_span_tail, content) # Replace vowel-dash-vowel with vowels with macrons content = content.replace('A-A', 'Ā')