The review for Literary History and Theory

DE LA HÂRTIE LA ECRAN: PROVOCĂRILE ÎN UTILIZAREA INTRĂRILOR DE DICȚIONAR DE DATE PENTRU DEZVOLTAREA INSTRUMENTULUI LEMI DE STABILIRE A LIZIBILITĂȚII LITERATURII ROMÂNE

December 20, 2024

👤Author

Name: Mădălina Chitez
Affiliation: CS II, Dr. habil., Centrul de Cercetare CODHUS, Departamentul de Limbi și Literaturi Străine, Universitatea de Vest din Timișoara, România
Contact: madalina.chitez@e-uvt.ro

Name: Roxana Rogobete
Affiliation: Lector dr., Centrul de Cercetare CODHUS, Departamentul de Studii Românești, Universitatea de Vest din Timișoara, România
Contact: roxana.rogobete@e-uvt.ro

Name: Karla Csürös
Affiliation: Drd., Centrul de Cercetare CODHUS, Departamentul de Limbi și Literaturi Străine, Universitatea de Vest din Timișoara, România
Contact: karla.csuros@e-uvt.ro

📄Article

Citation Recommendation: CHITEZ, Mădălina. ROGOBETE, Roxana. CSÜRÖS, Karla. „De la hârtie la ecran: provocările în utilizarea intrărilor de dicționar de date pentru dezvoltarea instrumentului lemi de stabilire a lizibilității literaturii române”. RITL, New Series, XVIII, 2024, p. 72–83. doi: 10.59277/ritl.2024.18.05
Titlul: DE LA HÂRTIE LA ECRAN: PROVOCĂRILE ÎN UTILIZAREA INTRĂRILOR DE DICȚIONAR DE DATE PENTRU DEZVOLTAREA INSTRUMENTULUI LEMI DE STABILIRE A LIZIBILITĂȚII LITERATURII ROMÂNE
Title: FROM PAPER TO SCREEN: THE CHALLENGES IN USING DATA DICTIONARY INPUTS TO DEVELOP THE LEMI TOOL FOR ESTABLISHING THE READABILITY OF ROMANIAN LITERATURE
Pages: 72–83
Language: Romanian
URL: https://ritl.ro/2024/5_Chitez_Rogobete_Csuros.pdf
DOI: 10.59277/ritl.2024.18.05

Abstract: This paper addresses an interdisciplinary linguistic theme, located at the inter­section between the fields of applied linguistics, computational linguistics and education: the use of Romanian dictionary data of archaisms, regionalism and main vocabulary for the cre­ation of a digital tool for establishing the legibility of texts in Romanian for school reading. As many of the texts offered for reading to the Romanian school population are Romanian literature texts, this tool can be used to evaluate the legibility of Romanian literature texts in general. By legibility, we refer to the concept of readability, taken from English literature, which refers to the ease with which a text can be read and understood by readers. This con­cept incorporates factors such as vocabulary complexity, sentence structure, basic vocabulary level, and a host of other variables that can be quantified and analyzed automatically. Most of the time, the legibility of a text is given by mathematical formulas that include various indices that quantify elements such as the length of words, the complexity of phrases, and the frequency of use of certain terms. The purpose of the readability assessment is to determine whether a text is appropriate for the level of knowledge and language skills of its readers. For the Romanian language, but also for the special case of school literature texts, such formulas have not yet been tested. In the sections below, we will provide details about the LEMI plat­form, but also about the construction of the readability formula, insisting on the challenges created by the lack of data in digital format – dictionaries of regionalisms, archaisms, and also basic vocabulary – in order to improve the formula originally created.

Keywords: readability of texts in Romanian, texts for school reading, Romanian literature, LEMI tool, LEMI platform

Bibliography

Bucă, M. (2008). Dicționar de arhaisme și regionalisme. Editura Vox Cart.

Busuioc, M.-M. (2005). Dicționar de arhaisme. Editura All Educational.

Chitez, M., Dascalu, M., Udrea, A. C., Strilețchi, C., Csürös, K., Rogobete, R., & Oravițan, A. (2024, mai). Towards Building the LEMI Readability Platform for Children’s Literature in the Romanian Language (Dezvoltarea platformei LEMI de evaluare a lizibilității pentru literatura pentru copii în limba română). În Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) (Lucrările Conferinței Internaționale Comune de Lingvistică Computațională, Resurse Lingvistice și Evaluare LREC-COLING 2024) (pp. 16450–16456).

Costăchescu, A., & Iliescu, M. (1994). Vocabularul minimal al limbii române curente. Editura Demiurg.

Creangă, I. (1906). Ion Creangă. Opere complete. Ediția a VII-a. Cu o prefață de G.T. Kirileanu şi H. Chendi și listă de cuvinte de Al. Vasiliu și G.T. Kirileanu. Editura «Cartea Românească», București.

Graur, A. (1957). Fondul Principal al Limbii Române. Editura Științifică.

Graur, A. (1954). Încercare asupra fondului principal lexical al limbii române. Editura Academiei.

Hülsing, A., & im Walde, S. S. (2024, June). Cross-lingual metaphor detection for low-re­source languages. In Proceedings of the 4th Workshop on Figurative Language Processing (FigLang 2024) (pp. 22–34).

Iliescu, M. (1976). Problema lexicului reprezentativ. Editura Academiei.

Iliescu, M. (1977). Pentru un vocabular fundamental al limbii române contemporane. Editura Academiei.

Iliescu, M. (1980). Vocabular fundamental și vocabular reprezentativ. Editura Academiei.

Juilland, A., Edwards, P. M. H., & Juilland, I. (1965). Frequency Dictionary of Rumanian Words. Mouton & Co.

Ketaren, S. V., & Pakpahan, E. M. (2021). Metaphorical expression used in poetry in English textbook entitled “Pathway to English”. Project (Professional Journal of English Education), 4(3), 469–479.

Klare, G. R. (1968). The role of word frequency in readability. Elementary English, 45(1), 12–22.

Maneca, C., & Senatore-Perillo, A. (1978). Preliminarii la vocabularul esențial al limbii române. Editura Academiei.

Mititelu, V. B., Irimia, E., & Tufiș, D. (2014, May). CoRoLa―The Reference Corpus of Contemporary Romanian Language. În LREC (pp. 1235–1239).

Neagu, V., Iliescu, M., Nedelcu, C., & Scurtu, G. (1981). Vocabularul minimal al limbii române pentru studenți străini. Editura Didactică și Pedagogică.

Oravițan, A., Chitez, M., Rogobete, R., Csürös, K., & Hagiu, S. (2023). Validating LEMI: A New Readability Tool for Children’s Literature in Romanian (Validarea LEMI: Un nou instrument de evaluare a lizibilității pentru literatura pentru copii în limba română). Lucrare prezentată la e-LADDA Closing Conference / ELN Pre-Summit Event (Conferința de Închidere e-LADDA / Evenimentul Pre-Summit ELN), 18–22 octombrie 2023, Porto, Portugalia.

Preda, A., & Preda, V. (2022). On the basic lexical subassembly in Romanian and English.Literary Discourse Today. Dialogue and Multiculturalism, 23.

Szabo, Cz. (2015). Introducing a Romanian Frequency List and The Romanian Vocabulary Levels Test (Introducerea unei liste de frecvență a vocabularului românesc și testul niveluri­lor de vocabular românesc). Current Issues in Linguistic Variation: The 14th international conference of the Department of Linguistics (Probleme actuale de variație lingvistică: A 14–a conferință internațională a Departamentului de Lingvistică), Vol. 2, Universitatea din București: Editura Universității din București, pp. 304–316.

Resurse digitale:

DEX online, Institutul de Lingvistică „Iorgu Iordan – Al. Rosetti”. (2024). În Dicționarul explicativ al limbii române. Recuperat de la https://dexonline.ro/definitie/cioflingar.

https://ro.wiktionary.org

http://www.regionalisme.ro/index.php