An online dictionary of the professional language of Polish press journalists. The concept of domain-specific wordnet-like thesaurus – preliminary comments

Beata Jarosz

Uniwersytet Marii Curie-Skłodowskiej w Lublinie
https://orcid.org/0000-0002-3251-9734


Abstract

The article presents an initial concept of the domain-specific wordnet-like thesaurus
containing special nomenclature used by Polish press journalists in intra-group
communication in the course of performing professional tasks. Of approximately 2,600
specialized lexical units used from the 18th century to the present day, only a fraction have
so far been included in dictionaries, which justifies the need to build an e-dictionary. Based
on test work done by the author at the CLARIN-PL center (Poland), and with regard to
the methodology of creating general wordnets, including the concept of the Polish general
wordnet (Słowosieć), the content of the journalistic thesaurus and the scope of information
included in headword entries were preliminarily specified. Additionally, the author defined
a preliminary catalogue of semantic domains and semantic relations by which specific
lexical units will be ordered. Moreover, the method of connecting resources with the
PlWordNet was proposed. The article initiates discussion on the essence and methodology
of building domain-specific wordnets, the construction of which is experimental due to
the lack of this kind of Polish projects and only a few global ones (e.g. ArchiWordNet,
Jur-WordNet).


Keywords:

wordnet, domain-specific wordnet, professional language of journalists, Słowosieć, PlWordNet


Arıcan B.N., Özçelik M., Aslan D.B., Sarmış E., Parlar S., Yıldız O.T. (2021): Creating domain dependent Turkish WordNet and SentiNet. [W:] Proceedings of the 11th Global Wordnet Conference 2021, GWC 2021, 18–21 January, 2021. Red. S. Bosch, C. Fellbaum, M. Griesel,   Google Scholar

A. Rademaker, P. Vossen. Potchefstroom, s. 243–251.   Google Scholar

Bańko M. (2001): Z pogranicza leksykografii i językoznawstwa. Studia o słowniku jednojęzycznym. Warszawa.   Google Scholar

Bentivogli L., Bocco A., Pianta E. (2004): ArchiWordNet: Integrating WordNet with Domain-Specific Knowledge. [W:] Proceedings of the 2nd International Global Wordnet Conference. Red. P. Sojka, K. Pala, P. Smrž, Ch. Fellbaum, P. Vossen. Brno, s. 39–46.   Google Scholar

Chyliński M., Russ-Mohl S. (2008): Dziennikarstwo. Warszawa.   Google Scholar

Dobrowolska-Pigoń M., Dziob A., Maziarz M., Piasecki M., Wieczorek J. (2016): Opis rzeczownikowych relacji leksykalno-semantycznych w Słowosieci 4.0. Wrocław.   Google Scholar

Dobrowolska-Pigoń M., Dziob A., Nowakowska B., Wieczorek J. (2020): Procedura korekty Słowosieci. Wrocław.   Google Scholar

Fjeld R.V., Nygaard L. (2009): NorNet – a monolingual wordnet of modern Norwegian. [W:] Proceedings of the NODALIDA 2009 workshop WordNets and other Lexical Semantic Resources – between Lexical Semantics, Lexicography, Terminology and Formal Ontologies. Red. B. Sandford Pedersen, A. Braasch, S. Nimb, R. Vatvedt Fjeld. Tartu, s. 13–16.   Google Scholar

Grabias S. (2019): Język w zachowaniach społecznych. Lublin.   Google Scholar

Grucza S. (2008): Teksty specjalistyczne. Językowe eksponenty wiedzy specjalistycznej. [W:] Kulturowy i leksykograficzny obraz języków specjalistycznych. Red. Ł. Karpiński. Warszawa, s. 181–193.   Google Scholar

Jarosz B. (2020): Język zawodowy polskich dziennikarzy jako problem badawczy. Uwagi wstępne. „Język Polski” 1, s. 122–133.
Crossref   Google Scholar

Jarosz B. (2022): The professional language of Polish journalists in a diachronic perspective. „Slovo a Slovesnost” 2, s. 103–121.   Google Scholar

Jarosz B. (2023): Język zawodowy polskich dziennikarzy prasowych (XIX–XXI). Lublin. Online: https://polona.pl/preview/c4bc10d8-e6ae-465e-879f-efe0bdece667   Google Scholar

Kafel M. (1953): Mały ilustrowany słownik techniki wydawniczej. Warszawa.   Google Scholar

[„Kurier Warszawski”]. (1896): „Kurier Warszawski”. Książka jubileuszowa ozdobiona 247 rysunkami w tekście 1821–1896. Warszawa.   Google Scholar

Kurkiewicz J. (2007): Kwalifikatory w Wielkim słowniku języka polskiego. [W:] Nowe studia leksykograficzne. Red. P. Żmigrodzki, R. Przybylska. Kraków, s. 29–45.   Google Scholar

Lejčik V.M. (1981): Optimaľnajâ dlina i optimaľnajâ struktura termina. „Voprosy Âzykoznaniâ” 2, s. 63–73.   Google Scholar

Magnini B., Speranza M. (2001): Integrating Generic and Specialized Wordnets. [W:] Proceedings of the 2nd Conference on Recent Advances in Natural Language Processing. Tzigov Chark, s. 149–153.   Google Scholar

Maślanka J. (red.) (1976): Encyklopedia wiedzy o prasie. Wrocław.   Google Scholar

Maziarz M., Piasecki M., Rudnicka E. (2014): Słowosieć – polski wordnet. Proces tworzenia tezaurusa. „Polonica” 34, s. 79–98.   Google Scholar

Miller G.A., Beckwith R., Fellbaum Ch., Gross D., Miller K.J. (1990): Introduction to WordNet: An On-line Lexical. „International Journal of Lexicography” 4, s. 235–244.
Crossref   Google Scholar

Müller-Spitzer C., Koplenig A. (2014): Online dictionaries: Expectations and Demands. [W:] Using online dictionaries, Red. C. Müller-Spitzer. Berlin, s. 143–188.
Crossref   Google Scholar

Olkowska K.M. (2011): Najnowsze angielskie zapożyczenia cytatowe w polszczyźnie ogólnej początku XXI wieku. „Studia Językoznawcze” 10, s. 211–256.   Google Scholar

Pawłowski A. (2017): ChronoPress – Chronological Corpus of Polish Press Texts (1945–1962 , dostęp: 22.07.2023.   Google Scholar

Piasecki M., Marcińczuk M., Ramocki R. (2013). WordNetLoom: A WordNet development system integrating form-based and graph-based perspectives. „International Journal of Data Mining Modelling and Management” 5, s. 210–232.
Crossref   Google Scholar

Piasecki M., Szpakowicz S., Broda B. (2009): Wordnet from the ground up. Wrocław.   Google Scholar

Pisarek W. (red.) (2006): Słownik terminologii medialnej. Kraków.   Google Scholar

Rudnicka E., Maziarz M., Piasecki M., Szpakowicz S. (2012): A strategy of Mapping Polish WordNet onto Princeton WordNet. [W:] Proceedings of COLING 2012: Posters. Red. M. Kay, Ch. Boitet. Bombaj, s. 1039–1048.   Google Scholar

Sagri M.T., Tiscornia D., Bertagna F. (2004): Jur-WordNet. [W:] Proceedings of the 2nd International Global Wordnet Conference. Red. P. Sojka, K. Pala, P. Smrž, Ch. Fellbaum, P. Vossen. Brno, s. 305–310.   Google Scholar

Smith B., Fellbaum Ch. (2004): Medical WordNet: A New Methodology for the Construction and Validation of Information Resources for Consumer Health. [W:] Proceedings of the 20th International Conference on Computational Linguistics, Geneva, 23–27 August 2004. Red. E. Yuste, S.J. Jekat, A.K. Pantli, G. Massey. Genewa, s. 31–38.
Crossref   Google Scholar

Tarnowski S. [et al.]. (1938): Księga pamiątkowa na dziewięćdziesięciolecie dziennika „Czas”. Kraków 1848 – Warszawa 1938. Warszawa.   Google Scholar

Töpel A. (2014): Review of research into the use of electronic dictionaries. [W:] Using Online Dictionaries. Red. C. Müller-Spitzer. Boston, s. 13–54.
Crossref   Google Scholar

Zotova E., Cuadros M., Rigau G. (2023): Towards the integration of WordNet into ClinIDMap. [W:] Proceedings of the 12th Global Wordnet Conference (GWC2023), San Sebastian, Spain, January 23–27, 2023, , dostęp: 19.04.2023.   Google Scholar

Żmigrodzki P. (2015): Wielki słownik języka polskiego PAN a obecna sytuacja językoznawstwa polskiego. „LingVaria” 1, s. 109–119.
Crossref   Google Scholar

Żmigrodzki P., Bańko M., Batko-Tokarz B., Bobrowski J., Czelakowska A., Grochowski M., Przybylska R., Waniakowa J., Węgrzynek K. (2018): Wielki słownik języka polskiego PAN. Geneza, koncepcja, zasady opracowania. Kraków.
Crossref   Google Scholar

Żyrek-Horodyska E. (2019): Kartografowie codzienności. O przestrzeni (w) reportażu. Kraków.   Google Scholar


Published
2024-06-30

Cited by

Jarosz, B. (2024). An online dictionary of the professional language of Polish press journalists. The concept of domain-specific wordnet-like thesaurus – preliminary comments. Prace Językoznawcze, 26(2), 203–219. https://doi.org/10.31648/pj.10146

Beata Jarosz 
Uniwersytet Marii Curie-Skłodowskiej w Lublinie
https://orcid.org/0000-0002-3251-9734