An online dictionary of the professional language of Polish press journalists. The concept of domain-specific wordnet-like thesaurus – preliminary comments
Abstract
The article presents an initial concept of the domain-specific wordnet-like thesaurus
containing special nomenclature used by Polish press journalists in intra-group
communication in the course of performing professional tasks. Of approximately 2,600
specialized lexical units used from the 18th century to the present day, only a fraction have
so far been included in dictionaries, which justifies the need to build an e-dictionary. Based
on test work done by the author at the CLARIN-PL center (Poland), and with regard to
the methodology of creating general wordnets, including the concept of the Polish general
wordnet (Słowosieć), the content of the journalistic thesaurus and the scope of information
included in headword entries were preliminarily specified. Additionally, the author defined
a preliminary catalogue of semantic domains and semantic relations by which specific
lexical units will be ordered. Moreover, the method of connecting resources with the
PlWordNet was proposed. The article initiates discussion on the essence and methodology
of building domain-specific wordnets, the construction of which is experimental due to
the lack of this kind of Polish projects and only a few global ones (e.g. ArchiWordNet,
Jur-WordNet).
Keywords:
wordnet, domain-specific wordnet, professional language of journalists, Słowosieć, PlWordNetReferences
Arıcan B.N., Özçelik M., Aslan D.B., Sarmış E., Parlar S., Yıldız O.T. (2021): Creating domain dependent Turkish WordNet and SentiNet. [W:] Proceedings of the 11th Global Wordnet Conference 2021, GWC 2021, 18–21 January, 2021. Red. S. Bosch, C. Fellbaum, M. Griesel, Google Scholar
A. Rademaker, P. Vossen. Potchefstroom, s. 243–251. Google Scholar
Bańko M. (2001): Z pogranicza leksykografii i językoznawstwa. Studia o słowniku jednojęzycznym. Warszawa. Google Scholar
Bentivogli L., Bocco A., Pianta E. (2004): ArchiWordNet: Integrating WordNet with Domain-Specific Knowledge. [W:] Proceedings of the 2nd International Global Wordnet Conference. Red. P. Sojka, K. Pala, P. Smrž, Ch. Fellbaum, P. Vossen. Brno, s. 39–46. Google Scholar
Chyliński M., Russ-Mohl S. (2008): Dziennikarstwo. Warszawa. Google Scholar
Dobrowolska-Pigoń M., Dziob A., Maziarz M., Piasecki M., Wieczorek J. (2016): Opis rzeczownikowych relacji leksykalno-semantycznych w Słowosieci 4.0. Wrocław. Google Scholar
Dobrowolska-Pigoń M., Dziob A., Nowakowska B., Wieczorek J. (2020): Procedura korekty Słowosieci. Wrocław. Google Scholar
Fjeld R.V., Nygaard L. (2009): NorNet – a monolingual wordnet of modern Norwegian. [W:] Proceedings of the NODALIDA 2009 workshop WordNets and other Lexical Semantic Resources – between Lexical Semantics, Lexicography, Terminology and Formal Ontologies. Red. B. Sandford Pedersen, A. Braasch, S. Nimb, R. Vatvedt Fjeld. Tartu, s. 13–16. Google Scholar
Grabias S. (2019): Język w zachowaniach społecznych. Lublin. Google Scholar
Grucza S. (2008): Teksty specjalistyczne. Językowe eksponenty wiedzy specjalistycznej. [W:] Kulturowy i leksykograficzny obraz języków specjalistycznych. Red. Ł. Karpiński. Warszawa, s. 181–193. Google Scholar
Jarosz B. (2020): Język zawodowy polskich dziennikarzy jako problem badawczy. Uwagi wstępne. „Język Polski” 1, s. 122–133.
Crossref
Google Scholar
Jarosz B. (2022): The professional language of Polish journalists in a diachronic perspective. „Slovo a Slovesnost” 2, s. 103–121. Google Scholar
Jarosz B. (2023): Język zawodowy polskich dziennikarzy prasowych (XIX–XXI). Lublin. Online: https://polona.pl/preview/c4bc10d8-e6ae-465e-879f-efe0bdece667 Google Scholar
Kafel M. (1953): Mały ilustrowany słownik techniki wydawniczej. Warszawa. Google Scholar
[„Kurier Warszawski”]. (1896): „Kurier Warszawski”. Książka jubileuszowa ozdobiona 247 rysunkami w tekście 1821–1896. Warszawa. Google Scholar
Kurkiewicz J. (2007): Kwalifikatory w Wielkim słowniku języka polskiego. [W:] Nowe studia leksykograficzne. Red. P. Żmigrodzki, R. Przybylska. Kraków, s. 29–45. Google Scholar
Lejčik V.M. (1981): Optimaľnajâ dlina i optimaľnajâ struktura termina. „Voprosy Âzykoznaniâ” 2, s. 63–73. Google Scholar
Magnini B., Speranza M. (2001): Integrating Generic and Specialized Wordnets. [W:] Proceedings of the 2nd Conference on Recent Advances in Natural Language Processing. Tzigov Chark, s. 149–153. Google Scholar
Maślanka J. (red.) (1976): Encyklopedia wiedzy o prasie. Wrocław. Google Scholar
Maziarz M., Piasecki M., Rudnicka E. (2014): Słowosieć – polski wordnet. Proces tworzenia tezaurusa. „Polonica” 34, s. 79–98. Google Scholar
Miller G.A., Beckwith R., Fellbaum Ch., Gross D., Miller K.J. (1990): Introduction to WordNet: An On-line Lexical. „International Journal of Lexicography” 4, s. 235–244.
Crossref
Google Scholar
Müller-Spitzer C., Koplenig A. (2014): Online dictionaries: Expectations and Demands. [W:] Using online dictionaries, Red. C. Müller-Spitzer. Berlin, s. 143–188.
Crossref
Google Scholar
Olkowska K.M. (2011): Najnowsze angielskie zapożyczenia cytatowe w polszczyźnie ogólnej początku XXI wieku. „Studia Językoznawcze” 10, s. 211–256. Google Scholar
Pawłowski A. (2017): ChronoPress – Chronological Corpus of Polish Press Texts (1945–1962 , dostęp: 22.07.2023. Google Scholar
Piasecki M., Marcińczuk M., Ramocki R. (2013). WordNetLoom: A WordNet development system integrating form-based and graph-based perspectives. „International Journal of Data Mining Modelling and Management” 5, s. 210–232.
Crossref
Google Scholar
Piasecki M., Szpakowicz S., Broda B. (2009): Wordnet from the ground up. Wrocław. Google Scholar
Pisarek W. (red.) (2006): Słownik terminologii medialnej. Kraków. Google Scholar
Rudnicka E., Maziarz M., Piasecki M., Szpakowicz S. (2012): A strategy of Mapping Polish WordNet onto Princeton WordNet. [W:] Proceedings of COLING 2012: Posters. Red. M. Kay, Ch. Boitet. Bombaj, s. 1039–1048. Google Scholar
Sagri M.T., Tiscornia D., Bertagna F. (2004): Jur-WordNet. [W:] Proceedings of the 2nd International Global Wordnet Conference. Red. P. Sojka, K. Pala, P. Smrž, Ch. Fellbaum, P. Vossen. Brno, s. 305–310. Google Scholar
Smith B., Fellbaum Ch. (2004): Medical WordNet: A New Methodology for the Construction and Validation of Information Resources for Consumer Health. [W:] Proceedings of the 20th International Conference on Computational Linguistics, Geneva, 23–27 August 2004. Red. E. Yuste, S.J. Jekat, A.K. Pantli, G. Massey. Genewa, s. 31–38.
Crossref
Google Scholar
Tarnowski S. [et al.]. (1938): Księga pamiątkowa na dziewięćdziesięciolecie dziennika „Czas”. Kraków 1848 – Warszawa 1938. Warszawa. Google Scholar
Töpel A. (2014): Review of research into the use of electronic dictionaries. [W:] Using Online Dictionaries. Red. C. Müller-Spitzer. Boston, s. 13–54.
Crossref
Google Scholar
Zotova E., Cuadros M., Rigau G. (2023): Towards the integration of WordNet into ClinIDMap. [W:] Proceedings of the 12th Global Wordnet Conference (GWC2023), San Sebastian, Spain, January 23–27, 2023, , dostęp: 19.04.2023. Google Scholar
Żmigrodzki P. (2015): Wielki słownik języka polskiego PAN a obecna sytuacja językoznawstwa polskiego. „LingVaria” 1, s. 109–119.
Crossref
Google Scholar
Żmigrodzki P., Bańko M., Batko-Tokarz B., Bobrowski J., Czelakowska A., Grochowski M., Przybylska R., Waniakowa J., Węgrzynek K. (2018): Wielki słownik języka polskiego PAN. Geneza, koncepcja, zasady opracowania. Kraków.
Crossref
Google Scholar
Żyrek-Horodyska E. (2019): Kartografowie codzienności. O przestrzeni (w) reportażu. Kraków. Google Scholar