Pregled razvoja hrvatske e-leksikografije

Kristina Štrkalj Despot i Ana Ostroški Anić

U radu se daje kratak pregled razvoja i trenutačnoga stanja hrvatske e-leksikografije od prvih korpusno utemeljenih rječnika do najrecentnijega, izvorno digitalnoga rječnika Mrežnika. Detaljnije se opisuju leksikografski projekti kojima je Maja Bratanić dala važan prinos, a koji su se pokazali prijelomnim točkama u tome razvoju: čestotni rječnik Milana Moguša, Maje Bratanić i Marka Tadića, višejezični leksikografski projekt Johna Sinclaira te projekt STRUNA u Institutu za hrvatski jezik i jezikoslovlje.

1. Uvod Danas je vrlo raširen i gotovo potpuno prihvaćen stav o (e-)leksikografiji kao autonomnoj disciplini u odnosu na lingvistiku, i to disciplini koja ima razvijenu vlastitu teoriju i praksu. Za takav pristup leksikografiji osobito je zaslužna utjecajna danska funkcionalna leksikografska škola, tj. aarhuška škola (s Bergenholtzom kao najistaknutijim predstavnikom), koja je takav stav najjasnije artikulirala ističući ne samo autonomnost te discipline u odnosu na lingvistiku nego i njezinu pripadnost informacijskim znanostima (v. npr. Fuertes-Olivera i Bergenholtz 2011, Tarp 2012, Štrkalj Despot i Möhrs 2015). Takav je pristup izrastao na tradicionalnim i utjecajnim leksikografskim školama poput ruske (npr. Scerba 1940, Sorokoletov 1978) i njemačke (npr. Duda i dr. 1986, Wiegand 1999) te na pogledima istaknutih leksikografa poput Gouwsa (2011) ili Zguste (1992). No ovako artikuliran stav o autonomnosti leksikografije izazvao je i snažan otpor nekih vrlo uglednih leksikografa (najistaknutiji su Atkins i Rundell 2008) te metaleksikografa poput Béjointa 2010, koji drže da se ne može govoriti o teoriji leksikografije, nego samo o praksi izrade rječnika. Tako npr. Béjoint (2010) ističe kako znanost može imati teoriju, ali praktični rad ne može jer prirodni fenomeni trebaju svoje teorije, a zasigurno ne može biti teorije o stvaranju artefakata. Ističe nadalje kako itekako trebamo teoriju jezika ili leksikologije primjerice, ali da ne može postojati teorija leksikografije jer je leksikografija umijeće – umijeće izrade rječnika. No, kako se obje suprotstavljene strane slažu u onome

5 temeljnom, tj. primatu praktične prirode rječnika i njegove upotrebljivosti za korisnike, za dobrobit korisnika rječnika važno je izdignuti se iznad zvučnih slogana i razmirica i uočiti da obje strane promatraju isti objekt iz različitih perspektiva (dok su „praktični” leksikografi usmjereni prema samim podatcima, aarhuška je škola usmjerena prema prezentaciji tih podataka i resursima informacijskih tehnologija) te da su nam obje perspektive itekako potrebne (Caruso 2013). Elektronička leksikografija ili e-leksikografija počela se razvijati sredinom prošloga stoljeća te je bila poznata pod nazivom računalna leksikografija (engl. computer/computational lexicography) jer je bila ograničena na uporabu računala pri izradi rječnika, ali samo u smislu da se s pomoću računala provodila naknadna obrada ručno prikupljenih podataka (podatci su se naknadno reorganizirali, kodirali, razvrstavali i provjeravali), dok je sam proces rječničke produkcije bio i dalje konvencionalan (Granger 2012). Ti rječnici nisu zapravo još bili elektronički rječnici, nego tek strojno čitljivi rječnici jer se pri njihovoj izradi ni leksikografi ni korisnici rječnika nisu služili računalom. Leksikografi su nastavili s „papirnatom” praksom leksikografske obrade, a računalni su stručnjaci tek zatim obrađivali podatke i pretvarali ih u digitalni oblik (Atkins i Rundell 2008: 112–113, Štrkalj Despot i Möhrs 2015). Prijelomni je trenutak razvoja e-leksikografije bio prijelaz od strojno čitljiva rječnika prema leksičkoj bazi podataka. Taj je prijelaz revolucionirao i leksikografsku obradu i prezentaciju građe korisniku, ali i način na koji se korisnik podatcima služi. Longman Dictionary of Contemporary English (Procter 1978, dalje LDOCE) bio je rječnik kojim je počela ta revolucija, a u pravome smislu inovativan bio je Collins COBUILD English Language Dictionary objavljen 1987. (Sinclair 1987, dalje COBUILD), o čemu više u sljedećem poglavlju. Osamdesete godine bile su obilježene rječnicima u CD-ROM obliku, iz kojih su korisnici već uvidjeli dobrobiti rječnika u digitalnome obliku. Razvoj u elektroničkome smjeru iznimno se ubrzao u devedesetim godinama s brzim razvojem novih medija i tehnologija te su se pojavili prvi pravi izvorno digitalni mrežni rječnici. U devedesetim godinama integracija računalnih tehnologija u izradu i uporabu rječnika bila je ponajprije usmjerena konverziji tiskanih rječnika u elektronički oblik, pa razlika između e-rječnika i tiskanoga rječnika nije još bila suštinska. No s početkom tisućljeća računalne su tehnologije potpuno izmijenile leksikografiju postavši ključnima u svim fazama

6 računalnoga leksikografskoga procesa,1 od pripreme, prikupljanja, obrade i analize podataka, do prezentacije obrađenih podataka korisniku i analize korisničke perspektive. Prema Granger (2012) šest je ključnih područja u leksikografiji koja su u ovome razdoblju doživjela radikalne inovacije, a to su: integracija korpusa, više podataka i bolji podatci, učinkovitost pristupa, prilagodljivost specifičnim potrebama, hibridizacija i korisnički prinos. Danas se sa sigurnošću može reći da su e-leksikografija i leksikografija postale sinonimnima te je prema mnogim predviđanjima nestanak papirnatih rječnika u bliskoj budućnosti vrlo izvjestan, osobito u svjetlu činjenice da jedan od najpoznatijih i najkorištenijih rječnika na svijetu, Oxford English Dictionary, više ne izlazi u papirnatome obliku2 (Granger 2012). Ono što danas područje e-leksikografije potvrđuje kao zasebno istraživačko područje jest golem broj mrežnih (popularno online) rječnika te golema bibliografija istraživačkih doprinosa.3 Kad je riječ o razvoju e-leksikografije u području hrvatske jednojezične leksikografije, možemo pratiti vrlo sličan razvojni put, ali sa znatnim vremenskim zaostatcima u posljednjoj fazi razvoja. Iako je u samim začetcima pratila najnaprednije trendove, u hrvatskoj je e-leksikografiji u ključnome trenutku došlo do zastoja, pa je donedavno bio vidljiv golem zaostatak u broju i kvaliteti jednojezičnih mrežnih rječnika čak i u odnosu na druge slavenske jezike (v. Štrkalj Despot i Möhrs 2015). U ovome radu ukratko će se prikazati upravo taj razvojni put hrvatske e-leksikografije od prvih korpusno utemeljenih rječnika do najrecentnijega, prvoga izvorno digitalnoga mrežnoga rječnika Mrežnika te do niza specijaliziranih digitalnih leksičkih baza hrvatskoga jezika. Osobita će se pozornost pritom usmjeriti na leksikografske projekte kojima je Maja Bratanić dala važan prinos, a koji su se pokazali prijelomnim točkama u tome razvoju. To su: višejezični leksikografski projekt (engl. Multilingual Lexicography Project) Johna Sinclaira, čestotni rječnik

1 Više o fazama leksikografskoga procesa v. u Klosa 2013, Tiberius i Krek 2014; na hrvatskome Štrkalj Despot i Möhrs 2015. 2 Za više detalja v. npr. Dickson 2018. 3 Iscrpni popisi mrežnih rječnika i bibliografskih jedinica koji pripadaju području e-leksikografije jesu npr. OBELEX (http://www.owid.de) te Hartmann (2007).

7 Milana Moguša, Maje Bratanić i Marka Tadića te projekt STRUNA Hrvatske zaklade za znanost i Instituta za hrvatski jezik i jezikoslovlje.4

2. Korpusna revolucija Eri e-rječnika i e-leksikografije prethodila je „korpusna revolucija”, koja se dogodila u posljednjim dvama desetljećima 20. stoljeća i koja je radikalno i trajno izmijenila i leksikografiju, ali i jezikoslovna istraživanja uopće, koja su se, zasigurno ne slučajno, upravo u doba korpusne revolucije okrenula uporabno utemeljenim modelima jezika. Jasno je i da je tradicionalna leksikografija, koja na hrvatskim prostorima ima iznimno dugu, bogatu i plodnu povijest,5 bila utemeljena na golemoj i pomno priređenoj građi (godinama skupljani i pripremani ispisi na karticama), koja je itekako pružala uvid u leksičko bogatstvo i raspon značenja i uporaba (najbolji je dokaz tomu primjerice kapitalni Akademijin rječnik), no tek je suvremeni korpusni pristup doista omogućio uvid u frekvenciju riječi i pojedinih značenja te dubinski uvid u jezik „jer se samo promatranjem velikoga broja pojava iste leksičke jedinice može pouzdano saznavati o njezinu gramatičkom ponašanju, kolokacijskom potencijalu i drugim osobitostima sintagmatske prirode” (Bratanić 1998). Prvi elektronički korpusi poput Brownova korpusa nisu u znatnoj mjeri utjecali na promjenu procesa izrade rječnika vjerojatno zato što je u jednomilijunskome korpusu teško utvrditi statistički značajne pojavnice određenih riječi i postići relevantan sintaktički opis (Hanks

4 Osim u radu u leksikografskim projektima koji će se ovdje prikazati, Maja Bratanić imala je veliku ulogu i u područjima koja su tijesno vezana uz e-leksikografiju ili se na nju naslanjaju, a to su pravno prevođenje i upravljanje informacijama. Iznimno aktivno sudjelovala je u pripremama Hrvatske za pristupanje Europskoj uniji, pa je uz Glosar Sporazuma o stabilizaciji i pridruživanju između Republike Hrvatske i Europskih zajednica i njihovih država članica (2002), koji je priredila s Brankom Tafrom, uredila i Četverojezični rječnik prava Europske unije (2006). Rječnik je donedavno bio dostupan u elektroničkome obliku na poveznici http://norma.hidra.hr/rjecnik/, no trenutačno se može pronaći jedino kao dokument u PDF-u. Upravo je kao plod suradnje s Hrvatskom informacijsko-dokumentacijskom referalnom agencijom (HIDRA) nastala hrvatska inačica Pojmovnika EuroVoc (https://eur-lex.europa.eu/browse/eurovoc. html?locale=hr), višejezičnoga pojmovnika za obradu dokumentacijskih informacija institucija Europske unije, kojemu je Maja Bratanić bila glavna urednica. Hrvatski je jezik EuroVocom postao vidljiv u institucijama Europske unije i prije hrvatskoga pristupanja 2013. 5 Za pregled hrvatske leksikografije kroz povijest v. npr. Tafra i Fink Arsovski 2013.

8 2009), no poslužili su pri sastavljanju natuknica, osobito u konzultiranju primjera. Prvi rječnik koji se u znatnijoj mjeri oslanjao na primjenu računala bio je već spomenuti Longman Dictionary of Contemporary English (LDOCE) iz 1978. za učenje engleskoga jezika (engl. learnerʼs dictionary). Longmanov se rječnik temeljio na bazi podataka koja je sadržavala opsežan semantički sustav označivanja, koji je kasnije poslužio u projektima obrade prirodnoga jezika, a uveo je i ideju da se definicije pišu upotrebljavajući ograničen skup od 2000 najfrekventnijih riječi (Atkins i Rundell 2008: 112). Jedan od prijelomnih trenutaka u povijesti leksikografije jest projekt COBUILD (Collins Birmingham University International Language Database) Johna Sinclaira, vizionarskoga leksikografa i jezikoslovca. Jedan je to od prvih projekata u području računalnoga jezikoslovlja uopće te prvi projekt koji se bavio izradom i analizom elektroničkoga korpusa suvremenih tekstova, što je rezultiralo jednojezičnim rječnikom za učenje engleskoga jezika objavljenim 1987. godine – Collins COBUILD English Language Dictionary. Taj rječnik potpuno je utemeljen na podatcima iz korpusa te je bio revolucionaran za leksikografiju i inovativan na mnogim razinama, osobito, dakako, u svojoj računalno i tehnološki naprednoj korpusnoj utemeljenosti, ali i pristupima frazeologiji i reprezentaciji značenja (v. Hanks 2009, 2012, Lavid 2007, Stubbs 2011). Rezultat rada toga grandioznoga projekta s golemim brojem suradnika te znatnom sveučilišnom i izdavačkom potporom bio je za ono doba iznimno impresivan korpus od 7,3 milijuna riječi suvremenih engleskih tekstova. Istraživanje i organizacija značenja riječi koja je u podlozi metodologije izrade COBUILD-a temelji se na Sinclairovu stavu da je za temeljito razumijevanje značenja riječi potrebno promatrati riječi u kontekstu (koji Sinclair naziva kotekst) i posebice u kolokacijama, a što je postalo moguće sastavljanjem većega korpusa (Hanks 2009). Osim veće pouzdanosti i kvalitete jezičnih podataka u odnosu na prethodne rječnike, COBUILD se razlikovao i prezentacijom tih podataka korisniku, što je osobito vidljivo u navođenju potpunih primjera iz korpusa te u definicijama napisanima u obliku punih rečenica (engl. full-sentence definitions) koje sadržavaju definiranu riječ. Takav je pristup pisanju definicija osobito koristan za učenje jezika jer definicija simulira odgovor na pitanje Što je to? i prikazuje kolokacijske preferencije, valencijske obrasce ili sintaktičku ulogu riječi (Atkins i Rundell 2008: 441), no također može navesti

9 korisnika na pogrešan zaključak loše izabranom rečenicom, tj. stavljajući definiranu riječ u definiciju koja ne pokazuje najčešću upotrebu riječi.6 Od izrade COBUILD-a 1987., koji je radikalno izmijenio leksikografski proces, može se reći da je (e-)leksikografija zacrtala svoj stalan razvojni put koji se do danas nije znatno izmijenio – struja je to računalno naprednih korpusno utemeljenih rječnika, gramatika i jezičnih priručnika (Lavid 2007). Projekt COBUILD proširen je koncem osamdesetih godina 20. stoljeća u veliki međunarodni višejezični leksikografski projekt Vijeća Europe Multilingual lexicography project koji je od 1989. do 1991. vodio i koordinirao John Sinclair. Hrvatska se, pod vodstvom Maje Bratanić, istraživačkoj skupini pridružila 1990. godine, kada su uz engleski, talijanski, njemački i švedski u projekt uključeni i hrvatski i mađarski jezik (poslije još i španjolski). Cilj je projekta bio na temelju računalno dobivenih reprezentativnih korpusa svakoga od jezika (za hrvatski je to bio milijunski korpus, v. niže u tekstu) izgraditi fragment korpusno utemeljena višejezičnoga elektroničkoga rječnika, i to tako da se za svaku riječ određuju najčešći kontekstni obrasci i kolokacije te svi detalji semantičkoga i morfosintaktičkoga ponašanja leksema kako bi izbor prijevodnoga ekvivalenta bio što jednoznačniji (Bratanić 1993b). „Kad se takva analiza izvede na odgovarajućim primjerima iz dvaju jezika, i to istodobno u oba smjera, mogu se uspostaviti tzv. ‘čvoroviʼ prijevodne ekvivalencije koji više izravno ne ovise o bilo kojem od dvaju polaznih jezika pa se mogu povezivati s ekvivalentnim obrascima i u drugim jezicima. Svako posebno značenje riječi ili fraze s jedinstvenim kontekstom tada se udružuje u čvor prijevodne ekvivalencije.” (Bratanić 1993b: 24).7 Početni je cilj projekta bio uspostaviti metodologiju koja bi pouzdanije određivala prijevodne ekvivalente između jezika, a koja se provjeravala u prvoj fazi projekta usporedbom deset riječi engleskoga jezika: little (pridjev/ prilog); small, new (pridjevi); man, woman, time (imenice); know, say, tell, walk (glagoli), s njihovim ekvivalentima u ostalim projektnim jezicima (Bratanić 1997).8 Iako hrvatski jezik nije bio u ravnopravnu položaju s

6 V. Atkins i Rundell (2008: 442) za primjere te Rundell (2006) za detaljan prikaz nedostataka pisanja definicija u obliku punih rečenica. 7 S obzirom na to da se i danas nastoji ostvariti taj cilj, primjerice u okviru recentnoga Horizont 20/20 projekta ELEXIS (elex.is), jasno je koliko je i višejezičnim leksikografskim projektom Sinclair bio avangardan. 8 Bratanić (1997) detaljno opisuje sve tri faze istraživanja u okviru projekta i analizira hrvatske prijevodne ekvivalente odabranih engleskih riječi.

10 ostalim jezicima u projektu zato što za hrvatski jezik nije postojao korpus koji bi se mogao uspoređivati s COBUILD-ovim, što je bilo izraženo u drugoj i trećoj fazi projekta kad jednomilijunski korpus hrvatskoga jezika nije mogao pružiti dovoljan broj potvrda za izabrane riječi (Bratanić 1997: 4), hrvatski je jezik sudjelovanjem u tome prijelomnome projektu bio aktivan dio razvoja suvremenih svjetskih leksikografskih metoda. Kad je riječ o hrvatskome korpusnome jezikoslovlju, pionirski je projekt bio projekt izgradnje prvoga u lingvističke svrhe sustavno koncipiranoga računalnoga korpusa hrvatskoga jezika.9 Taj su projekt 1976. godine pokrenuli Milan Moguš i Željko Bujas u Zavodu za lingvistiku Filozofskoga fakulteta u Zagrebu,10 a na projektu je sudjelovala i Maja Bratanić. Projekt sastavljanja korpusa tekstova hrvatskoga književnoga jezika u opsegu od milijun riječi pod nazivom Korpus suvremenog hrvatskog književnog jezika završen je početkom devedesetih godina prošloga stoljeća (Bratanić 1993a, Tadić 1997). Bio je to projekt koji je u stopu pratio razvoj svjetske korpusnojezikoslovne scene jer je tek nekoliko godina zaostajao za uspostavom Brownova korpusa suvremenoga američkoga engleskoga jezika i korpusa COBUILD, koji se smatraju početkom suvremene korpusne lingvistike (v. Bratanić 1993a i 1998). Na temelju toga korpusa 1999. nastao je i prvi potpuno korpusno vođen rječnik: Hrvatski čestotni rječnik Milana Moguša, Maje Bratanić i Marka Tadića. Korpus hrvatskoga književnoga jezika obuhvaćao je tekstove

9 Za pregled nekoliko korpusnih projekata koji su prethodili jednomilijunskomu korpusu v. Tadić 1997 i Klobučar Srbić 2008. 10 Sastavljanju korpusa suvremenoga hrvatskoga književnog jezika prethodio je projekt sastavljanja dijakronijskoga korpusa hrvatskoga jezika, koji se zvao Kompjutorska analiza tekstova stare hrvatske književnosti, u okviru kojega su konkordirana hrvatska Marulićeva djela, djela Barne Karnarutića, Zoranićeve Planine, Pelegrinovićeva Jejupka, djela Hanibala Lucića i Petra Hektorovića, Benetovićeva Hvarkinja, Ranjinin zbornik, Držićeve komedije, djela Ivana Bunića Vučića, Vitezovićeva djela, Kanižlićeva Sveta Rožalija, komedije Tituša Brezovačkoga i Razvod istarski (detaljnije u Tadić 1997). Navedene konkordancije djela starijih hrvatskih pisaca bile su konzultirane, na primjer, pri radu na Dopunama Akademijina rječnika (Bratanić 1990). Golema je šteta što je ovaj iznimno rani hrvatski iskorak u računalnu analizu starije hrvatske književnosti ostao usamljen i nije urodio sljedbenicima, pa do danas nemamo računalnoga dijakronijskoga korpusa hrvatskoga jezika. Dakako, posljedično su izostali i pokušaji leksikografske obrade takva korpusa. Nažalost, ono što je Tadić (1997: 389) utvrdio za dijakronijski korpus nastao početkom sedamdesetih, a to je da je „za tog projekta hrvatska korpusna lingvistika bila potpuno u svjetskom trendu”, danas ne samo da više nije aktualno nego, s obzirom na primjenu jezičnih tehnologija na stare tekstove, možemo reći upravo suprotno: u golemu je zaostatku.

11 u rasponu od 45 godina, od objavljivanja Povratka Filipa Latinovića do 1975. te je bio podijeljen na pet jednakih potkorpusa: prozu, poeziju, dramu, udžbeničke tekstove i novine (Moguš 1998). Rječnik je sastavljen od triju cjelina, od kojih je svaka zaseban rječnik. Prva je Čestotni rječnik (natuknice su poredane prema učestalosti pojavljivanja), druga je Abecedni rječnik (natuknice su abecedno poredane, s podatkom o učestalosti), a treća je Abecedni rječnik s pojavnicama (natuknice popraćene popisom i frekvencijom svih oblika u kojima su se pojavile). U prvome su dijelu rječnika navedene najfrekventnije riječi u korpusu – od, očekivano, glagola biti na prvome mjestu s 56 194 potvrde do pridjeva crn sa 610 potvrda – koje se pojavljuju u svim potkorpusima. U drugim su dvama dijelovima rječnika natuknice poredane abecednim redom te se uz podatak o čestoći navodi i podatak u kojem se potkorpusu riječ pojavljuje. Govoreći o metodološkim dvojbama na koje su priređivači naišli tijekom sastavljanja rječnika, Moguš među ostalim ističe pitanje uključivanja tuđica koje se razmjerno često pojavljuju, npr. u Krležinim djelima koja su dijelom korpusa. Smatrajući da strane elemente u njihovu izvornu obliku ne treba unositi u rječnik hrvatskoga jezika, autori su uključili fonološki i morfološki prilagođene posuđenice poput jahta i pamflet (Moguš 1998: 75). Također su izostavljena sva vlastita imena. Dijalektizmi, kao još jedno obilježje književnih tekstova, pronašli su svoje mjesto u čestotnome rječniku, ali uz različito bilježenje. Dijalektizmi koji se od riječi standardnoga jezika razlikuju samo fonološki (npr. imenice snig i sneg, pridjev gladen) navedeni su pod standardnim natuknicama (snijeg odnosno gladan), dok su leksički dijalektizmi (bogek, cucek, kantun) navedeni kao posebne natuknice koje su označene kao nestandardni oblici (Moguš 1998: 76). Građa Čestotnoga rječnika hrvatskoga jezika poslužila je kao polazište mnogim kasnijim lingvističkim i drugim srodnim istraživanjima. Kao vrsta leksikografskoga djela koja je od osobite važnosti za definiranje temeljnoga vokabulara kojega jezika, čestotni rječnik važan je u izradi kurikula i pripremi vokabulara za poučavanje hrvatskoga kao stranoga jezika, no svoju je primjenu našao i u izradi specijaliziranih jezičnih resursa te u obradi prirodnoga jezika. Izuzevši dakako razdoblje stagnacije u vrijeme Domovinskoga rata, i korpusno su se i računalno jezikoslovlje nakon ovoga početnoga procvata nastavili i u Hrvatskoj zadovoljavajuće razvijati (za pregled razvoja do 1997. te plan do 2000. v. Tadić 1997), osobito nakon izrade Hrvatskoga nacionalnoga korpusa (Tadić 1997), koji je utro put izgradnji ostalih korpusa hrvatskoga jezika, tj. Hrvatskoj jezičnoj riznici (Brozović Rončević i dr. 2018) i hrWaC-u kao najvećem korpusu hrvatskoga jezika

12 (Ljubešić i Klubička 2016). No nažalost, sasvim je izostala sustavna računalna leksikografska obrada dostupnih korpusa. Osim Hrvatskoga čestotnoga rječnika određene su iznimke u tome smislu još samo Hrvatski školski rječnik (Birtić i dr. 2012) i Veliki rječnik hrvatskoga standardnog jezika (Jojić 2015). Hrvatski školski rječnik temelji se na Hrvatskome jezičnome korpusu, tj. računalnome korpusu tekstova hrvatskoga jezika koji je sastavnica institutskoga programa Hrvatska jezična riznica. Pri leksikografskoj obradbi obrađivači su provjeravali značenja i uporabu riječi u korpusu, ali primjeri nisu izravno preuzimani iz korpusa. Pri odabiru natuknica za Veliki rječnik hrvatskoga standardnog jezika priređivači su se služili računalnim jezičnim korpusima te su primjeri koji su navođeni uz svaki sloj značenja preuzimani iz tih korpusa (Jojić 2015). Iako je još devedesetih godina bio sasvim razvidan leksikografski potencijal korpusa,11 a i hrvatska leksikografija svojom uključenošću u same začetke razvoja discipline imala je odličnu početnu poziciju, to nažalost nije na pravi način iskorišteno, pa je tek prvim hrvatskim mrežnim rječnikom Mrežnikom (čija je izrada počela 2017. godine u Institutu za hrvatski jezik i jezikoslovlje) uspostavljena sustavna obrada korpusa za leksikografske potrebe, i to uporabom alata (v. 3. poglavlje).

3. Hrvatska jednojezična e-leksikografija Recentno stanje u istraživačkome području jednojezične e-leksikografije u Hrvatskoj analizirale su i klasificirale Štrkalj Despot i Möhrs (2015) po uzoru na analize nekih drugih nacionalnih leksikografija, npr. de Schryver (2003) i Klosa (2013) te uzimajući u obzir specifičnosti hrvatskih leksikografskih dosega nakon spomenute korpusne revolucije. Ondje se iznosi ovakva klasifikacija elektroničke jednojezične hrvatske leksikografije, dopunjena podatcima iz prve polovice 2020.:12 1. rječnici vođeni korpusom: Hrvatski čestotni rječnik (Moguš, Bratanić i Tadić 1999) i Rječnik Marulićeve Judite (Moguš 2001)

11 Usp. Bratanić (1993a: 21): „Svrha je ovoga prikaza upozoriti na nezanemarivo velik leksikografski potencijal (već i) jednomilijunskoga korpusa hrvatskoga jezika, na pouzdanost tako priređene građe, na mogućnost odabira primjera iz ʻprirodnogaʼ jezika te lako dostupno bogatstvo materijala za istraživanje gramatičkih i leksičkih sveza i fraza.ˮ 12 Klasifikacija se temelji na dvama kriterijima: utemeljenosti rječnika na korpusu te dostupnosti korisnicima. Stoga se neki rječnici mogu pojaviti u više od jedne skupine klasifikacije.

13 2. rječnici utemeljeni na korpusu: Školski rječnik hrvatskoga jezika (Birtić i dr. 2012) i Veliki rječnik hrvatskoga standardnog jezika (Jojić 2015) 3. rječnici dostupni u digitalnome obliku (zatvoreni pristup: CD/DVD, kod): Prvi školski rječnik hrvatskoga jezika (Čilaš Šimpraga, Jojić i Lewis 2008) i Veliki rječnik hrvatskoga standardnog jezika (Jojić 2015) 4. rječnici dostupni na mreži (otvoreni pristup): Hrvatski jezični portal (hjp.novi-liber.hr/)13 i Školski rječnik hrvatskoga jezika (rjecnik.hr/) 5. leksičke baze otvorenoga pristupa (uključujući i terminološke): npr. hrvatski WordNet CroWN (meta-share.ffzg.hr/repository/browse/ croatian-wordnet),14 baza semantičkih okvira i konceptualnih metafora MetaNet.HR (ihjj.hr/metafore), baza valencija e-Glava (valencije. ihjj.hr/), baza kolokacija (ihjj.hr/kolokacije/), Struna (struna.ihjj.hr), HRANA (hrana.ffzg.hr/), Hrvatska leksička baza (HLB, polin-hlb.erf. hr/) itd. 6. rječnički portali (uključujući i terminološke): Portal hrvatske rječničke baštine (crodip.ffzg.hr/),15 Hrvatski jezični portal (hjp.novi- liber.hr/),16 Hrvatski terminološki portal (nazivlje.hr/)17.

Iz gore navedenoga pregleda može se lako uvidjeti da većinu hrvatskih općih jednojezičnih rječnika (uključujući i školske rječnike) čine tiskani rječnici. Nadalje, većina je tih rječnika ponajprije ručno priređivana uz nikakvu ili vrlo ograničenu uporabu korpusa (v. Despot i dr. 2019a). Trenutačno su Školski rječnik hrvatskoga jezika i Hrvatski jezični portal jedina dva besplatno i javno dostupna jednojezična mrežna rječnika hrvatskoga jezika. Korisnicima je u digitalnome obliku dostupan i

13 HJP je zapravo portal, ali ga ovdje navodimo jer je vrlo popularan i korisnici se njime služe prije svega kao mrežnim rječnikom. 14 Poveznica na hrvatski WordNet nije aktivna duže vrijeme, no navodimo ju u obliku u kojem je navedena na dostupnim stranicama o hrvatskim jezičnim resursima. 15 Na ovome se portalu mogu pretraživati i pregledavati digitalizirani tekstovi te pregledavati slike izvornika dvadesetak rječnika hrvatskoga jezika iz razdoblja od 16. do konca 19. stoljeća. 16 Dinamičan mrežni rječnik hrvatskoga jezika nastao digitalizacijom nekoliko izvorno tiskanih leksikografskih djela. 17 Portal Instituta za hrvatski jezik i jezikoslovlje u jedinstvenoj portalskoj tražilici zajednički pretražuje građu iz terminološke baze Struna, baze podataka s već objavljenim rječnicima, glosarima i leksikonima, nazive iz resursa Leksikografskoga zavoda Miroslav Krleža te nazive iz norma Hrvatskoga zavoda za norme.

14 Veliki rječnik hrvatskoga standardnog jezika zasnovan na aplikaciji, ali dostupan je samo uz kupnju tiskane inačice rječnika. No nijedan od tih triju rječnika nije izvorno digitalan ni korpusno utemeljen prema suvremenim standardima. Trenutačno najveći hrvatski leksikografski projekt jest upravo izrada izvorno digitalnoga (engl. digital born) mrežnoga rječnika hrvatskoga jezika, i to uporabom suvremenih alata za izradu rječnika i alata za pretragu i statističku analizu korpusa. Hrvatski mrežni rječnik – Mrežnik izrađuje se u Institutu za hrvatski jezik i jezikoslovlje pod vodstvom Lane Hudeček (v. Hudeček i Mihaljević 2017, 2018). Cilj je toga projekta izrada javno dostupnoga jednojezičnoga, korpusno utemeljenoga, hipertekstnoga, lako pretraživa mrežnoga rječnika hrvatskoga standardnoga jezika. Obrada uključuje tri modula: modul za odrasle izvorne govornike, modul za djecu školske dobi i modul za strance. Mrežnik se temelji na dvama korpusima hrvatskoga jezika, hrWac (Ljubešić i Klubička 2016) i Hrvatska jezična riznica (Brozović Rončević i dr. 2018), koji se obrađuju s pomoću korpusnoga alata Sketch Engine (Kilgariff i dr. 2014). Rječnik se izrađuje u TLex sustavu za izradu rječnika (Hudeček i Mihaljević 2017) i važna je metodološka prekretnica u razvoju hrvatske leksikografije koja hrvatski jezik nakon preduge stanke nanovo uključuje u standarde suvremene europske e-leksikografije.18 Specijalizirane leksičke baze hrvatskoga jezika pojavljuju se gotovo isključivo u digitalnome obliku.19 Uglavnom jesu temeljene na nekome od korpusa, ali nisu vođene korpusom. No primjerice u okviru izrade baze semantičkih okvira i konceptualnih metafora MetaNet.HR razvijena je egzaktna metoda analize korpusa uporabom alata za obradu korpusa Sketch Engine kako bi podatci koji se unose u bazu bili jezično specifični (detaljan opis metode u Despot i dr. 2019b).

18 Hrvatska je leksikografija i dalje bez još jednoga vrlo važnoga leksikografskoga djela koje je inače sastavni dio jednojezične leksikografije većine standardnih jezika razvijene leksikografije, a to je tezaurus hrvatskoga jezika. Somatski tezaurus hrvatskoga jezika zasad je jedini konceptualno ustrojen rječnik hrvatskoga jezika, no nije još dostupan javnosti (www.ljudski.org). Rječnik je nastao u okviru projekta koji su činile Maja Bratanić, Irena Kolbas i Ines Kotarac pod vodstvom Anje Nikolić-Hoyt te čini dio budućega Tezaurusa čovjeka. V. o rječniku i nacrtu tezaurusa hrvatskoga jezika u Nikolić-Hoyt 2014. 19 Primjerice uz bazu e-Glava nastao je i tiskani Valencijski rječnik psiholoških glagola u hrvatskome jeziku (Birtić i dr. 2018).

15 Jedna od najvećih i po broju korisnika najvažnijih leksičkih baza hrvatskoga jezika jest terminološka baza Struna. Prva (i zasad jedina) hrvatska nacionalna terminološka baza razvijena je u okviru programa Izgradnja hrvatskoga strukovnoga jezika (STRUNA) Hrvatske zaklade za znanost i Instituta za hrvatski jezik i jezikoslovlje. Baza je otvorena za javnost u veljači 2012. i od tada je postala međunarodno prepoznatljivo ime hrvatske terminologije i e-leksikografije općenito. Nakon pripremnoga projekta koji je trajao od 2008. do 2009., metodološki složen i opsežan terminološki rad na Struni doživio je svoj procvat upravo pod vodstvom Maje Bratanić od 2009. do konca 2015. godine.20 Kako se terminološke baze rubno uvrštavaju u leksikografske klasifikacije, tako rubno možemo smjestiti Strunu u resurse jednojezične hrvatske leksikografije. Premda se ekvivalenti hrvatskih naziva definiranih u bazi navode na nekoliko jezika, Struna ipak nije u klasičnome smislu višejezična terminološka baza zato što ne donosi definicije ili kontekste u kojima se pojavljuju nazivi na drugim jezicima osim na hrvatskome. Navest ćemo ukratko najvažnije značajke baze i organiziranoga terminološkoga rada kojima je Struna postala važnim dijelom suvremene hrvatske e-leksikografije.21 Specifična organizacija terminološkoga rada koja podrazumijeva tijesnu suradnju terminologa i jezikoslovaca s predmetnim stručnjacima možda je najvažnije značajka Strune koja ju izdvaja iz većine terminoloških baza, osobito onih koje se nazivaju nacionalnima. Dok je većina nacionalnih terminoloških baza izgrađena tako da je u njih okupljena postojeća terminološka građa, Struna je izgrađena „od nuleˮ definiranjem nazivlja raznolikih, uglavnom nepovezanih strukovnih domena. Metodologija zadana propozicijama natječaja kojima je Hrvatska zaklada za znanost dodjeljivala sredstva pojedinim strukama koje su se prijavljivale za rad na nazivlju određivala je da predmetni stručnjaci uz kratku naobrazbu preuzmu ulogu terminologa i sami definiraju nazivlje svoje struke. Terminolozi koji su zatim pregledavali obrađene terminološke unose usklađivali su i dorađivali definicije naziva unutar struke, ali prema potrebi i na razini cijele baze. Složen tijek rada uključivao je autore, voditelja svakoga projekta u ulozi urednika, terminologa, jezičnoga savjetnika, drugoga terminologa te naposljetku opet urednika koji zaključava svaku natuknicu i time ju odobrava za otvaranje u tražilicu (Brač i Lončar 2012). Dakako, terminološki rad koji okuplja tako

20 Poslije Maje Bratanić na čelu Strune kraće je razdoblje bio Željko Jozić (od siječnja 2016. do listopada 2017.), a od studenoga 2017. program vodi Bruno Nahod. 21 Više o razvoju i strukturi baze u Brač, Bratanić i Ostroški Anić 2015 te Bratanić i Ostroški Anić 2015.

16 velik broj ljudi mora biti temeljito propisan i redovito nadziran.22 Velik broj kategorija podataka koje se nalaze u Struni odražava i prijelaz između preskriptivno zamišljene do deskriptivno realizirane baze. Premda svaki terminološki resurs nužno propisuje nazivlje navodeći preporučene nazive, tj. one koji se ili već upotrebljavaju ili trebaju upotrebljavati u relevantnu jezičnome kontekstu, kategorija napomene često detaljno obrazlaže potrebu i opravdanost upotrebe i istoznačnica preporučenih naziva, osobito dopuštenih naziva (npr. internacionalizama) i žargonizama. Opisujući dijakronijski razvoj određenih naziva (npr. u pravnome i muzikološkome nazivlju) i razlike u upotrebi ili značenju pojmova (npr. u jezikoslovnome, arheološkome ili antropološkome nazivlju), terminološki se opis pojedinih pojmova često približavao opisu kakav nalazimo u bazama znanja, a ne u tradicionalnim terminološkim bazama. Naposljetku, široka prihvaćenost baze u prevoditeljskoj zajednici uvelike je rezultat jednostavnosti i intuitivnosti tražilice u kojoj se nazivlje besplatno pretražuje (struna.ihjj. hr), a koja je od samoga početka zamišljena tako da nalikuje popularnim internetskim tražilicama i time od korisnika ne zahtijeva prethodno znanje. Radno sučelje za unos i obradu naziva također je osmišljeno tako da bude prikladno za rad široku rasponu stručnjaka koji nemaju nužno iskustvo u radu s bazama podataka. No bez obzira na intuitivnost upotrebe, Struna ne bi bila prihvaćena među korisnicima da nije bilo kontinuiranoga rada na vidljivosti baze, terminoloških istraživanja koja su provedena u okviru projekata te redovitih edukacija i javnih izlaganja.23

4. Zaključak Prvi pravi izvorno digitalni mrežni rječnici pojavili su se u devedesetim godinama, kad se razvoj leksikografije u elektroničkome smjeru iznimno ubrzao nošen razvojem novih medija i tehnologija. Prijelaz od strojno čitljiva rječnika prema leksičkoj bazi podataka rezultirao je revolucionarnim

22 Struna u travnju 2020. uključuje nazivlje iz 31 strukovne domene, od kojih je 28 financirano projektima u okviru programa Struna Hrvatske zaklade za znanost. Od toga su 23 projekta otvorena za javnost u tražilici, dok su ostali još u radu ili čekaju završno vrednovanje projekta da bi mogli biti otvoreni. 23 Možda je i najvažnije nasljeđe Strune skupina stručnjaka s obrazovanjem u području terminologije, specijalizirane leksikografije i obrade prirodnoga jezika koji su svoje znanje i iskustvo nastavili primjenjivati u drugim leksikografskim i računalnolingvističkim projektima, a koji su svi proizišli iz terminološkoga rada na Struni.

17 promjenama u leksikografskoj obradi i prezentaciji građe korisniku, ali i u načinu na koji se korisnik podatcima služi. Hrvatska leksikografija svojom uključenošću u prve korpusne projekte (i dijakronijske i sinkronijske), a time i u same začetke razvoja discipline e-leksikografije, imala je odličnu početnu poziciju mogućega iskorištavanja toga golemoga leksikografskoga potencijala. To nažalost nije na pravi način iskorišteno. Nakon početnoga zamaha i praćenja najrecentnijih trendova sedamdesetih godina 20. stoljeća, bio je vidljiv golem zaostatak, pa smo prvi izvorno digitalni rječnik hrvatskoga jezika dobili s tridesetak godina zakašnjenja u odnosu na začetke toga tipa rječnika te desetak godina zakašnjenja u odnosu na druge slavenske jezike. Hrvatska leksikografska produkcija općih jednojezičnih rječnika (uključujući i školske rječnike) u razdoblju procvata e-leksikografije u svijetu (posljednjih trideset godina) bila je u prvom redu usmjerena tiskanim rječnicima, i to onima ponajprije ručno priređivanima uz nikakvu ili vrlo ograničenu uporabu korpusa. Trenutačno su korisnicima dostupna samo dva besplatna mrežna jednojezična rječnika: Školski rječnik hrvatskoga jezika i Hrvatski jezični portal te jedan e-rječnik dostupan uz kupnju svoje tiskane inačice (Veliki rječnik hrvatskoga jezika). No nijedan od tih triju rječnika nije izvorno digitalan ni utemeljen na recentnim standardima e-leksikografije, osobito u smislu uporabe alata za pretragu i analizu korpusa i izradu rječnika. Trenutačno najveći hrvatski leksikografski projekt jest upravo izrada takva, izvorno digitalnoga mrežnoga rječnika suvremenoga hrvatskoga jezika (Mrežnik), koji se izrađuje u Institutu za hrvatski jezik i jezikoslovlje. S obzirom na tu činjenicu te na brojnost i visoku kvalitetu specijaliziranih leksičkih baza, osobito onih terminoloških, možemo se nadati da ćemo, po uzoru na avangardne začetke hrvatskoga korpusnoga jezikoslovlja u kojima je Maja Bratanić imala važnu ulogu, promišljenim i dobro osmišljenim projektima i ugledanjem u primjere najbolje prakse, uspjeti nadoknaditi sve zaostatke te se prestati svrstavati u zemlje siromašne jezičnim resursima i tehnologijama.

Literatura Atkins, Sue; Rundell, Michael. 2008. The Oxford Guide to Practical Lexicography. Oxford University Press. Oxford. Béjoint, Henri. 2010. The Lexicography of English. Oxford University Press. Oxford.

18 Birtić, Matea Andrea; Blagus Bartolec, Goranka; Hudeček, Lana; Jojić, Ljiljana; Kovačević, Barbara; Lewis, Kristian; Matas Ivanković, Ivana; Mihaljević, Milica; Miloš, Irena; Ramadanović, Ermina; Vidović, Domagoj. 2012. Školski rječnik hrvatskoga jezika. Institut za hrvatski jezik i jezikoslovlje – Školska knjiga. Zagreb. Birtić, Matea; Bošnjak Botica, Tomislava; Brač, Ivana; Matas Ivanković, Ivana; Oraić Rabušić, Ivana; Runjaić, Siniša. 2018. Valencijski rječnik psiholoških glagola u hrvatskome jeziku. Institut za hrvatski jezik i jezikoslovlje. Zagreb. Brač, Ivana; Bratanić, Maja; Ostroški Anić, Ana. 2015. Hrvatsko nazivlje i nazivoslovlje od Šuleka do Strune – hrvatski jezik i terminološko planiranje. Od Šuleka do Schengena: terminološki, terminografski i prijevodni aspekti jezika struke. Ur. Bratanić, Maja; Brač, Ivana; Pritchard, Boris. Institut za hrvatski jezik i jezikoslovlje – Pomorski fakultet u Rijeci. Zagreb – Rijeka. 3–26. Bratanić, Maja. 1990. Uloga korpusa u leksikografiji. Informatička tehnologija u primijenjenoj lingvistici. Ur. Andrijašević, Marin; Vrhovac, Yvonne. Društvo za primijenjenu lingvistiku Hrvatske. Zagreb. Bratanić, Maja. 1993a. Leksikološko-leksikografski potencijal jednomilijunskoga korpusa hrvatskoga književnog jezika. Bilten Zavoda za lingvistiku 6. 17–21. Bratanić, Maja. 1993b. Izgradnja hrvatske i višejezične baze podataka (I. faza). Bilten Zavoda za lingvistiku 6. 23–25. Bratanić, Maja. 1997. Od intuicije do opservacije i natrag (Višejezična leksikografija i paralelni korpusi). Suvremena lingvistika 43/44. 1–12. Bratanić, Maja. 1998. Korpusna lingvistika na kraju 20. stoljeća i implikacije za suvremenu hrvatsku leksikografiju. Filologija 30/31. 171–177. Bratanić, Maja (ur.). 2006. Četverojezični rječnik prava Europske unije: engleski, hrvatski, francuski, njemački. HIDRA. Zagreb. Bratanić, Maja; Tafra, Branka (ur.). 2002. Glosar Sporazuma o stabilizaciji i pridruživanju između Republike Hrvatske i Europskih zajednica i njihovih država članica: englesko-hrvatski i hrvatsko-engleski. Ministarstvo za europske integracije. Zagreb. Bratanić, Maja; Lončar, Maja. 2012. Terminološke škole i terminografska praksa. Aktualna istraživanja u primijenjenoj lingvistici: Zbornik radova s 25. međunarodnog skupa HDPL-a održanog 12. – 14. svibnja 2011. u Osijeku. Ur. Leonard, Pon; Karabalić, Vladimir; Cimer, Sanja. Hrvatsko društvo za primijenjenu lingvistiku. Osijek. 1–14.

19 Bratanić, Maja; Ostroški Anić, Ana. 2015. Koncepcija i ustrojstvo terminološke baze Struna. Od Šuleka do Schengena: terminološki, terminografski i prijevodni aspekti jezika struke. Ur. Bratanić, Maja; Brač, Ivana; Pritchard, Boris. Institut za hrvatski jezik i jezikoslovlje – Pomorski fakultet u Rijeci. Zagreb – Rijeka. 57–73. Brozović Rončević, Dunja; Ćavar, Damir; Ćavar, Małgorzata Ewa; Stojanov, Tomislav, Štrkalj Despot, Kristina; Ljubešić, Nikola; Erjavec, Tomaž. 2018. corpus Riznica 0.1. Slovenian language resource repository CLARIN.SI. http://hdl.handle.net/11356/1180 (pristupljeno 14. travnja 2020.). Caruso, Valeria. 2013. From e-Lexicography to Electronic Lexicography. A Joint Review. Lexikos 23. 585–610. de Schryver, Gilles-Maurice. 2003. Lexicographers’ Dreams in the Electronic-Dictionary Age. International Journal of Lexicography 16/2. 143–199. Čilaš Šimpraga, Ankica; Jojić, Ljiljana; Lewis, Kristian. 2008. Prvi školski rječnik hrvatskoga jezika. Školska knjiga – Institut za hrvatski jezik i jezikoslovlje. Zagreb. Despot, Kristina Štrkalj; Hudeček, Lana; Stojanov, Tomislav; Ljubešić, Nikola. 2019a. State-of-the-art on monolingual lexicography for Croatia (Croatian). Slovenščina 2.07/1. 65–77. Despot, Kristina Štrkalj; Tonković, Mirjana; Brdar, Mario; Essert, Mario; Perak, Benedikt; Ostroški Anić, Ana; Nahod, Bruno; Pandžić, Ivan. 2019b. MetaNet.HR: Croatian Metaphor Repository. Metaphor and Metonymy in the Digital Age. Ur. Bolognesi, Marianna; Brdar, Mario; Despot, Kristina. John Benjamins Publishing Company. Amsterdam. 123–146. Dickson, Andrew. 2018. Inside the OED: can the world’s biggest dictionary survive the internet? The Guardian, 23 February 2018. https://www. theguardian.com/news/2018/feb/23/oxford-english-dictionary-can- worlds-biggest-dictionary-survive-internet (pristupljeno 6. siječnja 2020.). Duda, Walter i dr. 1986. Zu einer Theorie der zweisprachigen Lexikographie. Überlegungen zu einen neuen russisch-deutschen Wörterbuch. AkademieVerlag. Berlin. Fuertes-Olivera, Pedro A.; Bergenholtz, Henning (ur.). 2011. e-Lexicography: The Internet, Digital Initiatives and Lexicography. Continuum. London – New York.

20 Gouws, Rufus H. 2011. Learning, Unlearning and Innovation in the Planning of Electronic Dictionaries. e-Lexicography: The Internet, Digital Initiatives and Lexicography. Ur. Fuertes-Olivera, Pedro A.; Bergenholtz, Henning. Continuum. London – New York. 17–29. Granger, Sylviane. 2012. Electronic lexicography: From challenge to opportunity. Electronic Lexicography. Ur. Granger, Sylviane; Paquot, Magali. Oxford University Press. Oxford. 1–11. Hanks, Patrick. 2009. The Impact of Corpora on Dictionaries. Contemporary . Ur. Baker, Paul. Continuum. London. Hanks, Patrick. 2012. The corpus revolution in lexicography. International Journal of Lexicography 25/4. 398–436. Hartmann, Reinhard K. 2007. Bibliography of Lexicography. http:// euralex. pbworks.com (pristupljeno 14. travnja 2020.). Hudeček, Lana; Mihaljević, Milica. 2017. The Croatian Web Dictionary Project – Mrežnik. Electronic lexicography in the 21st century. Proceedings of eLex 2017 conference. Ur. Kosem, Iztok et al. Lexical Computing CZ s.r.o. Brno – Leiden. 172–192. Hudeček, Lana; Mihaljević, Milica. 2018. Croatian Web Dictionary Mrežnik: One year later – What is different? Proceedings of the Conference on Language Technologies & Digital Humanities. Ur. Fišer, Darja; Pančur, Andrej. Ljubljana. 106–113. Jojić, Ljiljana (ur.). 2015. Veliki rječnik hrvatskoga standardnog jezika. Školska knjiga. Zagreb. Kilgarriff, Adam; Baisa, Vít; Bušta, Jan; Jakubíček, Miloš; Kovář, Vojtěch; Michelfeit, Jan; Rychlý, Pavel; Suchomel, Vít. 2014. The Sketch Engine: ten years on. Lexicography 1. 7–36. Klobučar Srbić, Iva. 2008. Obol korpusne lingvistike suvremenoj leksikografiji. Studia lexicographica 2/2(3). 39–51. Klosa, Annette. 2013. The lexicographical process (with special focus on online dictionaries). Dictionaries. An International Encyclopedia of Lexicography: Supplementary Volume. Recent developments with focus on electronic and computational lexicography. Ur. Gouws, Rufus Hjalmar i dr. De Gruyter. Berlin – Boston. 517–524. Lavid, Julia. 2007. To the memory of John Sinclair, Professor of Modern English Language. Estudios Ingleses de la Universidad Complutense 15. 9–12.

21 Ljubešić, Nikola; Klubička, Filip. 2016. Croatian web corpus hrWaC 2.1. Slovenian language resource repository CLARIN.SI. http://hdl.handle. net/11356/1064. Moguš, Milan. 1998. O hrvatskom čestotnom rječniku. Filologija 30/31. 71–78. Moguš, Milan. 2001. Rječnik Marulićeve Judite. Institut za hrvatski jezik i jezikoslovlje. Zagreb. Moguš, Milan; Bratanić, Maja; Tadić, Marko. 1999. Hrvatski čestotni rječnik. Zavod za lingvistiku Filozofskoga fakulteta – Školska knjiga. Zagreb. Nikolić-Hoyt, Anja. 2014. Tezaurusni portret čovječjega tijela. Hrvatska sveučilišna naklada. Zagreb. Procter, Paul (ur.). 1978. Longman dictionary of contemporary English. Longman. Harlow. Rundell, Michael. 2006. More than One Way to Skin a Cat: Why Full- Sentence Definitions Have not Been Universally Adopted. Proceedings of the 12th EURALEX International Congress. Ur. Corino, Elisa; Marello, Carla; Onesti, Cristina. Torino. 323–337. Scerba, Lev V. 1940. Towards a General Theory of Lexicography. International Journal of Lexicography 8/4. 315–350. Sinclair, John (ur.). 1987. Collins COBUILD English language dictionary. Collins. London. Sorokoletov, Fedor P. 1978. Traditionen der sowjetrussischen Lexikographie. Aspekte der sowjetrussischen Lexikographie. Übersetzungen, Abstracts, bibliographische Angaben. Ur. Wolski, Werner. Max Niemeyer. Tübingen. 63–88. Stubbs, Michael. 2011. A Tribute to John McHardy Sinclair (14 June 1933 –13 March 2007). The Phraseological View of Language: A Tribute to John Sinclair. Ur. Herbst, Thomas; Faulhaber, Susen; Uhrig, Peter. Mouton de Gruyter. Berlin. 1–16. Štrkalj Despot, Kristina; Möhrs, Christine. Pogled u e-leksikografiju. Rasprave Instituta za hrvatski jezik i jezikoslovlje 41/2. Zagreb. 329–353. Tadić, Marko. 1997. Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive. Suvremena lingvistika 43/44. 387–394. Tafra, Branka; Fink Arsovski, Željka. 2013. Хорватская лексикография. Славянская лексикография. Ur. Černyševa, M. I. Azbukovnik. Moskva.

22 Tarp, Sven. 2012. Theoretical Challenges in the Transition from Lexicographical p-works to e-tools. Electronic Lexicography. Ur. Granger, Sylviane; Paquot, Magali. Oxford University Press. Oxford. 107–118. Tiberius, Carole; Krek, Simon. 2014. Workflow of Corpus-Based Lexicography. Proceedings of the 2nd COST ENeL Working Group 3 (“Innovative e-dictionariesˮ) Meeting: “Workflow of Corpus-based Lexicography”. http://www.elexicography.eu/wp-content/uploads/2015/ 04/Lexicographicalworkflow_Deliverable WG3 Bolzano Meeting2014.pdf (pristupljeno 14. travnja 2020.). Wiegand, Herbert E. 1999. Wörterbuchforschung. Untersuchungen zur Wörterbuchbenutzung, zur Theorie, Geschichte, Kritik und Automatisierung der Lexikographie. 1. Teilband. De Gruyter. Berlin – New York. Zgusta, Ladislav. 1992. The Czech–Chinese Dictionary and the Theory of Lexicography. International Journal of Lexicography 5/2. 85–128.

Mrežni izvori Baza hrvatskih glagolskih valencija e-Glava. valencije.ihjj.hr/ (pristupljeno 15. srpnja 2020.). CroWN. Hrvatski WordNet. hnk.ffzg.hr/crown// (poveznica nije aktivna). European Lexicographic Infrastructure (ELEXIS). elex.is (pristupljeno 25. kolovoza 2020.). EuroVoc. https://eur-lex.europa.eu/browse/eurovoc.html?locale=hr (pristu‑ pljeno 25. kolovoza 2020.). HRANA. (hrana.ffzg.hr/.) (poveznica nije aktivna). Hrvatska leksička baza (HLB). polin-hlb.erf.hr/ (pristupljeno 15. srpnja 2020.). Hrvatski jezični portal. http://hjp.znanje.hr/ (pristupljeno pristupljeno 15. srpnja 2020.). Hrvatski terminološki portal. nazivlje.hr/ (pristupljeno 15. srpnja 2020.). Hrvatsko strukovno nazivlje (Terminološka baza Struna). struna.ihjj.hr (pristupljeno 15. srpnja 2020.). Kolokacijska baza hrvatskoga jezika. ihjj.hr/kolokacije/ (pristupljeno 15. srpnja 2020.). OBELEX. http://www.owid.de (pristupljeno 25. kolovoza 2020).

23 Portal hrvatske rječničke baštine. crodip.ffzg.hr/ (pristupljeno 15. srpnja 2020.). Repozitorij metafora hrvatskoga jezika MetaNet.HR. ihjj.hr/metafore (pristupljeno 15. srpnja 2020.). Školski rječnik hrvatskoga jezika. rjecnik.hr (pristupljeno 15. srpnja 2020.).

24