Digitalizācija
LLVV digitalizācija tika sākta 2001. gadā, un tā ir notikusi vairākos posmos.
Šajā dokumentā apkopotas piezīmes par LLVV digitalizācijas rezultātiem: problēmas, īpatnības un atšķirības no oriģināla.
Nedigitalizētais
- Digitalizējot LLVV, citātos nav saglabāta ° zīme pie vārdformām, kam labota morfoloģiskā forma (piem., 1. sēj. 229. lpp. “apliekt” 2. nozīme, 1. citāts).
- Digitālajā versijā var nebūt saglabāta piemēru/citātu/frazeoloģismu secība, kas atšķiras no zemāk aprakstītās tipiskās secības:
- šķirkļos: nozīmes, aplīša simbols, vārdu savienojumi bez nozīmes pārnesuma, vārdu savienojumi ar nozīmes pārnesumu (katru ievada rombs);
- šķirkļu nozīmēs un apakšnozīmēs: neskaidroti piemēri, skaidroti piemēri, citāti (ievada taisnstūris), vārdu savienojumi ar nozīmes pārnesumu (katru ievada rombs);
- vārdu savienojumos: glosa jeb nozīmes skaidrojuma teksts, citāti (ievada taisnstūris).
- Vienā blokā esošie vārdu savienojumi tiek pārkārtoti alfabētiskā secībā.
Elementu hierarhija
- Vairāki nozīmju elementi (nevis vairākas glosas/definīcijas) ir šādos gadījumos:
- ja šķirklim ir vairākas ar trekninātiem cipariem norādītas nozīmes (digitālajā versijā numurē);
- ja vārdu savienojumam ir skaidrotas vairākas nozīmes, tās papīra vārdnīcā atzīmējot ar “a.” , “b.”, “c.” utt. (digitālajā versijā numurē);
- ja nozīmei ir vairākas ar “//” atzīmētas nozīmes nianses (digitālajā versijā nenumurē).
- Vairākas glosas vienā nozīmē ir tad, ja papīra vārdnīcā definīcija aprakstīta kā vairākas ar semikoliem atdalītas daļas. Digitālajā vārdnīcā katru ar semikolu aprakstīto daļu pārvērš par teikumu ar lielo burtu sākumā un punktu beigās.
- Nozīmes gramatika, kas atrodas pirms pirmās glosas, ir jāliek ārpus glosas – zem nozīmes elementa. Pie otrās, trešās utt. glosas atrodas gramatikas, kas ar samazinātiem burtiņiem ierakstītas starp papīra vārdnīcas skaidrojuma teksta daļām, visbiežāk tas ir “imperf.”.
- Citāti, kas nozīmēs un nozīmju niansēs atrodas aiz skaidrota piemēra (vārdu savienojuma bez nozīmes pārnesuma), pieder nozīmei, nevis attiecīgajam piemēram, jo visbiežāk tie nav saistīti ar pēdējo piemēru.
- Gramatiku elementi, kas atrodas aiz nozīmes numura vai numurējošā burta (1., a.), pieder nozīmei, nevis šķirkļa galvai vai vārdu savienojumam.
- Gramatiku elementi, kas skaidrotos vārdu savienojumos atrodas pirms domuzīmes, liekami frāzē, nevis nozīmē.
Teksta noformējums
- Neskaidroto piemēru tekstus raksta ar punktu galā.
- Skaidroto frāžu piemēru tekstus raksta bez punkta galā, lai gan pirmajos sējumos ir vērojamas nobīdes.
- Piemēru un skaidroto savienojumu tekstus sāk ar lielo burtu.
- Pieturzīmes un lielie burti citātos ir tādi paši kā oriģinālā.
- Starp citāta divpunktes punktiem atstarpi neliek, lai gan oriģinālā izskatās retināti.
- Piemēros iekļautos šķirkļavārdus, kas saīsināti līdz vienam burtam, izraksta par pilnu vārdu (lielākoties ir izdarīts).
Konstatētās nepilnības
- Gramatiku elementi, kas atrodas starp skaidroto vārdu savienojumu un domuzīmi, kas atdala skaidrojumu, ir nekonsekventi novietoti pie nozīmes vai pie savienojuma.
- Secīgas frāžu nozīmes bez tās papildinošiem citātiem reizēm ir digitalizējušās kā secīgas glosas, nevis atšķirīgas nozīmes.
- Reizēm trūkst teksta fragmentu. Ja tādi gadījumi tiek pamanīti, lūdzam ziņot.
- Dažos skaidroto savienojumu tekstos (pie atsevišķiem vārdiem) ir gramatika, kas nav nošķirta atsevišķā strukturālajā elementā.
- Pēc nozīmēm novietotajiem stabilajiem savienojumiem (frāzēm) ir daļēji nojukuši tipi (OCR problēmu dēļ) – ar nozīmes pārnesumu (grāmatā atzīmēts ar rombu) vai bez (grāmatā apzīmēts ar apli). Tas ir pārbaudīts un salabots tiem šķirkļiem, kam digitālajā versijā bija nomarķēts, ka frāze bez nozīmes pārnesuma seko frāzei ar nozīmes pārnesumu. Nav pārbaudīts tām frāzēm, kur visas frāzes uzdotas kā viena tipa frāzes vai arī tās ir pareizajā secībā (vispirms visas, kas atzīmētas kā bez nozīmes pārnesuma).
Kļūdu norādes sējumu beigās
- 1. sējumā nav dotas.
- 2. sējumā ielabotas.
- 3. sējumā ielabotas.
- 4. sējumā ielabotas.
- 5. sējumā ielabotas.
- 6.1. sējumā nav dotas.
- 6.2. sējumā ielabotas.
- 7.1. sējumā ielabotas.
- 7.2. sējumā ielabotas.
- 8. sējumā ielabotas.
Šķirkļu secība avotā un digitalizētajā vārdnīcā
- Lai gan 1. sējuma ievads nesniedz pilnīgi viennozīmīgu izmantotā kārtošanas algoritma aprakstu, izpētot vārdnīcas materiālu, secināts, ka kārtošanas algoritms lielākoties ir šāds:
- līdzskaņi ar diakritiskajām zīmēm ir kārtoti aiz attiecīgā burta bez diakritiskās zīmes, piemēram, visi vārdi ar ņ atrodas aiz visiem ar n, visi ar š – aiz visiem ar s;
- tā kā vārdnīcā nav īpašvārdu, šķirkļavārdos nav lielo burtu;
- garie patskaņi kārtoti identiski ar īsajiem, piemēram, abi, ābols, abra, taču, ja vārdi, neskaitot garumzīmes, pilnīgi sakrīt, tad ar īso patskani kārto vispirms, piemēram, ne, nē;
- vārdi ar defisēm tiek kārtoti tā, it kā nebūtu defises, piemēram, ronis, ro-ro, roze, taču, ja vārdi, neskaitot defises, pilnīgi sakrīt, vārdu bez defises liek vispirms, tad liek ar defisi un īso patskani, un tad ar garo patskani, piemēram, ne, ne-, nē.
- Papīra versijā ir dažas nobīdes no iepriekš aprakstītās secības:
- 1. sējums:
- aizvainoties ← aizvainotība
- āmurs ← amūrs
- anarhosindikālists ← anarhosindikālistisks
- antagonisms ← antagonisks
- antropoloģisks ← antropologs
- antropomorfs ← antropomorfisks
- 2. sējums:
- dene ← dendrārijs
- 3. sējums:
- helioterapija ← heliotehnika
- heroisms ← heroiskums
- hrizoberils ← hrizantēma
- izsniegt ← izokšķerēt (sk. tālāk)
- izšņukurēt ← izšņūkt
- 4. sējums:
- klavesīns ← klavesīnists
- kumarīns ← kūma
- 6.1. sējums:
- pamāt ← pamat-
- pāradīt ← parādīt
- 7.2. sējums:
- staņica ← staņģis
- 1. sējums:
Drukas kļūdas un īpatnības oriģinālajā LLVV
- 2. sējums:
- čiks, 225. lpp. 2 homonīmi bez homonīmu numuriem, jo vienam ir otrā leksēma (digitālajā versijā pielikti homonīmu numuri).
- diezin, 340. lpp. 3. nozīmē ir neparasti formēts frāžu uzskaitījums, kas digitalizējot grūti iekļaujas struktūrā, tāpēc definīcijas lauks paliek neveikls – viens pats vārds “Savienojumos:” –, un jaunajā formātā samainās elementu secība.
- 3. sējums:
- izokšķerēt, izokšķerēties: “izokšķerēt” ir divās vietās – alfabētiski pareizajā vietā 3. sējuma 624. lappusē un ārpus alfabēta 676. lappusē, šķirkļi nav vienādi. “izokšķerēties” ir tikai 676. lappusē (digitālajā versijā otrā, mazākā, šķirkļa nozīmes pieliktas kā apakšnozīmes pirmajam).
- 5. sējums:
- maiss, 50.–51. lpp. 2 homonīmi bez homonīmu numuriem, jo vienam ir otrā leksēma (digitālajā versijā pielikti homonīmu numuri).
- nezin, 470.–471. lpp. 3. nozīmē ir neparasti formēts frāžu uzskaitījums, kas digitalizējot grūti iekļaujas struktūrā, tāpēc definīcijas lauks paliek tāds neveikls – viens pats vārds “Savienojumos:” –, un jaunajā formātā samainās elementu secība.
- 6.2. sējums:
- pretuguns, 366. lpp. 2 homonīmi bez homonīmu numuriem (digitālajā versijā pielikti homonīmu numuri).