Objavljeno: 27.6.2023 | Avtor: Matej Huš

Brez lektorjev in prevajalcev

Kurzor na prazni strani utripne dvakrat na minuto, kar vzbuja pri ljudeh zelo različne občutke, a za vse pomeni isto nalogo. To stran, morda še več njih, bo treba zapolniti z besedilom. S pravilnim, koherentnim, z enostavno berljivim besedilom. Vaja dela mojstra, temu pa pomaga kopica orodij, zaradi katerih je to početje danes lažje, kot je bilo nekoč.

Spekter ljudi je širok. Nekateri si z zlaganjem besed služijo kruh, drugim prazen dokument z utripajočim kurzorjem predstavlja nočno moro. A ne glede na pogostost ustvarjanja pisane besede lahko obema skrajnostma in vsem vmes koristijo moderna orodja, ki so namenjanja olajšanju pisanja besedil, najsi sega od prevajanja prek sestavljanja dopisov do megalomanskih izvirnih del. Kakor pisci kode nimajo nobene potrebe po tem, da bi vsakokrat znova odkrivali toplo vodo, marveč uporabljajo pripravljene knjižnice, bi tudi tesarji človeške besede brez modernih orodij opravljali nepotrebno težaško delo.

Prvi korak vedno predstavljajo urejevalniki besedil, ki pa so z razvojem spleta izgubili absolutni primat. Včasih smo besedila pisali izključno v Microsoft Wordu ali LibreOffice Writerju, danes pa orodja za spletno urejanje besedil postajo čedalje pomembnejša. Njihova glavna prednost je sodelovanje več uporabnikov, ki lahko istočasno delajo na istem dokumentu, obenem pa so proizvajalci ugotovili, da so naročniški paketi dolgoročno stabilnejši vir prihodkov. Microsoft je to storil z Officeom 365 in z aplikacijo Teams. Obstajajo tudi (za domačo rabo) brezplačne možnosti, denimo Google Docs, medtem ko bomo v podjetjih uporabljali to, kar so pač kupili.

Vsa ta orodja imajo vgrajene slovenske črkovalnike, ki so higienski minimum in prvi korak pri pisanju koherentnega besedila. Sicer ne bodo zaznali pomot, kot je sovji namesti svoji, bodo pa podčrtali vsaj sojvi. Nekateri imajo tudi bolj ali manj primitivne popravljalnike slovnice in sloga, ki v slovenščini niso posebej koristni, v angleščini pa Google Docs že podčrta it's namesto its ali nas opozori na nepotrebno kopičenje pridevnikov ter pretirano uporabo klišejev.

Za resno stavljenje besedila se uporabljajo orodja, ki presegajo okvir tega članka. Urejevalniki besedil so namreč namenjeni urejanju, ne pa stavljenju. Nasploh velja stara modrost, da je koristno to dvoje ločiti. Tudi pri pisanju prispevkov, kot je pričujoči, od avtorjev pričakujejo vizualno minimalno oblikovano besedilo, a opremljeno z logičnimi informacijami (kaj so naslovi, odstavki, poudarjeno besedilo, okvirji, opisi slik). Urejevalnik LaTeX izkorišča to dejstvo, ko je oblikovanje povsem oddvojeno od pisanja in postavljanja logične strukture.

Če naredimo še korak navzgor, omenimo Obsidian, ki je orodje za predfazo pisanja. Omogoča organizacijo lastnih zapiskov v interagirajočo celoto, povezano v grafe in opremljeno s hiperpovezavami. Podoben je namen orodja Scrivener, kjer lahko pisano delo razdelimo v posamezne sestavne dele – poglavja, ki jih opremimo s krajšimi opisi, podpornim materialom iz raziskovanja (zapiski, posnetki) itd. Enako funkcijo opravlja še LivingWriter, a če ne pišete obsežne knjige ali disertacije, zadnjih dveh ne boste potrebovali. Raje se zato posvetimo orodjem na nižjih ravneh, torej pri dejanskem sestavljanju besed v stavke.

Slovenščina

Slovenščina je težak jezik, se radi pohvalimo pred tujci in hkrati isto krilatico uporabimo kot opravičilo, ko pišemo in govorimo polomljeno. V resnici ni slovenščina nič posebnega, saj se slovenski otroci naučijo jezika enako hitro kakor drugod po svetu. Ameriško zunanje ministrstvo na seznamu težavnosti jezikov za rojene govorce angleščine uvršča slovenščino v kategorijo težkih jezikov, kjer so tudi češčina, hrvaščina, madžarščina, finščina, islandščina in podobno. Slovenščina pa je podobna ostalim jezikom še v eni zelo pomembni lastnosti – je polnopravna članica Evropske unije in – zlasti zaradi dela slovenskih strokovnjakov – dostojna sogovornica v digitalnem svetu. Medtem ko jo Netflix in Apple resda vztrajno ignorirata, obstajajo odlična digitalna orodja, ki nam olajšajo pisanje v lepi in bogati slovenščini, ki jo popravljajo, dopolnjujejo in izboljšujejo.

Oglejmo si najprej orodja, s katerimi se lahko ročno posvetujemo, torej nekakšne digitalne ustreznice knjižnih polic. Največji nabor jih najdemo na strani fran.si, kjer domuje več deset slovarjev, med njimi vsi najpomembnejši. Slovar slovenskega knjižnega jezika, Slovenski pravopis, Sinonimni slovar, Sprotni slovar, Slovar slovenskih frazemov, Slovenska vezljivost, Etimološki slovar, terminološki slovarji. Njihova uporaba zahteva nekaj znanja, saj moramo najprej vedeti, kam pogledati, nato pa, kako razumeti zapise. V Slovenskem pravopisu, ki ima tudi slovarski del, bomo našli poimenovanja prebivalcev (v Rigi živijo Rižani), v Sinonimnem slovarju pa sopomenke (zdravniki so bili nekdaj lekarji, lečniki ali medikusu – zato imamo še danes lečeče zdravnike). Brez lektorjev v besedilih pogosto mrgoli napačne vezljivosti, zato se izplača odpraviti tudi v ta slovar. Tam izvemo, da dvomimo o nečem in ne v nekaj. Zlata vredni sta Jezikovna in Terminološka svetovalnica, kjer najdemo odgovore na vprašanja uporabnikov jezika. So fizikalne količine (na primer temperatura, hitrost, frekvenca) velike ali visoke? V svetovalnici najdete odgovor tudi na to vprašanje.

Prva postaja pri zagatah ob pisanju v slovenščini je Fran.si.

V prejšnji številki (Slovenščina v digitalnem svetu, Monitor 05/23) smo pisali tudi o sklopu orodij, ki so nastala v okviru projekta RSDO – Raba slovenščine v digitalnem okolju. Na spletni strani slovenščina.eu so na voljo orodja, ki so sicer nekoliko bolj specializirana, a bodo še vedno v pomoč tudi pri pisanju besedil. Najkoristnejši so razpoznavalnik govora (prepis zvočnik datotek), terminološki slovar in prevajalnik. Kar nas pripelje do prevajanja, o čemer bomo govorili v nadaljevanju.

Pristop do učenja sklonov (in še marsičesa) v slovenščini je diametralno nasproten za tujce in rojene govorce. Medtem ko je za zadnje »korak« moškega spola, ker v rodilniku postane »koraka«, je za tujce obratno. »Korak« postane »koraka«, saj je moškega spola. Seveda pa se tudi za rojene govorce najdejo pasti, kot so pismonoša v dvojini, različni množinski samostalniki (drva, prsi, tla) in seveda večno vprašanje, zakaj gremo iz Trbovelj, a Zagorja (množinski samostalnik ženskega spola, edninski samostalnik srednjega spola). Amebisova Besana zna brezplačno pregibati besede (https://besana.amebis.si/pregibanje/), mimogrede pa še pove, da gremo na Polzelo, a v Letuš, kjer živijo Letušani.

V drugi skupini pa so orodja, ki analizirajo obstoječe besedilo, v njem poiščejo napake in predlagajo popravke, bodisi slogovne ali slovnične. Omenjena Besana v brezplačni različici to počne za največ 500 znakov (https://besana.amebis.si/preverjanje/), v plačljivi pa neomejeno. Ta popravlja postavitev vejic, napačne oblike besede (npr. hčer/hči), nepravilno sklanjanje, umanjkanje rodilnika pri zanikanju, vikanje, povratne zaimke, stopnjevanje pridevnikov, predloge, besedni red itd. Amebis navaja 140 vrst napak, ki jih Besana prepozna. Poleg spletne različice obstaja tudi namizna, ki sproti spremlja odložišče ali pa deluje kot vtičnik za Word, Outlook oziroma brskalnike. Preizkus je pokazal, da opozori na veliko večino šibkosti v besedilu, predlogi pa so skoraj vedno pravilni – včasih jo dolgi izumetničeni stavki pač zmedejo, pa tudi tehnično besedilo za našo revijo ni najlažji zalogaj. A Besana je izjemno koristen pripomoček, ki bo vaša besedila, to si upam trditi, naredil bistveno prijaznejša do lektorja in končnega bralca. Končni cilj pa je lahko pisanje besedil, v katerih Besana ne bo več našla nobenih napak.

Besana Mini samodejno preveri besedilo v odložišču.

Prevodi

Neredko se zgodi, da moramo prevesti daljša ali krajša besedila – ali pa jih zgolj napisati v tujem jeziku. Večkrat smo že primerjali različne prevajalnike, nazadnje spomladi (Ko prevajalcev več ne bo, Monitor 03/23). A za dobro besedilo v tujem jeziku, recimo v angleščini, ne moremo slovenske ustreznice zgolj prekopirati v Google Translate in nato izdelka prilepiti v urejevalnik besedil. To pot si bomo ogledali nekaj strategij, kako se tega lotili s čim manj glavobola.

Spletni prevajalniki so zagotovo koristno izhodišče. Google Translate in DeepL sta oba na izjemno visoki ravni in podpirata tudi slovenščino. Prvi zmore več kot sto jezikov in bo pri kakšnem eksotičnem zato edina možnost, sicer pa je DeepL za odtenek boljši v običajnih kombinacijah evropskih jezikov. Oba podpirata tudi možnost prevajanja celotnih dokumentov, kar je lahko v nekaterih specifičnih primerih pravi blagoslov. Preizkusil sem prevesti 33 strani dolgo polo z nalogami iz fizike in kemije, ki je imela različne naslove (kot slog), več slik, enačb in posebnih simbolov. Oba sta dokument .docx brez težav prevedla, končni izdelek pa je bil še vedno enako oblikovan. Takšnega le še enkrat preberemo in popravimo zablode pa je rezultat odličen. Precej, precej hitreje od ročnega kopiranja odstavkov. Google Translate je v celoti brezplačen, DeepL pa ima v brezplačni različici omejitve tako pri velikosti dokumenta (na 10 MB) kakor številu prevodov na uro. Izdelek .docx je zaklenjen in ga ni mogoče urejati, čemur pa se lahko izognemo. Če ga odpremo v Wordu, shranimo kot .xml, nato pa z Beležnico v tem dokumentu poiščemo spremenljivko enforcement in jo spremenimo z 1 na 0, bo dokument mogoče normalno urejati tudi v Wordu.

Pri pisanju kakšnih krajših besedil v tujem jeziku nam včasih zmanjka besed, zlasti pri zelo specifičnem besedišču: pomislite na gradbeno dovoljenje, notranjo organizacijsko enoto ali navadnega močerada. Včasih se znajdemo v isti zagati tudi pri prevajanju v obratni smeri, ko iščemo čim boljšo ustreznico za tenure. Omenjena prevajalnika bosta poskusila po najboljših močeh, in četudi bo rezultat verjetno razumljiv, ne bo pravilen. Za besedišče se izplača pogledati v korpuse. Med večjezičnimi je najobsežnejši Linguee, ki vsebuje besede v svojem normalnem okolju, tj. besedilih. Videli bomo, da je gradbeno dovoljenje bodisi building permit ali construction licence, včasih tudi building authorisation in planning permission, odvisno od pomena. Linguee se zanaša na besedila, ki nastanejo v evropski birokraciji, zato je odličen za to semantično polje. Videli bomo, da se tenure prevaja najrazličneje, ker je beseda uporabna v zelo različnih kontekstih, medtem ko za močerade Linguee še ni slišal.

Linguee ima ogromen korpus prevodov.

Presenetljivo koristen vir je Wikipedija, ki obstaja v številnih jezikih. Če je geslo razloženo v slovenščini, bo zelo verjetno tudi v angleščini (razen kakšne slovenske specifike, denimo Jazbinškovega zakona). Navadni močerad je fire salamander, pri sosedih pa pjegavi daždevnjak. Včasih slovenske različice ne bo, a lahko iz latinskega imena na specializiranih slovenskih straneh najdemo prevod. Izjemno dragocen vir so diplomska, magistrska in doktorska dela na slovenskih univerzah, ki imajo dvojezične povzetke in so v teh časih večinoma že objavljena na spletu. Še zdaleč ne gre le za poimenovanja bioloških vrst, temveč najrazličnejšo specialistično terminologijo. Ljubljanska univerza ima digitalno knjižnico DiKUL, mariborska pa DKUM.

Včasih se pri pisanju zataknemo. Bodisi ne najdemo točno določene besede, za katero vemo, da obstaja, bodisi nas zanima, kako bi kaj povedali še drugače. V prvem primeru lahko pokukamo v kakšen dvojezični slovar, lahko pa za rešitev vprašamo kar umetno inteligenco. ChatGPT sem vprašal »Kateri pridevnik v nemščini opisuje, da nečesa ne želimo deliti z drugimi, ker bi potem ti lahko dosegli uspeh, ki jim ga ne privoščimo« in – če povzamem – odgovoril je neidisch ali missgünstig. Čeprav se nisem spomnil slovenke ustreznice zavisten ali nevoščljiv, je ChatGPT iz okornega opisa prepoznal, kaj želim. Kadar imamo zgolj prazno glavo, so zelo koristni tezavri. Thesaurus.com za angleške izraze naniza več deset sinonimov ali sorodnih besed, med katerimi bomo gotovo prepoznali želenega. Uporaba nam nepoznanih besed pa seveda prinaša svojevrstno tveganje. Slovenski slovar sopomenk ima Center za jezikovne vire in tehnologije https://viri.cjvt.si/sopomenke/slv/. Izvemo, da je zavisten tudi nevoščljiv, zagrenjen, zamorjen in ljubosumen, ki se seveda pomensko ne prekrivajo popolno.

Če smo že pri umetni inteligenci, omenimo, da zna prevajati tudi ta. Poleg tega pa zna prevode popraviti, tako slogovno kakor slovnično. ChatGPT je nekoliko boljši kot Bing Chat, medtem ko je Google Bard (za zdaj) zanič. V prvem je zadostovalo, da sem vpisal Improve language in skopiral eno stran solidnega angleškega besedila, pa je bil rezultat že zelo dober. Besedišče je ostalo enako, skladnja in slog pa sta bila na bistveno višji ravni.

Opisana orodja so seveda namenjena običajnim uporabnikom, ki se morajo tu in tam (ali pa pogosteje) spopasti z besedili v tujih jezikih, zato smo se večinoma omejili na brezplačna orodja in naredi sam pristop. Profesionalni prevajalci vedo povedati, da sicer tudi uporabljajo strojno prevajanje za večjo učinkovitost, a imajo na voljo tudi specializirano programsko opremo, kamor sodijo Across, memQ, Trados Studio, Wordfast in druga orodja. Ta imajo funkcije, ki so zanje nujno potrebna, na primer prevajalski spomin (translation memory), kamor se shranjujejo obstoječi prevodi. Ko se prevajalec ponovno sreča s podobnim odstavkom, kot ga je že prevedel, mu orodje ponudi ta prevod – rezultat je hitrejši in konsistentnejši prevod. S tem je povezan tudi glosar (term base), v katerem je shranjena specifična terminologija, ki je odvisna od vrste besedila in naročnika. Glosar prevajalca opozarja, če terminov ne prevaja dosledno ali pravilno. Tovrstna orodja, dasiravno izjemno pomembna za prevajalce, za neprofesionalne uporabe niso zelo uporabna.

Angleščina

Za konec se osredotočimo še na angleščino, ki je brez dvoma tuji jezik, v katerem bodo naši bralci (in pravzaprav celo internetno občestvo) ustvarjali največ besedil. Pri iskanju besed nam lahko pomagajo vsa orodja, ki smo jih omenjali v poglavju o prevajanju, in enojezični slovarji. Na internetu jih je toliko, da si lahko vsak izbere najljubšega: Oxford, Cambridge, Webster in drugi. Vizualno najbolj minimalističen je gotovo Wiktionary, ki pa ima poleg bogatih primerov rabe še sinonime, antonime in prevode na enem mestu.

Poleg klasičnih tezavrov je koristen tudi obratni slovar (OneLook Reverse Dictionary), kjer po najboljših močeh opišemo pojem, nato pa nam ponudi res dolg seznam predlogov, kaj bi to bilo. Če vpišemo unsure about something, bo predlagal uncertain, hesistant, doubtful, indecisive, ambivalent in tako naprej do ill-timed na 100. mestu.

OneLook Reverse Dictionary izriše tudi graf sorodnosti.

Zadnji nivo pa so orodja, ki celostno pregledajo besedilo in predlagajo, kako ga izboljšati. Takšno orodje je InstaText, ki obstaja kot spletna storitev in razširitev za Chrome ali Edge. InstaText ne popravi le napačno zapisanih besed in očitnih slovničnih napak, temveč predvsem izboljšuje slog. To obsega zamenjavo neprimernih besed (tudi predlogov, členkov in ostalih drobnih sestavin, ki tujim govorcev povzročajo toliko težav), prečiščenje skladnje in logično sosledje. InstaText ima omejitev 5.000 znakov, in to je zanalašč. Vsako pripombo je treba premisliti in se odločiti, ali jo želimo sprejeti, kar je naporno početje. Več kot nekaj odstavkov naenkrat težko zbrano popravimo.

InstaText slogovno in jezikovno izboljša angleško besedilo.

Zelo podobno orodje je Grammarly, ki v brezplačni izdaji ni posebej uporabno, saj zazna le očitne tiskarske in slovnične napake, v plačljivi pa nudi več analize. Zaznava uporabo trpnika, predolge stavke, slabo besedišče in nerazumljivost ipd. Po mojih izkušnjah je pri tem manj strog ali temeljit od InstaTexta, je pa res, da imam z zadnjim bistveno več izkušenj.

Hemingway Editor se ukvarja samo z berljivostjo besedila in ne bo predlagal slovničnih popravkov. Namesto tega predlaga, kje postane besedilo preveč zapleteno, kateri odstavki potrebujejo preureditev in kaj je nerazumljivo, kje smo zgrešili s prislovi in kje je trpnik res preveč. Namenjen je torej predvsem izboljšavi sloga. Na koncu tudi oceni berljivost besedila po Flesch-Kincaidovi lestvici, tj. v katerem razredu ameriške osnovne šole razumevanje besedila ne bi več povzročalo težav.

Tega je veliko

Ni pričakovati, da bo vsakdo potreboval vsako od navedenih orodij. Svet je velik, naše potrebe raznolike, orodja pa mnogotera. V tem prispevku sem se omejil na tista, ki bi utegnila pomagati najširšemu krogu bralcev, saj verjetno živijo na presečišču med slovenščino in angleščino. Kdor se z jezikom srečuje profesionalno, svoja orodja gotovo že pozna in uporablja. Kdor se ukvarja še z drugimi jeziki, lahko smiselno uporabi nekatera opisana orodja (denimo slovarje in Wikipedijo) ter poišče jezikovne ustreznice za druga. Večinoma pa se z bolj eksotičnimi jeziki ukvarjajo ljudje, ki orodja zanje že obvladajo. Pisanje pismenk je tipičen problem, za katerega obstaja vrsta rešitev, ki so sinologom dobro znane.

Za vse ostale pa ostaja železno pravilo, da si velja ogledati in preizkusiti čim več orodij, nato pa zgraditi lasten delovni proces. Paretovo načelo tudi v tem primeru ne bo razočaralo in tako bomo na koncu veliko večino opravil naredili z enim orodjem ali dvema, ki pa bosta nepogrešljivi. In v tistih redkih primerih, ko se bomo srečali z novimi problemi, bomo iz klobuka potegnili še tretje, za katero smo nekoč nekje slišali.

Razkritje: Avtor ima v uporabi brezplačno licenco za Amebisovo Besano in službeno licenco za InstaText.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji