#440 na kioscima

5.4.2007.

Neven Jovanović  

Noga filologa - Google Books i mali narodi

Google skenira milijune knjiga i čini ih pretraživima na Mreži – Totalno luda stvar koja nas pretvara u internetske znanstvenike – Uvjet lagodne upotrebe: znati što više mrtvih jezika – Arheološki slojevi hrvatske kulture – Zašto je Michigan bliži od Trnja – Je li bolje biti lijen sada ili jadan kasnije?


Zamislite da možete, sjedeći pred kompjuterom, u manje od sekunde pretražiti cjelovite tekstove svih knjiga koje su ikad napisane. Zamislite povjesničara koji može u trenutku pronaći svaku knjigu koja spominje Granatiranje Alžira 1816. Zamislite srednjoškolca u Bangladešu kako nalazi djelo koje više nije u tisku, a čiji se primjerak nalazi samo u knjižnici u Ann Arboru (Michigan, SAD). Zamislite golemi elektronski kartični katalog u kojem se uz malo tipkanja po tastaturi mogu pronaći sve knjige svijeta – a da to može činiti bilo tko, bilo gdje, bilo kada.

Ovim je dramatičnim uvodom Eric Schmidt u Wall Street Journalu 18. listopada 2005. predstavio projekt pokrenut 2004. Projekt se tada zvao Google Print, a ubrzo će postati Google Book Search (a Eric Schmidt je Googleov CEO: predsjednik izvršnog odbora i glavni izvršni direktor). Proklamirani je cilj ove dodatne sastavnice najpopularnijeg internetskog pretraživača “omogućiti da se sve knjige na svijetu pronađu i pretražuju online”. Godinu i pol nakon nastanka, Google Book Search narastao je dovoljno da i jednoj marginalnoj evropskoj kulturi egzotičnog jezika nametne nova, neobična pitanja.

Sve knjige svijeta

Na putu do “digitaliziranja svih knjiga svijeta” Google je imao dvije zapreke. Prva, čisto fizička – “sve knjige svijeta” treba skenirati i dati računalima da digitalne slike njihovih stranica “pročitaju” programom za OCR (optičko prepoznavanje znakova) – nije nerješiva kad raspolažete Googleovim sredstvima i znanjima. Druga prepreka, pravna, bila je mnogo ozbiljnija. “Sve knjige svijeta” nekome pripadaju. Kao predmeti, nalaze se u knjižnicama i knjižarama; kao intelektualni artefakti, vlasništvo su izdavača i autora. S ovom su se preprekom u Googleu suočili na dva načina. Prvo, intelektualno vlasništvo nad izdanjem pojedinog djela (koje već jest u javnoj domeni) prestaje – prema američkim zakonima – nakon 65 godina; Google smije skenirati sve knjige tiskane prije 1923. Da bi do njih došla, tvrtka je dosad sklopila ugovore s tucet svjetskih knjižnica (osim knjižnica američkih sveučilišta poput Harvarda, Oxforda, Stanforda, tu su i Komplutsko sveučilište iz Madrida, Nacionalna knjižnica Katalonije, i, od ovoga ožujka, Bavarska državna knjižnica). Što se novijih knjiga tiče, izdavači i autori mogu se uključiti u Google Books Partner Program, koji pomaže prodaju knjiga čineći dostupnim određeni broj njihovih stranica kao “preview”.

Kao i kod “običnog” Googlea, čiji pretraživač indeksira internetske stranice, upišete u prozorčić jednu ili više riječi – i Google Book Search izlista popis knjiga koje tu riječ, ili riječi, sadrže. Odande ponekad možete dalje – do knjige dostupne u cijelosti (bilo da je, kao jedan dokument s nizom slika možete je i preuzeti i snimiti na vlastiti kompjuter, ili je u cijelosti možete listati putem interneta), do knjige kod koje možete pročitati nekoliko stranica u kontinuitetu, do knjige kojoj vidite samo “snippets” – Googleove “isječke”, digitalne sličice nekoliko redaka s pojedinih stranica koje sadržavaju vaš traženi pojam – ili do knjige o kojoj ne znate ništa osim osnovnih bibliografskih podataka (takvu definitivno morate potražiti u knjižnici). Google vas usput obavještava i koje knjižnice imaju naslov koji gledate – i, dakako, kod kojeg ga od velikih internetskih knjižara možete naručiti. U najnovije vrijeme Googleovi su se inženjeri dalje igrali s Book Searchom, pa katkad možete naći i popis “ključnih riječi” iz knjige, katkad čak i vidjeti na karti koja se sve mjesta u knjizi spominju.

Poetskoj prozi “korporativnih komunikacija” usprkos, Google Book Search nije dočekan s apsolutnim oduševljenjem. Izdavači i autori, koji u SAD žive od intelektualnih prava na svoje proizvode, narogušili su se; Authors Guild (američko Društvo književnika) i Association of American Publishers podnijeli su tužbu protiv Googlea, tvrdeći da “snippets” prelaze granice onoga što se u američkom autorskom pravu naziva “fair use” – odobrena upotreba autorskim pravom zaštićenog teksta u književnoj kritici, komentiranju, novinarstvu, nastavi, znanstvenim istraživanjima itd; kvaka je, naravno, u ovome “itd”. S druge strane, korisnici su se ljutili na neujednačenu kvalitetu snimaka knjiga – čini se da se knjige za Google Book Search skeniraju ručno, pri čemu ljudi nekad knjigu dignu prerano, ili je loše postave, pa nastanu mutne ili nepotpune snimke. Javnost brine općenita netransparentnost cijeloga posla, te kulturalna hegemonija do koje Google Book Search projekt može dovesti, ili već dovodi, a i neinventivna, konzervativna prezentacija knjiga u Google Book Search sučelju (drugim riječima: previše sliče papirnatim knjigama, kao što su rani automobili previše sličili kočijama, rani tipovi slova rukopisu).

Internetski znanstvenici

Kao netko kome su knjige osnovni alat za rad, mogu vam reći da je Google Book Search totalno luda stvar. Još radikalnije – Google Book Search, zajedno s ostatkom Interneta, upravo preoblikuje način na koji se bavim znanošću, i to do te mjere da se mogu nazvati “internetskim znanstvenikom”. “Otkrića” do kojih dolazim i koja objavljujem, “something new and something true” znanstvenoga rada, trenutačno se velikim dijelom temelje na onome što pronalazim na Mreži. “Internetski znanstvenik” može zvučati glamurozno, ali i pogrdno; iza toga stoji priznanje da ja – zajedno s mnogim drugim kolegama iz generacije – svoj posao radim drugačije u odnosu na prethodne generacije. Da čitam drugačije. To nije ni u kom slučaju razlog za ponos i bahatost (prema “onim starijima” prije osjećam stanovito divljenje). Dok su naše preteče pažljivo čitale malu količinu tekstova, ja strojno pretražujem čitav ocean.

Google Book Search postaje mi važan oslonac u radu zbog prilično osebujnog spleta okolnosti. Prvo, živim u Hrvatskoj: to znači da većine knjiga koje mi Google Book Search izlista kao rezultate pretrage u mojoj zemlji nema, čak ni u zagrebačkoj Nacionalnoj i sveučilišnoj knjižnici, a ovako mogu barem odoka procijeniti isplati li se knjigu naručivati (preko međubibliotečne posudbe ili drugačije) ili ne. Drugo, bavim se disciplinom koja je donedavno imala vrlo čvrste granice: ako filolozi još katkad i zađu na područje lingvista, književnih znanstvenika, povjesničara ili arheologa, neće bez jakih razloga listati radove povjesničara umjestnosti, a pogotovo neće imati pregled nad svim tim (i bezbrojnim daljnjim) strukama u rasponu od 200-300 godina. Treće, bavim se klasičnom filologijom: to znači da su za niz djela iz “zlatnog razdoblja” moje struke, iz doba kad je proučavanje antike, grčkog i latinskog bilo okosnica kulture, obrazovanja i znanosti, istekla sva moguća prava intelektualnog vlasništva, a da ih ja znam čitati (između ostalog, i zato što razumijem latinski). Dati Google Book Search u ruke klasičnom filologu znači pokloniti mu čitavu jednu radnu biblioteku! Istina, u toj je biblioteci najnovija knjiga tiskana oko 1910. – ali, zato, kako se lako lista i pretražuje! Kako malo mjesta zauzima! Kakve se nevjerojatne veze otkrivaju!

Ur-ge-schichte

Exempli gratia. Pabirčenje po Google Book Search otkriva da u istraživanju hrvatske povijesti i hrvatske književnosti postoje slojevi koje gotovo da možemo nazvati arheološkima. Tijekom “progresa” u gornji sloj bivaju preuzeti samo neki rezultati i podaci iz donjega; idući pak gornji sloj dalje filtrira znanje koje će preuzeti, pri čemu dosta podataka preuzima i iz druge ruke, od onih koji su ih i sami već preuzeli. To je i razumljivo i prirodno. Ljudi je malo, vremena, sredstava i prilike malo, građe i problema puno; tko bi tu za sve našao vremena (a treba raditi još i Velike Sinteze)!

Pošto je područje naraslo toliko da jedan čovjek više nije mogao nad njim imati potpuni pregled – kad je trebalo praviti selekciju onoga što ćemo čitati i proučavati, kao što Google pravi selekciju onoga što će skenirati – lako smo se odricali onih starijih, “zastarjelih”, “staromodnih”. “Stari” su nam pritom i sami pomagali. Oni koji su stajali na počecima proučavanja dalje hrvatske povijesti – oni koji su pisali, recimo, u drugoj polovici 19. stoljeća, svi ti velikani po kojima se danas zovu ulice – osim što su pisali pomalo antipatično i pomalo arhaično, vrlo često ne bi više smogli, nakon svih svojih primarnih istraživanja, snage i sredstava da knjige opreme još i adekvatnim kazalima i indeksima. I kako je vrijeme odmicalo, njihovi radovi – odavna nepretiskivani, višekratno reciklirani, sve rjeđe citirani, pohranjeni u gotovo anonimnim, jednoobraznim nizovima Radova, Arhiva, Listina, Građa – postajali su i sve teže dostupni (traganje za starim knjigama u institucijama “nacionalnog pamćenja” poput NSK Zagreb učas zna poprimiti karakter lova, s istom neizvjesnošću ishoda).

Trnje via Michigan

Sve ovo, dakako, ne može opravdati znanstveničku lijenost; no, postoji razlika između lijenosti i neznanja. Postoji razlika između onoga kome se ne da otići do knjižnice i naručiti npr. Arkiv za pověstnicu jugoslavensku, knjiga I (ur. Ivan Kukuljević Sakcinski, Zagreb 1851.), i onoga koji ne zna da se baš u toj knjizi nalazi nešto zanimljivo za temu koju istražuje – ne zna, jer se taj rad prestao navoditi u citiranoj literaturi tri-četiri generacije ranije. (Pritom je Arkiv, hrvatska serijska publikacija, još očekivano i logično mjesto potrage; što s austrijskim, talijanskim, mađarskim, srpskim naslovima, pritom monografijama?)

I sada nam Google Book Search poklanja slobodno pretraživanje – katkad i slobodno preuzimanje – dobrog dijela radova iz tih prvih, “herojskih” slojeva proučavanja, ili zamišljanja, hrvatske povijesti i kulture. Odjednom su nam oni “uobičajeni sumnjivci” dostupni iz komocije vlastite sobe, a usput i onih neuobičajenih otkrivamo svu silu. Evo, recimo, rukoveti mojih pabiraka iz Google Book Search (svi se naslovi mogu na vlastito računalo preuzeti u cijelosti): Spomenici srbski od 1395. do 1423., to est pisma pisana od Republike Dubrovačke, prir. knez Medo Pucić, Beograd 1858.; A Tour in Dalmatia, Albania, and Montenegro; with an Historical Sketch of the Republic of Ragusa from the Earliest Times Down to Its Final Fall, W. F. Wingfield, London 1859.; Abridged Political History of Rieka (Fiume), Ferdo Šišić, 1919.; Documenti storici sull’Istria e la Dalmazia, Vicko Solitro, Venezia 1844.; Geschichte des Illyrismus oder des Süd-slavischen Antagonismus gegen die Magyaren, Wilhelm Wachsmuth, Leipzig 1849.; Herzegovina; or, Omer pacha and the Christian rebels: with a brief account of Servia, its social, political, and financial condition, George Arbuthnot, London 1862.; Kolo. Članci za literaturu, umětnost i narodni život, ur. Andria Torkvato Brlić, knj. VIII, Zagreb 1851. (Napominjem: do ovih su me naslova doveli moji uobičajeni upiti – drugim riječima, u svim se ovim knjigama spominje barem ponešto od mojih uobičajenih tema i predmeta istraživanja.) – Skenirani se primjerci nalaze u knjižnicama sveučilišta Michigan, Oxford, Stanford; zahvaljujući sprezi interneta i Googlea, bliži su mi, i brže dostupni i bolje pretraživi, od primjeraka u NSK Zagreb (koja se nalazi tu, u Trnju, dvjesto metara od moga radnog mjesta).

Topla voda

Stručnjaku – osobito stručnjaku s iskustvom, osobito specijalistu za pojedina pitanja – jasno je da ja ovdje u velikoj mjeri otkrivam toplu vodu. Svaki povjesničar zna za Meda Pucića i Vicka Solitra, dosta ih je nesumnjivo čulo za Arbuthnota (pustimo sad pitanje jesu li ih čitali). Ovo je znanje, nadalje, zasigurno uredno zabilježeno u specijaliziranim bibliografijama, u specijaliziranim pregledima, čak i u dobrim enciklopedijskim člancima (kao što su oni u Enciklopediji Jugoslavije ili Hrvatskom biografskom leksikonu). Primjećujete, međutim, koliko se učestalo u gornjim rečenicama spominju “struka” i “specijalnost”. Google Book Search omogućuje da “toplu vodu” – iz prve ruke – otkriju oni za koje to i nije topla voda.

Uostalom, pa što onda ako je to znanje već registrirano negdje u hrvatskoj kulturi? Ako ja za tu registraciju ne znam – to znači da ona nije dovoljno dostupna (recimo, dragocjena Bibliografija rasprava i ćlanaka Leksikografskog zavoda, dosad izašla u 17 svezaka od kojih je prvih 8 rasprodano, takvo je glomazno oruđe da je malo tko – barem među nama koji stanujemo u manje od stotinu metara kvadratnih – ima kod kuće), a možda je edicija u koju bi trebalo gledati i nedovršena (hrvatska je kulturna povijest puna takvih priča; dovoljno je spomenuti Hrvatsku enciklopediju, ugaslu sa slomom NDH). “Ako građa koju imamo nije pretraživa preko mreže, jednoga je dana nitko neće čitati”, napomenuo je jedan knjižničar na Sveučilištu Michigan komentirajući Google Book Search. I bio je poprilično u pravu.

Teška pitanja

Eto nas na teškom pitanju. Ako stvari idu u tom smjeru, zašto “mi” (ma tko bili) to svoje postojeće znanje (ma kakvo bilo) nismo već učinili dostupnijim?

Ako Google – kojemu je do hrvatske kulturne baštine kao do lanjskog snijega, kojemu su naše knjige tek promil skeniranog fonda, kojemu je čak i čitava Hrvatska tek pigmejsko tržište – ako takav Google može savršeno ravnodušno poskenirati sloj naše kulture tako dubok da ga većina nas nije imala priliku ni vidjeti; ako Google taj temeljni sloj, sve onako usput, povezuje s brdom drugih onodobnih izvora koji spominju Nas i Naše Teme (slutim da se na books.google.com krije građa za desetak finih doktorata na temu “percepcija Hrvatske u svijetu”) – ako sve to može i želi raditi Google, zašto ne možemo i ne želimo mi?

Spomenuo sam Hrvatski biografski leksikon; naravno da ga je Google skenirao (prvi svezak je dostupan preko “snippet view”) – zašto nismo mi? Zašto nije Leksikografski zavod, zakonski vlasnik tog izdanja? Hrvatska jest malena, ograničenih resursa; ali nitko od nas ne traži da skeniramo Sve Knjige Svijeta. Zašto nismo napravili popis svojih Najvažnijih Knjiga, i krenuli skenirati tih stotinu, tisuću, deset tisuća naslova?

Google, koji ne želi reći koliko je naslova dosad skenirao – očito ih je prilično, kad su nakon ciglih godinu i pol i naši došli na red – planira digitalizirati više milijuna knjiga, navodno u roku od pet godina. A mi smo se – malo paranoje nikad ne škodi – doveli u nezavidnu situaciju. Pred nama su tri varijante: ili ćemo objeručke prihvatiti ono što nam Google nudi, bez puno pitanja i primjedaba (i još biti sretni što nam to daje “džaba”) – ili ćemo moljakati Google za ono što nam pripada – ili ćemo lijepo raditi ono što je netko već napravio. A ako to nije otkrivanje tople vode, ne znam što jest.

 
preuzmi
pdf