Algoritamska cenzura i ortografska sloboda

 



Zanimljiv fenomen savremenog svijeta je internetsko poigravanje s algoritmima, posebno vidljivo u tihom cenzurisanju vijesti na društvenim mrežama. U arapskom jeziku i njegovoj neobičnoj ortografiji je bilo moguće izbjeći ovu vrstu cenzure zbog nemogućnosti algoritama da dešifriraju kodove bez dijakritičkih znakova

Imao sam nekoliko ideja o čemu da pišem glede ortografije kur'anskog osnovnog teksta za ovaj broj Preporoda, pa sam se odlučio da popratim jedan zanimljiv fenomen koji se zbivao u virtualnom svijetu interneta tokom nedavnih sukoba u Istočnom Jerusalemu, koji su potom prerasli u ustaljenu agresiju izraelskih vojnih snaga na Gazu. Budući da govorimo o sukobu koji traje decenijama, a i medijski je veoma popraćen, bilo je za očekivati da će se preliti i na društvene mreže – Twitter, Facebook ili Instagram. Svakodnevno smo mogli pratiti šta se dešava te kakve su reakcije – regionalne i globalne. U masi informacija koje su kolale po internetu, neizostavan je bio način na koji su ih algoritmi prerađivali i filtrirali. Reuters je objavio kratki informativni tekst baš o tome, prije nešto više od mjesec dana. Od početka izbijanja majskih sukoba u Istočnom Jerusalemu, primijetio sam da se sve više novinara i “običnih smrtnika” žali na uklanjanje sadržaja koji su se ticali ovog sukoba. Bili to tweetovi, facebook i instagram obavijesti, pa čak i youtube video klipovi, u jednom momentu bi naprosto isparili, kao da ih uopće nije bilo. Poznata palestinska muzička diva, Nai Barghouti se, nedugo nakon što je na youtube objavila pjesmu Raj'een (Vraćamo se), počela žaliti kako joj sadržaj biva uklonjen. Nije se to naravno samo njoj dešavalo, štaviše, mnogo se novinara žalilo kako im obavijesti naprosto ispare. Twitter, Facebook, i Instagram su opravdanje našli u tehničkim problemima, što je vrlo moguće, pa baš ovdje započinjemo priču kojoj tek predstoji da bude ispričana. Riječ je naravno o algoritmima, skupljanju podataka o nama, i automatskom ponašanju algoritamskih sistema koji filtriraju protok informacija.

Moja uloga je da vas uvijek upoznam s nekim novim čarima ortografije kur'anskog teksta, a ovo je idealna prilika da to učinim. Kur'anska ortografija je puna raznolikih čari, nedešifrovanih i zagonetnih ortografskih fenomena, pa baš zbog toga nerijeko koristim pojmove kod, dekodiranje, skeletonski, itd. kada opisujem određene kur'anske ortografske fenomene. U odličnoj knjizi How Not to Be Wrong Jordana Ellenberga, o sistemu matematičkog promišljanja, nezaobilazna tema su algoritmi. Arapi imaju vrlo lijep naziv za algoritme budući da je to riječ koja svakako dolazi u Evropu posredstvom Arapa. Da to malo pobosančim, algoritmi bi na arapskom bili havarizmijati. Matematički posmatrano, rekao bi Jordan Ellenberg, što se algoritmi više hrane novim podacima, za očekivati je da postaju sve precizniji, pa kada Netflix pogađa 10% naših preferencija, to ipak nije tako stravično uspješna procjena glede naših života, ali jeste važan broj na tržištu. Broj koji Netflix čini onim što jeste. Po nekoj logici stvari, što više podataka skupimo o nekom fenomenu, veća je vjerovatnoća da ćemo imati preciznija mjerenja. U određenoj mjeri to je sasvim tačno, govorimo li recimo o asteroidima, ali govorimo li o proračunu vremena, da li i do kada će padati kiša ili biti sunčano, stvari se naglo mijenjaju ma koliko podataka posjedovali. Edward Lorenz će tokom bavljenja proračunom meteoroloških prilika, nadoći na zaključak o teoriji haosa. Pojedine pojave možemo predviđati, ali ne u nedogled, i tu započinje problem naših gladnih algoritama za što više podataka, a i naše svijesti o tome šta to sve uopće možemo naučiti iz ortografije kur'anskog teksta. Ljudsko ponašanje je nekada možda sličnije asteroidima, ovisno o kojem domenu ljudske zbilje govorimo, reći će Jordan Ellenberg, ali generalno je mnogo sličnije vremenskoj prognozi, pa čak i složenije. Da li ćemo doći do stadija, Google knows you (Google te poznaje), otvoreno je pitanje, a iskreno se nadam da nećemo, zbog slobode koju težimo da sačuvamo i unaprijedimo.

 

Čovjek protiv mašine: revolucija arapskih dijakritičkih znakova

Da vam odmah kažem, ovako glasi naslov jednog skorašnjeg teksta, upravo na temu uloge algoritama u kreiranju sadržaja glede nedavnih palestinko-izraelskih sukoba. Kada sam vidio ovaj naslov, napisan na arapskom jeziku, tako što su uklonjene tačke sa određenih slova (dijakritički znakovi), odmah sam se zainteresirao za sadržaj teksta. Naslov, الاٮساں صد الاله: ٮوره الٮڡاط العرٮٮه, već sam po sebi govori mnogo. Riječ je o ortografskoj revoluciji nasuprot algoritama, koji su automatski filtrirali sadržaje na arapskom jeziku o dešavanjima u Istočnom Jerusalemu, a kasnije i Gazi. Kada prevodite s arapskog jezika, ili na arapski jezik, odmah ćete primijetiti kako se Google Translate vrlo često pogubi i ne uspije da pravilno rastumači pravilan redoslijed samoglasnika, koji se inače ne pišu. Koliko god se algoritam u tom domenu popravio, na jedno nije bio spreman, a to je da se arapski jezik, ili poruke na arapskom jeziku, kodiraju i prenose na pismu koje ustvari stalno susrećemo u ranim prepisima Kur'ana, a čija je osnovna odlika vrlo često odsustvo dijakritičkih znakova (tačke ponad pojednih slova zarad jasnijeg razlikovanja od drugih sličnih slova). Iako se u ranim prepisima Kur'ana na pojedinim mjestima i za pojedina slova koriste dijakritički znakovi, u ovom poduhvatu, tokom prošlog mjeseca, ideja je bila uopće ih ne koristiti. Time su se najobičnije rečenice pretvorile u nejasan kod, čak i za dobrog govornika arapskog jezika, a bogami i za algoritme koji nisu bili spremni na takav obrat situacije. Od ortografije kur'anskog osnovnog teksta iz 7. stoljeća, pa do društvenih mreža 21. stoljeća, možemo svjedočiti kako se arapsko pismo upotrebljava poput koda, kojeg je neophodno dešifrirati. To su osnovni razlozi zbog kojih vrlo često kada govorim o ranim prepisima Kur'ana upotrebljavam sintagmu skeletonski tekst, kako bih dočarao sliku Teksta, koji obitava u jednoj goloj, često zakučastoj formi, pa kao da imate kod ispred sebe koji morate da dešifrujete. Uostalom, termine dekodiranje i dešifrovanje, čini mi se, najprije ćete susresti u govoru o raznolikim starim rukopisima.

Fenomen iznenađenja i nepredvidivosti

Jedna od velikih polemika 20. stoljeća je bila o mogućnosti postojanja centralnog aparatusa koji će sažimati sve informacije i nuditi odgovore kako i šta da se čini. Izgleda, da se ova polemika nanovo otvara, samo u malo drugačijem ruhu. Ovaj put je to jasno izražena rasprava o ulozi algoritama, posjedovanju i sakupljanju privatnih informacija, te u kojoj mjeri je moguće precizno dešifrovati sve te prikupljenje podatke. Tu vidim glavnu poveznicu između proučavanja ortografije kur'anskog arapskog jezika i modernih rasprava te fenomena koji se tiču uloge algoritama u našoj svakodnevnici. Navest ću vam jedan primjer kako možemo sakupiti određene podatke o ranim prepisima Kur'ana, zahvaljujući modernoj tehnologiji, ali da pri tome ostanemo zatečeni u neznanju šta bi konkretno ti podaci značili te kako da ih interpretiramo. Kreiranje ranih prepisa Kur'ana, pa i onih kasnije sve do 10. stoljeća, s manjim brojem dijakritičkih znakova, kada se dobro zamislite, predstavlja jednu vrstu pisanog koda. Iako nam se uglavnom čini da je, glede Kur'ana, sve već uveliko poznato, zapravo uopće nije tako. Baš zbog toga mi je ova kratkoročna revolucija pisanja arapskog jezika, bez ikakve upotrebe dijakritičkih znakova, dala ideju da objasnim zašto o fenomenima ortografije kur'anskog teksta vrlo često pišem u terminima kodiranja i dekodiranja. Šta je algoritam ako ne zbir instrukcija koje omogućavaju računaru da skupi i obradi različite informacije i podatke, te da ponudi određen rezultat. Proces je u osnovi jednostavan, prikupljaju se podaci koji se potom obrađuju prema nizu uputa i potom slijedi konačni ishod. Kodiranje je način naše komunikacije s računarom, tako što mu dajemo upute koje radnje i aktivnosti treba da poduzme – i pisanje koda jeste ustvari proces kreiranja uputa. 

Rani prepisi kur'anskog teksta egzistiraju poput koda kojeg je, napravite li određeni otklon od modernih štampanih izdanja s gotovim rezultatima, potrebno vrlo obazrivo dekodirati i dešifrovati. Digitalizovani rani prepisi Kur'ana, paradoksalno, bogati su kako tekstualnom fleksibilnošću, tako i stabilnošću. Moderna štampana izdanja, s druge strane, su vrlo statična. Navest ću primjer iz sure Hud. Riječ je o sedamdeset i sedmom ajetu koji se u većini prepisa Kur'ana, a posebno modernim izdanjima, piše na statičan način. Otvorite li, pak, vrlo rane prepise Kur'ana, situacija se naglo mijenja te nailazite na ortografiju jedne riječi u ovom ajetu, koja izaziva čuđenje. Mnoštvo je pitanja, a pravog odgovora nema, barem ne odmah. Ajet na arapskom glasi:

 وَلَمَّا جَآءَتۡ رُسُلُنَا لُوطٗا سِيٓءَ بِهِمۡ وَضَاقَ بِهِمۡ ذَرۡعٗا وَقَالَ هَٰذَا يَوۡمٌ عَصِيبٞ

 A kada izaslanici Naši stigoše kod Luta, obuze ga zbog njih slutnja i nelagoda, te on kaza: ''Evo strašnoga dana!'' (Duraković)

Obratite pažnju na riječ koju sam obilježio. Neću zalaziti u detalje, tako da ću pokušati samo predočiti ideju o kojoj pišem sve ovo vrijeme. Pasivna forma, (سِيٓءَ), u svim izdanjima se piše na način koji vidite u zagradi, pa čak i ako otvorite stoljećima stare prepise Kur'ana vidjet ćete istu formu. Naprimjer, pogledate li prepis Kur'ana pod signaturom Arabe 342 (a), u Nacionalnoj biblioteci u Parizu, te otvorite baš ovaj ajet, nećete vidjeti ništa što bi vas mnogo iznenadilo.


Paris, Bibliothèque nationale de France Arabe 342 (a), sura Hud, 77. ajet

Jedino što ćete primijetiti jeste nedostatak pisanja glotalne pauze (hemzeta), ali to je za rane prepise Kur'ana uobičajena pojava, tako da ova forma nas približava modernim standardnim pisanjima (سِيٓءَ). Imamo, dakle, ortografsku evoluciju iz stadija (سِيٓ) u (سِيٓءَ). Ova pisana forma je upravo jedan vid koda, kojeg ste tradicionalno dekodirali uz pomoć poznavatelja kur'anskog teksta (karija), zbog čega sva ova stoljeća imamo neizostavnu tradiciju oralnog učenja i prenošenja kur'anskog teksta. Pogledajmo sada još dva starija prepisa Kur'ana, u Berlinu i Parizu.

Berlin, Staatsbibliothek Faksimiledruck des Samarkand-Kodex, Sankt Petersburg 1905, sura Hud, 77. ajet

Paris, Bibliothèque nationale de France Arabe 328 (c), sura Hud, 77. ajet

Arabe 328 (c) i Samarkand-Kodex, su dva veoma stara prepisa Kur'ana, pri čemu prvi vrlo vjerovatno datira iz 7. stoljeća, a drugi iz druge polovine 8. stoljeća. Sada se već nalazimo u čudu, kao algoritmi koji nisu mogli razaznavati tweetove pisane na arapskom jeziku bez dijakritičkih znakova. Ortografskom slijedu (سِيٓ) -> (سِيٓءَ) odjednom dodajemo potpunu drugačije kodiranu formu ovog dijela kur'anskog teksta, pa riječ o kojoj govorim u sedamdeset i sedmom ajetu sure Hud, u ova dva prepisa, a što sam označio i u malim skupovima na priloženim fotografijama, se piše ovako: (ساى). Zašto se ova riječ, recimo u prepisu Arabe 328 (c), piše na ovaj način, s elifom, za sada mi je nejasno, i tek predstoji pokušaj dolaska do nekog mogućeg odgovora i rezultata. Ove sam primjere naveo kako bismo vidjeli da rani kur'anski prepisi Kur'ana sadrže, vrlo često, ortografske fenomene koji se ponašaju poput određenog koda što su ga pisale raznolike pisarske ruke, a uporedo s ovim procesom odvijao se i proces dekodiranja kur'anskog teksta posredstvom oralne tradicije. Zbog toga su pisana i oralna tradicija glede Kur'ana dva neizostavna elementa. Kur'anski tekst, za razliku od modernih izdanja, u ranim prepisima na pergamentima sadrži, vrlo primjetno, ideju o multiformnosti, što smo i dobili u rukopisnom nasljeđu. Učenje Kurana se odvijalo na takav način da se nije moglo u potpunosti monopolizirati, pa da imamo striktno jedan homogen i statičan sistem učenja. Kur'an je posredstvom arapskog pisma, hidžaskog i kufskog, iznjedrio nekoliko različitih tradicija učenja Kur'ana što je islamsku tradiciju učinilo raznolikom, fleksibilnom i elastičnom, spremnom da djeluje kako univerzalno, tako i vrlo lokalno i regionalno. Ukoliko je kodiranje proces davanja uputa, pa rano prepisivanje Kur'ana se odvijalo na takav način da je osnovna uputa počivala na razumijevanju prirode vrlo složenih ljudskih odnosa koji često za rezultat imaju nepredvidive ishode, a ne daju se tek tako uhvatiti, pa čak ni modernim svijetom algoritama.

Primjedbe

Popularni postovi