Algoritamska cenzura i ortografska sloboda
Zanimljiv fenomen savremenog svijeta
je internetsko poigravanje s algoritmima, posebno vidljivo u tihom cenzurisanju
vijesti na društvenim mrežama. U arapskom jeziku i njegovoj neobičnoj
ortografiji je bilo moguće izbjeći ovu vrstu cenzure zbog nemogućnosti
algoritama da dešifriraju kodove bez dijakritičkih znakova
Imao sam nekoliko ideja o čemu da
pišem glede ortografije kur'anskog osnovnog teksta za ovaj broj Preporoda,
pa sam se odlučio da popratim jedan zanimljiv fenomen koji se zbivao u
virtualnom svijetu interneta tokom nedavnih sukoba u Istočnom Jerusalemu, koji
su potom prerasli u ustaljenu agresiju izraelskih vojnih snaga na Gazu. Budući
da govorimo o sukobu koji traje decenijama, a i medijski je veoma popraćen,
bilo je za očekivati da će se preliti i na društvene mreže – Twitter, Facebook
ili Instagram. Svakodnevno smo mogli pratiti šta se dešava te kakve su
reakcije – regionalne i globalne. U masi informacija koje su kolale po
internetu, neizostavan je bio način na koji su ih algoritmi prerađivali i
filtrirali. Reuters je objavio kratki informativni tekst baš o tome,
prije nešto više od mjesec dana. Od početka izbijanja majskih sukoba u Istočnom
Jerusalemu, primijetio sam da se sve više novinara i “običnih smrtnika” žali na
uklanjanje sadržaja koji su se ticali ovog sukoba. Bili to tweetovi, facebook
i instagram obavijesti, pa čak i youtube video klipovi, u jednom
momentu bi naprosto isparili, kao da ih uopće nije bilo. Poznata palestinska
muzička diva, Nai Barghouti se, nedugo nakon što je na youtube objavila
pjesmu Raj'een (Vraćamo se), počela žaliti kako joj sadržaj biva
uklonjen. Nije se to naravno samo njoj dešavalo, štaviše, mnogo se novinara
žalilo kako im obavijesti naprosto ispare. Twitter, Facebook, i Instagram su opravdanje našli u tehničkim problemima, što je
vrlo moguće, pa baš ovdje započinjemo priču kojoj tek predstoji da bude
ispričana. Riječ je naravno o algoritmima, skupljanju podataka o nama, i
automatskom ponašanju algoritamskih sistema koji filtriraju protok informacija.
Moja uloga je da vas uvijek upoznam s
nekim novim čarima ortografije kur'anskog teksta, a ovo je idealna prilika da
to učinim. Kur'anska ortografija je puna raznolikih čari, nedešifrovanih i
zagonetnih ortografskih fenomena, pa baš zbog toga nerijeko koristim pojmove kod,
dekodiranje, skeletonski, itd. kada opisujem određene kur'anske
ortografske fenomene. U odličnoj knjizi How Not to Be Wrong Jordana
Ellenberga, o sistemu matematičkog promišljanja, nezaobilazna tema su
algoritmi. Arapi imaju vrlo lijep naziv za algoritme budući da je to riječ koja
svakako dolazi u Evropu posredstvom Arapa. Da to malo pobosančim, algoritmi bi
na arapskom bili havarizmijati. Matematički posmatrano, rekao bi Jordan
Ellenberg, što se algoritmi više hrane novim podacima, za očekivati je da postaju
sve precizniji, pa kada Netflix pogađa 10% naših preferencija, to ipak
nije tako stravično uspješna procjena glede naših života, ali jeste važan broj
na tržištu. Broj koji Netflix čini onim što jeste. Po nekoj logici
stvari, što više podataka skupimo o nekom fenomenu, veća je vjerovatnoća da
ćemo imati preciznija mjerenja. U određenoj mjeri to je sasvim tačno, govorimo
li recimo o asteroidima, ali govorimo li o proračunu vremena, da li i do kada
će padati kiša ili biti sunčano, stvari se naglo mijenjaju ma koliko podataka
posjedovali. Edward Lorenz će tokom bavljenja proračunom meteoroloških
prilika, nadoći na zaključak o teoriji haosa. Pojedine pojave možemo
predviđati, ali ne u nedogled, i tu započinje problem naših gladnih algoritama
za što više podataka, a i naše svijesti o tome šta to sve uopće možemo naučiti
iz ortografije kur'anskog teksta. Ljudsko ponašanje je nekada možda sličnije
asteroidima, ovisno o kojem domenu ljudske zbilje govorimo, reći će Jordan
Ellenberg, ali generalno je mnogo sličnije vremenskoj prognozi, pa čak i
složenije. Da li ćemo doći do stadija, Google knows you (Google te
poznaje), otvoreno je pitanje, a iskreno se nadam da nećemo, zbog slobode koju
težimo da sačuvamo i unaprijedimo.
Čovjek protiv mašine: revolucija
arapskih dijakritičkih znakova
Da vam odmah kažem, ovako glasi naslov
jednog skorašnjeg teksta, upravo na temu uloge algoritama u kreiranju sadržaja
glede nedavnih palestinko-izraelskih sukoba. Kada sam vidio ovaj naslov,
napisan na arapskom jeziku, tako što su uklonjene tačke sa određenih slova
(dijakritički znakovi), odmah sam se zainteresirao za sadržaj teksta. Naslov, الاٮساں صد الاله: ٮوره الٮڡاط العرٮٮه, već sam po sebi govori mnogo. Riječ
je o ortografskoj revoluciji nasuprot algoritama, koji su automatski
filtrirali sadržaje na arapskom jeziku o dešavanjima u Istočnom Jerusalemu, a
kasnije i Gazi. Kada prevodite s arapskog jezika, ili na arapski jezik, odmah
ćete primijetiti kako se Google Translate vrlo često pogubi i ne uspije
da pravilno rastumači pravilan redoslijed samoglasnika, koji se inače ne pišu.
Koliko god se algoritam u tom domenu popravio, na jedno nije bio spreman, a to
je da se arapski jezik, ili poruke na arapskom jeziku, kodiraju i prenose na
pismu koje ustvari stalno susrećemo u ranim prepisima Kur'ana, a čija je
osnovna odlika vrlo često odsustvo dijakritičkih znakova (tačke ponad pojednih
slova zarad jasnijeg razlikovanja od drugih sličnih slova). Iako se u ranim
prepisima Kur'ana na pojedinim mjestima i za pojedina slova koriste
dijakritički znakovi, u ovom poduhvatu, tokom prošlog mjeseca, ideja je bila
uopće ih ne koristiti. Time su se najobičnije rečenice pretvorile u nejasan
kod, čak i za dobrog govornika arapskog jezika, a bogami i za algoritme koji
nisu bili spremni na takav obrat situacije. Od ortografije kur'anskog osnovnog
teksta iz 7. stoljeća, pa do društvenih mreža 21. stoljeća, možemo svjedočiti
kako se arapsko pismo upotrebljava poput koda, kojeg je neophodno dešifrirati.
To su osnovni razlozi zbog kojih vrlo često kada govorim o ranim prepisima
Kur'ana upotrebljavam sintagmu skeletonski tekst, kako bih dočarao sliku
Teksta, koji obitava u jednoj goloj, često zakučastoj formi, pa kao da imate
kod ispred sebe koji morate da dešifrujete. Uostalom, termine dekodiranje i
dešifrovanje, čini mi se, najprije ćete susresti u govoru o raznolikim
starim rukopisima.
Fenomen iznenađenja i nepredvidivosti
Jedna od velikih polemika 20. stoljeća
je bila o mogućnosti postojanja centralnog aparatusa koji će sažimati sve
informacije i nuditi odgovore kako i šta da se čini. Izgleda, da se ova
polemika nanovo otvara, samo u malo drugačijem ruhu. Ovaj put je to jasno
izražena rasprava o ulozi algoritama, posjedovanju i sakupljanju privatnih
informacija, te u kojoj mjeri je moguće precizno dešifrovati sve te
prikupljenje podatke. Tu vidim glavnu poveznicu između proučavanja ortografije
kur'anskog arapskog jezika i modernih rasprava te fenomena koji se tiču uloge
algoritama u našoj svakodnevnici. Navest ću vam jedan primjer kako možemo
sakupiti određene podatke o ranim prepisima Kur'ana, zahvaljujući modernoj
tehnologiji, ali da pri tome ostanemo zatečeni u neznanju šta bi konkretno ti
podaci značili te kako da ih interpretiramo. Kreiranje ranih prepisa Kur'ana,
pa i onih kasnije sve do 10. stoljeća, s manjim brojem dijakritičkih znakova,
kada se dobro zamislite, predstavlja jednu vrstu pisanog koda. Iako nam se
uglavnom čini da je, glede Kur'ana, sve već uveliko poznato, zapravo uopće nije
tako. Baš zbog toga mi je ova kratkoročna revolucija pisanja arapskog
jezika, bez ikakve upotrebe dijakritičkih znakova, dala ideju da objasnim zašto
o fenomenima ortografije kur'anskog teksta vrlo često pišem u terminima kodiranja
i dekodiranja. Šta je algoritam ako ne zbir instrukcija koje omogućavaju
računaru da skupi i obradi različite informacije i podatke, te da ponudi
određen rezultat. Proces je u osnovi jednostavan, prikupljaju se podaci koji se
potom obrađuju prema nizu uputa i potom slijedi konačni ishod. Kodiranje je
način naše komunikacije s računarom, tako što mu dajemo upute koje radnje i
aktivnosti treba da poduzme – i pisanje koda jeste ustvari proces kreiranja
uputa.
Rani prepisi kur'anskog teksta
egzistiraju poput koda kojeg je, napravite li određeni otklon od modernih
štampanih izdanja s gotovim rezultatima, potrebno vrlo obazrivo dekodirati i
dešifrovati. Digitalizovani rani prepisi Kur'ana, paradoksalno, bogati su kako
tekstualnom fleksibilnošću, tako i stabilnošću. Moderna štampana izdanja, s
druge strane, su vrlo statična. Navest ću primjer iz sure Hud. Riječ je o
sedamdeset i sedmom ajetu koji se u većini prepisa Kur'ana, a posebno modernim
izdanjima, piše na statičan način. Otvorite li, pak, vrlo rane prepise Kur'ana,
situacija se naglo mijenja te nailazite na ortografiju jedne riječi u ovom
ajetu, koja izaziva čuđenje. Mnoštvo je pitanja, a pravog odgovora nema, barem
ne odmah. Ajet na arapskom glasi:
وَلَمَّا جَآءَتۡ رُسُلُنَا
لُوطٗا سِيٓءَ بِهِمۡ وَضَاقَ بِهِمۡ ذَرۡعٗا وَقَالَ هَٰذَا يَوۡمٌ
عَصِيبٞ
A kada izaslanici Naši stigoše kod
Luta, obuze ga zbog njih slutnja i nelagoda, te on kaza: ''Evo strašnoga
dana!'' (Duraković)
Obratite pažnju na riječ koju sam obilježio. Neću zalaziti u detalje, tako da ću pokušati samo predočiti ideju o kojoj pišem sve ovo vrijeme. Pasivna forma, (سِيٓءَ), u svim izdanjima se piše na način koji vidite u zagradi, pa čak i ako otvorite stoljećima stare prepise Kur'ana vidjet ćete istu formu. Naprimjer, pogledate li prepis Kur'ana pod signaturom Arabe 342 (a), u Nacionalnoj biblioteci u Parizu, te otvorite baš ovaj ajet, nećete vidjeti ništa što bi vas mnogo iznenadilo.
Jedino što ćete primijetiti jeste
nedostatak pisanja glotalne pauze (hemzeta), ali to je za rane prepise Kur'ana
uobičajena pojava, tako da ova forma nas približava modernim standardnim
pisanjima (سِيٓءَ). Imamo,
dakle, ortografsku evoluciju iz stadija (سِيٓ)
u (سِيٓءَ).
Ova pisana forma je upravo jedan vid koda, kojeg ste tradicionalno dekodirali
uz pomoć poznavatelja kur'anskog teksta (karija), zbog čega sva ova stoljeća
imamo neizostavnu tradiciju oralnog učenja i prenošenja kur'anskog teksta.
Pogledajmo sada još dva starija prepisa Kur'ana, u Berlinu i Parizu.
Arabe 328 (c) i Samarkand-Kodex, su
dva veoma stara prepisa Kur'ana, pri čemu prvi vrlo vjerovatno datira iz 7.
stoljeća, a drugi iz druge polovine 8. stoljeća. Sada se već nalazimo u čudu,
kao algoritmi koji nisu mogli razaznavati tweetove pisane na arapskom
jeziku bez dijakritičkih znakova. Ortografskom slijedu (سِيٓ)
-> (سِيٓءَ)
odjednom dodajemo potpunu drugačije kodiranu formu ovog dijela
kur'anskog teksta, pa riječ o kojoj govorim u sedamdeset i sedmom ajetu sure
Hud, u ova dva prepisa, a što sam označio i u malim skupovima na priloženim
fotografijama, se piše ovako: (ساى).
Zašto se ova riječ, recimo u prepisu Arabe 328 (c), piše na ovaj način, s
elifom, za sada mi je nejasno, i tek predstoji pokušaj dolaska do nekog mogućeg
odgovora i rezultata. Ove sam primjere naveo kako bismo vidjeli da rani
kur'anski prepisi Kur'ana sadrže, vrlo često, ortografske fenomene koji se
ponašaju poput određenog koda što su ga pisale raznolike pisarske ruke, a
uporedo s ovim procesom odvijao se i proces dekodiranja kur'anskog teksta
posredstvom oralne tradicije. Zbog toga su pisana i oralna tradicija glede
Kur'ana dva neizostavna elementa. Kur'anski tekst, za razliku od modernih
izdanja, u ranim prepisima na pergamentima sadrži, vrlo primjetno, ideju o
multiformnosti, što smo i dobili u rukopisnom nasljeđu. Učenje Kurana se
odvijalo na takav način da se nije moglo u potpunosti monopolizirati, pa da
imamo striktno jedan homogen i statičan sistem učenja. Kur'an je posredstvom
arapskog pisma, hidžaskog i kufskog, iznjedrio nekoliko različitih tradicija
učenja Kur'ana što je islamsku tradiciju učinilo raznolikom, fleksibilnom i
elastičnom, spremnom da djeluje kako univerzalno, tako i vrlo lokalno i
regionalno. Ukoliko je kodiranje proces davanja uputa, pa rano prepisivanje
Kur'ana se odvijalo na takav način da je osnovna uputa počivala na razumijevanju
prirode vrlo složenih ljudskih odnosa koji često za rezultat imaju nepredvidive
ishode, a ne daju se tek tako uhvatiti, pa čak ni modernim svijetom algoritama.
Primjedbe
Objavi komentar