Tantangan Big Data dalam Studi Sastra


(Ilustrasi: Visualisasi big data, GeoArt / Shutterstock)
Mohammad Rokib *

Selama berabad-abad, intuisi dan intelegensi telah memainkan peran utama dalam aktivitas studi kesastraan. Kehadiran big data belakangan ini yang dilirik baik dalam ilmu sosial apalagi ilmu eksakta telah menawarkan sekaligus menantang tentang bagaimana pendekatan baru ini dapat diterapkan pada disiplin ilmu tradisional seperti studi sastra.

Oleh sebagian kecil ilmuan humaniora, big data juga digadang dapat memperbarui, melalui teknologi komputer, banyak disiplin keilmuan yang mempelajari pemikiran manusia dan produk-produk budaya. Area kajian keilmuan baru seperti ini kerap menyebut rumpun keilmuan mereka sebagai Digital Humanities.

Apakah mungkin bila kita mengkaji sastra dengan penerawangan big data? Lalu apa pentingnya mengkaji sastra, misalnya, dengan big data?

Disiplin ilmu sastra sesungguhnya selaras dengan pendekatan baru ini. Bukan hanya karena disiplin sastra sudah sangat lama dan bahkan tertua di bidang humaniora, melainkan juga karena sudah berjuta karya, penulis, genre, dan tema yang sudah ada, digunakan, dan didiskusikan oleh banyak orang baik secara luring (offline) maupun daring (online).

Belakangan ini saya berupaya untuk terus mencari jawaban atas kemungkinan dan relevansi big data dengan studi sastra. Bukan untuk memaksakan big data yang memang sedang menjadi tren dalam berbagai disiplin keilmuan untuk masuk dalam kajian sastra, tetapi usaha ini muncul dan terinspirasi pertama kali ketika membaca karya Franco Moretti berjudul Distant Reading (2013).

Karya ini tidak hanya mempertanyakan kembali konsep novel yang sangat eurosentris dan kenapa novel selalu lekat dalam bentuk prosa, tetapi juga membuka mata bahwa nyatanya komputer dapat membantu untuk mengunyah ribuan data teks sastra dari abad ke abad dalam satu waktu.

Moretti mengakui bahwa penelitiannya cenderung berbeda dan anti-mainstream karena bekerja secara kuantitatif untuk menggali data tentang ragam jenis sastra, judul karya sastra, penulis, dan seterusnya dengan suguhan hasil berupa diagram, peta, tabel, dan sejenisnya. Untuk menuju hasil tersebut, bantuan data yang diolah secara komputasional telah mendukung dan memudahkan kerja tersebut.

Meskipun tidak menyebut secara eksplisit tentang big data dalam bukunya, apa yang dikerjakan Moretti pada dasarnya sebanding dengan cara kerja big data.

Sebuah artikel yang ditulis Jennifer Schuessler (2017) menyinggung pendekatan big data dalam kajian sastra dengan asumsi yang merujuk Moretti bahwa kajian (kritik) sastra cenderung menganalisis satu karya pilihan yang terbatas pada waktu tertentu. Karya pilihan tersebut hanya sampel. Kritikus sastra perlu mempertimbangkan puluhan ribu karya lainnya baik di waktu yang sama maupun berbeda.

Tantangan tersebut menggiring pada sebuah jawaban bahwa ilmuan sastra memerlukan bantuan alogaritma komputer dan data digital untuk memetakan sejarah sastra dalam kurun waktu yang panjang. Ini juga yang meyakinkan sebuah sebuah kritik baru yang disebut sebagai computational criticism atau kritik komputasional.

Dalam disiplin ilmu sastra, cara kerja big data tentu saja akan berbeda dengan cara kerja yang sudah lazim dalam pendekatan ilmu kesastraan.

Kita tentu saja sudah akrab dengan ragam aliran (ism) dalam kajian sastra seperti formalisme, freudianisme, strukturalisme, poskolonialisme, dan posmodernisme. Ragam isme tersebutlah yang selama ini galib selalu dipakai untuk menafsir sastra, politik ataupun budaya.

Berbeda dengan isme-isme tersebut, big data bukan untuk analisis makna atas simbol atau perlambangan tertentu, tetapi lebih mendalami kata kunci apa saja yang banyak digunakan orang dari abad ke abad. Big data diyakini telah mampu menyuguhkan pada pembaca, kritikus, dan pencinta sastra terhadap jutaan data sastra melalui kata kunci tertentu dengan visualisasi kuantitatif seperti grafik dan peta.

Pendekatan seperti ini lebih menekankan aspek jejaring pada diskursus kesastraan. Pemaknaan atas jejaring itu bisa digapai dengan pendekatan lain lagi, tetapi dengan suguhan hasil pemetaan big data, makna tertentu sebenarnya dapat dengan mudah dijabarkan. Ini juga tidak menutup kemungkinan untuk menggunakan pendekatan lain bila ingin mendalami satu topik atau kasus tertentu.

Dalam buku lainnya berjudul Graph, Maps, Trees (2005), Moretti sudah menunjukkan hasil penelitiannya yang fantastik tentang sejarah sastra. Beragam jenis genre sastra Inggris antara tahun 1740 dan 1900 ditelisik dan terdeteksi terdapat 44 genre selama lebih dari 160 tahun.

Hasil penelusuran ini disajikan dalam sebuah grafik yang komputasional. Hasil pemetaan lainnya seperti pohon asal muasal fiksi detektif antara tahun 1891 dan 1900 dan peta desa dalam sastra Inggris yang populer pada abad 19 juga sangat menarik dalam kajian sastra.

Meskipun pendekatan baru ini mendapatkan kritikan tajam dari ilmuan humaniora lainnya, secara umum mereka tetap berkesan terhadap cara kerja ala big data. Persoalan tersisa yang memang masih terus dikembangkan adalah tentang apa makna sebuah data kuantitatif bagi ilmu humaniora.

Galibnya, ilmu humaniora -terutama sastra- selalu bertujuan untuk memahami dan memberi makna pada bahasa dan simbol yang sukar dipahami oleh orang awam. Karena itu ilmu sastra lekat dengan pertanyaan-pertanyaan sukar tentang estetika, eksistensi, dan makna.

Selanjutnya, pertanyaan yang muncul adalah apakah mungkin hal-hal seperti ini juga dapat dijawab melalui pendekatan big data.

Salah seorang sejarawan bernama Anthony Grafton sebagaimana dikutip Patricia Cohen (2010) menyatakan bahwa dirinya sangat mempercayai kuantifikasi. Dia juga mengagumi bagaimana bidang digtal humanities telah melakukan kerja-kerja fantastis.

Tetapi dia tidak percaya bahwa kuantifikasi dapat melakukan apa saja karena masalah-masalah kemanusiaan dalam ilmu humaniora adalah tentang pemaknaan, tentang penafsiran. Ini nyaris tak mungkin dilakukan dengan cara kuantitatif.

Bagi saya, hasil pemetaan dengan menggunakan big data dalam studi sastra sebenarnya menyuguhkan sebuah pemahaman tertentu, meskipun belum bisa mendalam sebagaimana cara kerja pendekatan sastra umumnya.

Yang menjadi titik terpenting dalam pendekatan ini bukan pada pemaknaan atas karya atau topik tertentu dalam karya melainkan bagaimana memahami pasang surut produktivitas seorang penulis, kecenderungan tema karya sastra sepanjang sejarah, kecenderungan genre dalam kurun waktu tertentu, dan perkembangan topik maupun genre sastra dari waktu ke waktu.

Maret 2018 lalu saya pernah membandingkan resepsi warganet atas dua sastrawan yang pernah berseteru pada masanya yaitu Hamka dan Pramoedya Ananta Toer melalui sebuah aplikasi khusus milik Google. Hasilnya fantastis.

Terdapat sebuah hasil analisis berupa grafik dalam hitungan detik tentang bagaimana catatan resepsi atas karya maupun tentang eksistensi dua sastrawan tersebut dari tahun 1930 hingga 2015. Pada masing-masing tahun kita dapat mengetahui sumber-sumber yang membuat keduanya banyak diresepsi di internet.

Ahli sastra Indonesia asal Jerman bernama Arndt Graf pada tahun 2007 juga menerbitkan hasil penelitian yang berbasis kritik komputasional. Dia memanfaatkan mesin pencari Google untuk mengukur popularitas sastrawan Pramoedya Ananta Toer di Internet.

Dengan pendekatan kuantitatif yang diperkaya dengan pendekatan deskriptif, Graf menemukan bahwa novel Bumi Manusia menjadi paling populer dengan disertai lima faktor yang mendukung persepsi atas novel tersebut.

Saya membayangkan, pemanfaatan big data dalam kajian sastra sangatlah signifikan bila ingin mengetahui atau mengukur berapa banyak orang telah membicarakan karya tertentu atau sastrawan tertentu; atau, misalnya, bila ingin mengetahui topik maupun genre apa saja yang paling diminati oleh pembaca.

Bila kelak muncul pertanyaan tentang jumlah novel yang sudah ditulis oleh para penulis Indonesia sejak angkatan Balai Pustaka, kita tentu butuh data seberapa banyak jumlah novel tersebut. Atau, bila ada pertanyaan tentang genre yang paling diminati oleh pembaca Indonesia terhadap novel-novel Indonesia sejak periode Balai Pustaka hingga kini, kita membutuhkan data yang mendukung jawaban atas pertanyaan tersebut.

Pada konteks inilah big data sangat mungkin, penting, dan relevan untuk dimanfaatkan dalam studi sastra yang sudah lama sekali belum memercikkan sebuah revolusi kritik. Tidak berlebihan kiranya bahwa gagasan kritik komputasional ala Moretti akan menjadi pendekatan revolusioner dalam studi sastra di masa mendatang.

*) Mohammad Rokib, pengajar pada jurusan Bahasa Indonesia, FBS, Universitas Negeri Surabaya.
https://beritagar.id/artikel/telatah/tantangan-big-data-dalam-studi-sastra

Leave a Reply

Bahasa ยป