Kemaskini terbaru: August 4, 2009

Kategori

 

 

  • Arkib

  • Hebahkan

  • Langgan berita

  • Ulasan Terkini

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Perkamusan dan Sains Komputer – Isu dan Cabaran dalam Era Teknologi Maklumat

Perkamusan dan Sains Komputer –

Isu dan Cabaran dalam Era Teknologi Maklumat

Mohd Yunus Sharum

Jabatan Sains Komputer

Fakulti Sains Komputer dan Teknologi Maklumat

Universiti Putra Malaysia

myunus@fsktm.upm.edu.my

1. Latar Belakang Perkamusan Istilah Melayu

Bagi sesetengah pihak, kamus bukanlah satu benda yang menarik, malah mungkin sesuatu yang jarang diberi perhatian oleh remaja dan kanak-kanak berbanding majalah hiburan dan komik. Namun bagi ahli bahasa, linguistik dan linguistik terkomputasi, kamus menjadi sumber rujukan yang penting. Ini kerana kamus menjadi sumber maklumat untuk memahami lebih mendalam terhadap makna dan ciri-ciri penting yang lain bagi sesuatu perkataan atau istilah.

Kamus didefinisikan sebagai buku yang mengandungi senarai kata dalam suatu bahasa yang dilengkapi dengan makna dan maklumat ringkas tentang tatabahasa bahasa tersebut (Salinah, 2000: 809), dan disusun mengikut abjad (KD, 2005: 667). Manakala bidang perkamusan pula adalah perihal (yg berkaitan dengan) kamus (penyusunannya, ilmu mengenainya, dll.) (KD, 2005: 667). Salinah (2000:810) mengkategorikan bidang perkamusan kepada bidang (1) leksikografi – iaitu tugas penghasilan kamus, dan (2) leksikologi – iaitu bidang pengajian tentang perkamusan.

Bidang perkamusan Melayu, khususnya leksikografi, sebenarnya telah bermula sejak zaman kerajaan Melayu Melaka. Kamus bahasa Melayu yang tertua dicatatkan merupakan sebuah senarai 482 istilah Melayu-Cina yang telah dikumpulkan sekitar tahun 1403 AD hingga 1511 AD (Blagden) dalam (Asmah, 1975: 337; Salinah, 2000: 810). Walaupun ia tidak menunjukkan bahawa orang Melayu yang melakukan tugas perkamusan tersebut, namun fakta ini menunjukkan bahawa bahasa Melayu sudah menjadi satu bahasa yang penting pada zaman itu. Bahkan sememangnya diketahui umum bahawa bahasa Melayu pernah menjadi bahasa lingua franca di kepulauan Nusantara.

Selain itu, Antonio Pigafetta (1519-1522) yang menemani Magellan, telah mengumpulkan sebuah glosari yang mengandungi 426 istilah Itali-Melayu, dan diterbitkan semula oleh Bausani dalam jurnal Dewan Bahasa pada tahun 1961 (Asmah, 1975: 337-338; Salinah, 2000: 810). Frederik Houtman pula mengumpulkan senarai istilah Melayu-Belanda pada tahun 1603. Selain beliau, Wilten Danckaerts turut mengkompil kamus Melayu-Belanda pada tahun 1623. Hasil penulisan ini menjadi asas kepada kamus Latin-Melayu dan Melayu-Latin Dictionarivm Malaico-Latinum, Latino-Malaicum. (Asmah, 1975: 338).

Pada tahun 1701, Thomas Bowrey mengkompil ‘A Dictionary of Malay and English and English and Malay’. Selanjutnya, kerja leksikografi disambung pula oleh James Howison, William Marsden (1813), L’Abbe Favre (1861), Klinkert (1893), Swettenham (1896), diikuti Shellabear, Wilkinson, Winstedt dan ahli leksikografi tempatan seperti Syed Mahmud dan Haji Shamsuddin (Asmah, 1975: 338).

Namun hakikatnya, senarai penerbitan berkaitan bidang perkamusan Melayu tidak terhenti setakat itu saja. Asmah Omar turut menyenaraikan kamus-kamus Melayu lain yang ditulis sebelum kurun ke-20 (29 dokumen kesemuanya) dan penulisan selepas kurun ke-20 (54 penulisan). Senarai ini boleh disemak pada bahagian Appendix dalam (Asmah, 1975:350-354).

2. Isu-isu Perkamusan

Walaupun bidang perkamusan Melayu bukan sesuatu yang baharu, namun tidak bermakna ia telah mantap. Dalam tugas perkamusan yang pernah dilakukan, terdapat kepelbagaian dalam ciri dan kaedah yang digunakan bagi menulis kamus. Kepelbagaian tersebut antaranya merangkumi identifikasi metabahasa (Nor Azizah, 2000). Metabahasa dalam perkamusan, menurut Nor Azizah, melibatkan (1) bahasa yang digunakan untuk memerikan kesemua butir leksikal bahasa objek yang dipilih sebagai entri (masukan) kamus, (2) Cara bahasa ini (di atas) mempersembahkan maklumat linguistik dan luar linguistik bahasa objek, dan (3) Konvensi leksikografi yang digunakan untuk mempersembahkan maklumat ini. Amnya, persoalan metabahasa dalam kamus lebih merujuk kepada penggunaan dan gaya bahasa yang sesuai untuk digunakan dalam menyampaikan maksud/ makna/ definisi sesuatu istilah masukan dalam kamus. Kaedah dan bahasa yang digunakan perlu sesuai kerana melalui keterangan yang disertakan kepada masukan akan memberi kefahaman kepada pengguna kamus.

Persoalan dan isu yang dikaitkan dengan penulisan keterangan atau metabahasa tidak semata-mata tertumpu pada makna. Asmah mencadangkan pemberian makna secara konsep sebelum memberi kata seerti (1975: 341-343). Pemadanan kata seerti dalam dua bahasa yang berlainan semata-mata mungkin tidak bermakna, kerana ada kala aspek kata dalam satu bahasa berbeza dengan bahasa yang satu lagi.

Asmah berpendapat bagi sesuatu masukan kata, perlu disertakan dengan terbitannya sekali (1975: 343). Selain itu beliau turut mencadangkan penyertaan ilustrasi makna dan penggunaan dalam ayat bagi kata berkenaan, dan juga transkripsi fonemik atau kaedah sebutan (1975: 344). Ciri penting selanjutnya ialah penggunaan ejaan standard, kerana menurut Asmah pengguna kamus juga ingin mendapatkan kaedah ejaan yang betul bagi suatu kata (1975:345). Peranan kamus sebagai preskripsi menerangkan di mana konteks sepatutnya suatu kata digunakan. (Asmah, 1975: 346). Selain bersifat diskriptif (menerangkan), Asmah berpendapat kamus perlu bertindak sebagai ‘frame-of-reference’ (kerangka rujukan) bagi ejaan dan penggunaannya (Asmah, 1975: 348).

Selain tidak memenuhi keperluan-keperluan di atas, beberapa perkara yang wujud dalam kamus sedia ada tetapi tidak penting perlu dihapuskan. Menurut Asmah, kamus-kamus yang sedia ada (waktu itu) mengandungi ciri-ciri yang tidak sepatutnya, seperti kata pinjaman yang jarang/tidak digunakan, sistem tulisan setempat, nama hari dan bulan, jadual berat dan ukuran, dsb. Asmah berpendapat penulisan kamus seperti ini lebih cenderung kepada pendatang atau pelancong asing (Asmah, 1975: 346).

Walau bagaimanapun sejak edisi pertama (1970) sehinggalah edisi ke-4 (2005), Kamus Dewan sebagai kamus standard bahasa Melayu nyata telah mengalami banyak pembaikan. Kebanyakan cadangan-cadangan yang dikemukakan Asmah telah pun diterapkan, walaupun tidak kesemuanya. Antara yang tidak diterapkan sepenuhnya ialah penerangan kaedah sebutan. Misalnya, kaedah sebutan hanya disertakan bagi istilah ‘bermasalah’ dalam cara penyebutannya (KD, 2005:xvii). Dari aspek struktur, Kamus Dewan telah menunjukkan kematangan yang tinggi dan nyata boleh dibanggakan. Namun menurut Salinah Ja’far, bahasa Melayu walaupun telah ada kamus yang lengkap tetapi masih kurang ahli leksikologi (2000: 811). Penyusunan kamus lebih tertumpu pada aspek leksikografi. Namun dalam bidang leksikologi, iaitu pengajian tentang ilmu penyusunan dan penghasilan kamus, nyata masih banyak kekurangan.

3. Keperluan Perubahan daripada Mengumpul kepada Menjana Istilah

Perkamusan pada awalnya (dan mungkin juga hingga hari ini) bersifat pengumpulan istilah-istilah Melayu. Kamus dwibahasa Melayu-China yang terawal direkodkan menunjukkan bahawa masyarakat Cina sudah berusaha mengumpulkan istilah-istilah Melayu (atau mungkin sebaliknya iaitu orang Melayu berusaha mengumpulkan istilah-istilah bahasa Cina). Selain itu kebanyakan kamus-kamus istilah Melayu dikumpul oleh orientalis Barat. Oleh kerana kandungannya yang kurang aspek ilmiahnya, mendorong Asmah berpendapat penulisan kamus seperti ini lebih cenderung kepada pendatang atau pelancong asing (Asmah, 1975: 346).

Kamus terawal oleh penduduk di kepulauan Nusantara ialah pada tahun 1858, iaitu Kitab Pengetahuan Bahasa oleh Raja Ali Haji (Asmah, 1975: 350). Selain mengumpul, perkamusan bertujuan menerangkan makna kepada istilah. Namun berdasarkan analisisnya, Nor Azizah berpendapat Raja Ali Haji cenderung mengungkap makna dengan agak panjang lebar sehingga terdapat entri-entri yang mencecah dua halaman, berbelit-belit dan lebih banyak memperlihatkan maklumat luar linguistik dan pandangan peribadi penyusun berbanding maklumat linguistik (Nor Azizah, 2000: 868).

Perkembangan kamus selari dengan perkembangan sesuatu bahasa, dan usaha mengumpulkan istilah bahasa itu mungkin tidak pernah tamat. Yang nyata, ‘perkataan lengkap dalam kerja perkamusan memang sesuatu yang tidak mudah dicapai kerana sifat kedinamikan bahasa itu sendiri’ (Noresah, 1994) dalam (KD, 2005:xxv). Satu masa dahulu, tujuan perkamusan mungkin sekadar bagi mengumpulkan istilah-istilah Melayu bagi memudahkan urusan perdagangan dan pentadbiran oleh pedagang dan orientalis. Namun kesan perkembangan ilmu pengetahuan dan teknologi, peranan perkamusan semakin berkembang. Usaha perkamusan tidak lagi sekadar mengumpul dan menyusun istilah dan makna, bahkan termasuk tugas memperbaiki dan memantapkan masukan-masukan kata pada edisi sebelumnya, membuat penyelarasan dan pembaikan sistem penyusunan serta pembaikan tatabahasa; terutamanya aspek morfologi. Kesemua penambahbaikan ini lebih cenderung kepada mengungkapkan secara ilmiah setiap istilah dan sifatnya supaya dapat dijadikan sumber rujukan yang lengkap tentang istilah Melayu.

Dari aspek ilmiah, peranan kamus pula sudah tidak lagi bersifat deskriptif semata-mata, tetapi juga bersifat preskriptif. Kamus dilihat perlu memberi panduan terhadap sifat dan penggunaan sesuatu kemasukan. Bukan setakat merekodkan makna istilah, tetapi juga memberi panduan dari aspek penggunaan seperti konteks dan nahu dalam ayat. Selain itu ia memberi panduan kepada kaedah sebutan. Di dalam era perkembangan bahasa akibat letusan teknologi maklumat yang berkembang pesat, peranan kamus dilihat semakin penting. Akibat daripada perkembangan ilmu pengetahuan dan teknologi, banyak istilah-istilah asing yang perlu diterjemah. Namun bagi istilah-istilah asing yang baru dicipta, sesetengahnya tidak sesuai dengan istilah Melayu sedia ada. Maka peranan preskriptif kamus dalam aspek menerangkan dan mendidik perlu juga merangkumi aspek memperkenalkan istilah-istilah baharu.

Penyusunan kamus amnya dibuat berdasarkan penelitian terhadap dokumen-dokumen dan korpus sedia ada (KD, 2005:xvi, xxv,xxxi, xlv; Salinah, 2000:812). Namun sebagai kamus standard, Kamus Dewan boleh berperanan mendokumenkan istilah-istilah baharu yang belum lagi meluas, kerana peranan kamus sebagai sumber rujukan amat berpengaruh dalam menggalakkan penggunaan istilah-istilah tersebut. Kamus menjadi sumber rujuk langsung kepada semua bidang, kerana orang ramai akan merujuk kamus untuk mendapatkan makna sesuatu istilah (Salinah, 2000:809). Peranan preskriptif seperti mana yang diujarkan oleh Asmah (1975) kebanyakannya sudah ada dalam Kamus Dewan; misalnya penerangan kaedah ejaan dan sebutan. Jadi peranan ini boleh diperluaskan dengan memperkenal dan menstandardkan istilah-istilah baharu sama ada dari aspek makna, sebutan, ejaan, konteks (kolokasi) dan sebagainya.

Ini secara tidak langsung menjadikan perkamusan lebih terkehadapan dalam membantu perkembangan bahasa. Maka perkamusan Melayu tidaklah sekadar mengumpul istilah-istilah yang sudah popular dan mantap, dan seterusnya menunggu istilah-istilah baharu untuk mantap sebelum dimasukkan. Sikap pasif ini sedikit-sebanyak menjadi pemangkin kepada homogenisasi bahasa asing terhadap bahasa tempatan, khususnya bahasa Melayu. Ini kerana bahasa yang lebih aktif dan tinggi pengaruhnya akan mendominasi masyarakat dan sekali gus menggalakan peminjaman istilah-istilah asing secara berlebihan. Tetapi seandainya bahasa itu berkembang, keharmonian yang disifatkan sebagai keseimbangan antara heterogenisasi dan homogenisasi (Noriah, 2000) dapat dicapai.

Bahasa Melayu mengamalkan beberapa jenis proses penerbitan kata – pengimbuhan, penggandaan, pemajmukan dan pengakroniman (mewujudkan kependekan kata). Setiap proses ini pula mengandungi beberapa sub-kategori; misalnya penggandaan penuh, penggandaan separa, penggandaan beritma. Ada di antaranya pernah tetapi kini tidak lagi produktif spt. imbuhan sisipan. Manakala sesetengahnya pula kekal produktif, misalnya pemajmukan (Zubaidi Abas, 2000). Menurut Zubaidi, pemajmukan adalah satu kaedah yang telah lama dipraktikkan bagi mewujudkan istilah baharu dalam bahasa Melayu dan bahasa lain. Ini secara tidak langsung menggambarkan bahawa dalam menerbitkan istilah-istilah baharu, pemajmukan harus diutamakan selain proses penerbitan kata yang lain, kerana bukan saja ia praktikal malah berkesan dalam menyampaikan maksud istilah baharu itu.

Jika penciptaan istilah menjadi cabaran kepada perkamusan, maka tumpuan perlu diberikan kepada bidang-bidang yang berkembang pesat. Antaranya bidang sains komputer dan teknologi maklumat. Ini kerana saban hari begitu banyak istilah-istilah baharu yang wujud dalam bahasa asing (terutamanya bahasa Inggeris) akibat daripada perkembangan pesat teknologi maklumat seperti di negara-negara Barat yang menggunakan bahasa Inggeris. Oleh sebab penggunaan bahasa Melayu juga perlu dititikberatkan, maka bahasa Melayu perlu turut sama melahirkan istilah-istilah yang sepadan dengan istilah baharu dalam bahasa asing. Walaupun perkembangan masyarakat Melayu masih agak ketinggalan, peranan mencipta istilah baharu tidak harus dipermudahkan dengan meminjam terus istilah asing. Tetapi seandainya perkamusan lebih memilih untuk terus bersikap pasif (menunggu istilah mantap), maka akan lebih banyak istilah Inggeris yang di’Melayu’kan berbanding istilah asli Melayu yang dijana semula.

Satu aspek yang perlu diberi perhatian dalam usaha menjana istilah ialah kita tidak harus mengabaikan kualiti istilah yang dipilih/dicipta. Ini kerana kecederungan masyarakat cenderung untuk memilih istilah yang lebih ‘sedap’ dan kelihatan ‘bijak’. Adakala istilah Melayu yang dipilih untuk dipadankan dengan istilah asing (inggeris) nampak lucu dan tidak masuk akal bagi sesetengah orang. Ini menyebabkan masyarakat tetap cenderung untuk meminjam istilah asing juga walaupun hakikatnya ada istilah sepadan dalam bahasa Melayu. Namun bagaimana menentukan ia lucu atau tidak? Jadi masalah ini agak abstrak dan sukar diselesaikan. Cara mengatasinya mungkin adalah melalui proses pemajmukan kata yang sudah sebati dengan masyarakat, dan memilih istilah berdasarkan makna yang benar-benar tepat dengan makna istilah asing itu. Namun yang lebih penting ialah memasukkan istilah baharu dalam kamus standard seperti Kamus Dewan akan dapat menggalakkan masyarakat untuk menerimanya.

4. Perkamusan, Sains Komputer dan Bidang Linguistik Terkomputasi

Selain isu pemantapan leksikologi dan perkembangan bahasa, cabaran yang dihadapi oleh bidang perkamusan ialah keperluan terhadap bahan sumber linguistik dalam bentuk elektronik. Pada zaman ini aplikasi komputer boleh dikatakan telah mempengaruhi hampir semua bidang penyelidikan, termasuklah bidang linguistik. Bidang linguistik terkomputasi (computational linguistic) merupakan satu bidang yang mengaplikasikan penggunaan komputer dalam pengkajian bahasa. Bidang ini bukan sekadar menggunakan komputer untuk menyunting dokumen. Tetapi ia mengkaji bagaimana memanfaatkan keupayaan komputer untuk menyelesaikan masalah dalam bidang linguistik, merangkumi sub-bidangnya seperti pragmatik, semantik, sintaksis dan nahu, morfologi dan fonologi.

Amnya aplikasi komputer dalam bidang linguistik lebih tertumpu pada penggunaan korpus dalam mengkaji ciri-ciri dan bentuk bahasa dalam kegunaan masyarakat seharian. Penggunaan komputer untuk mengurus korpus sangat relevan. Apabila mengungkapkan tentang ciri kamus, Asmah Omar menyatakan, ‘The dictionary should be considered as a storehouse for lexical items which from time to time can be taken out to be given various functions in the language usage of speakers in definite situations in the course of human interactions’ (1975: 345). Idea sebagai ‘storehouse’ ini secara tidak langsung merujuk kepentingan komputer sebagai mekanisma bagi meningkatkan kecekapan penyimpanan, pencarian dan pemprosesan maklumat dalam bidang perkamusan. Keperluan yang dinyatakan adalah fungsi asas bagi penyelia ‘storehouse’, dan yang nyata semua ciri ini dipunyai oleh komputer. Apatah lagi, tugas perkamusan sebahagian besarnya bergantung pada carian dalam korpus (KD, 2005:xvi, xxv).

Penggunaan korpus dapat membantu ahli bahasa memahami persoalan berkaitan bahasa berdasarkan konkordans. Konkordans merujuk kepada senarai kata dlm korpus (buku, majalah, dsb) yg disusun mengikut abjad yg menyatakan kedudukan sesuatu kata, dan cara penggunaannya dlm bahagian korpus yg berkenaan (KD, 2005: 815). Manakala persoalan bagi ahli komputer pula ialah bagaimana komputer dapat memproses konkordans dan mentafsirkan entri yang dimuatkan (Salinah, 2000: 811). Salinah (2000) menyentuh tentang peranan komputer kepada bidang perkamusan dari aspek pemprosesan konkordans. Namun kebanyakan isu lebih ditumpukan kepada aspek perisian kamus (kamus elektronik) sebagai bahan pendidikan dan rujukan masyarakat. Hakikatnya perkembangan dan pembangunan perisian kamus nyata menggalakkan jika dilihat pada kemunculan pelbagai perisian kamus untuk komputer peribadi dan atas talian. Antaranya ialah perisian Dewan Eja, E-Kamus dan kamus atas talian Dewan Bahasa dan Pustaka, DBP (http://www.dbp.gov.my). Selain penggunaan komputer peribadi, konsep kamus elektronik seperti Kamus Besta juga turut diketengahkan di kalangan masyarakat.

Namun perlu difahami bahawa penggunaan kamus tidak terhad pada pengguna dan masyarakat saja. Perisian kamus juga sangat berguna kepada perisian komputer. Misalnya perisian Dewan Eja dapat berinteraksi dengan perisian pemproses perkataan MS Word untuk menyemak kesalahan tatabahasa dalam dokumen suntingan. Jadi sumbangannya dapat meningkatkan keberkesanan MS Word sebagai pemproses perkataan.

Hubungan bidang linguistik dan sains komputer tidak lagi sekadar hubungan satu hala (iaitu komputer berguna kepada linguistik). Apabila bidang linguistik terkomputasi semakin berkembang, kepentingan bidang linguistik kepada sains komputer juga meningkat. Ini kerana untuk menyelesaikan masalah berkaitan linguistik, komputer perlu diberi maklumat tentangnya. Jika berkaitan masalah analisis morfologi, komputer perlu maklumat tentang peraturan dan ciri pengimbuhan, serta kaedah-kaedah berkaitan morfonologi bahasa (Chang May See, 1980, Ranaivo Bali, 2001; Mohd Yunus et al, 2007, Femphy Pisceldo et al, 2008). Selain maklumat tentang bahasa, penggunaan korpus dan leksikon menjadi sangat penting terutama dalam bidang penyelidikan (analisis dan janaan berkomputer), kerana seperti mana korpus penting kepada ahli bahasa, korpus dan leksikon juga penting kepada penganalisis berkomputer.

Misalnya dalam pembangunan perisian penganalisis dokumen atau ayat secara berkomputer, penggunaan korpus dapat memberi maklumat kepada perisian terbabit tentang aspek penggunaan istilah; seperti kolokasi bagi mengenalpasti kelas kata (Knowles et al, 2006). Ini membolehkan analisis berkomputer dilakukan dengan lebih baik. Begitu juga dengan leksikon. Penggunaan leksikon begitu meluas dalam linguistik terkomputasi. Leksikon yang digunakan terdapat dalam pelbagai bentuk bergantung pada konteks penggunaannya. Bagi analisis morfologi terkomputasi, leksikon digunakan untuk mengenal pasti ciri dan atribut istilah; seperti kelas kata. Selain itu maklumat morfologi dalam bentuk leksikon morfologi juga digunakan dalam penganalisis morfologi (Ranaivo Bali, 2001). Manakala leksikon bagi fungsi penterjemahan perlu mengandungi pasangan kata yang sepadan bagi bahasa-bahasa yang terlibat dalam penterjemahan. Melalui penggunaan leksikon penterjemahan boleh dilakukan secara automatik (C.K. Quah, 2001).

Perkembangan penyelidikan untuk tujuan analisis linguistik berkomputer sudah bermula di Malaysia sejak tahun 1980 (Chang May See, 1980). Unit Terjemahan Melalui Komputer (UTMK), di Universiti Sains Malaysia (USM) telah melaksanakan beberapa kerjasama dalam menghasilkan perisian berkomputer untuk analisis linguistik terkomputasi. Antaranya dalam projek Getha (Chang May See, 1980) dan kerjasama dengan DBP membangunkan korpus bahasa Melayu. Walau bagaimanapun pembangunan aplikasi kamus berkomputer memerlukan perancangan pembangunan yang teliti. Misalnya Zaharin Yusoff dalam (Salinah, 2000:813) menyatakan bahawa setiap kamus mempunyai struktur yang tertentu, dan penyusunan perlu mengikuti struktur tersebut. Beliau menekankan bahawa dengan adanya keputusan mengenai struktur yang tetap dapat meningkatkan keberkesanan penyusunan kandungan dan pembinaan alat perkamusan berkomputer.

Namun menetapkan suatu struktur yang lengkap pada peringkat awal bukan satu perkara mudah. Ini kerana pada bidang perkamusan itu sendiri sentiasa berkembang dari semasa ke semasa. Malahan pembaikan juga berlaku secara berterusan dalam setiap edisi kamus, kerana struktur yang benar-benar mantap nyata sukar diputuskan. Ini mungkin kerana bidang perkamusan dan leksikologi belum benar-benar mantap kerana kekurangan ahli leksikologi (Salinah, 2000: 811). Masalah yang timbul daripada pembangunan berdasarkan struktur yang masih rapuh dan fleksibel ialah perubahan ke atas aplikasi komputer yang dibangunkan apabila perubahan struktur asas berlaku. Perbelanjaan mengubah sistem komputer pastinya mahal dan memerlukan sumber masa dan tenaga yang banyak.

Seandainya ingin membina struktur yang tetap bagi kamus berkomputer, perlu diputuskan bentuk maklumat yang akan disimpan dan diproses oleh perisian berkomputer itu. Bentuk maklumat yang disimpan akan mempengaruhi bentuk perisian yang akan dibangunkan. Ini kerana sesetengah maklumat lebih sesuai disimpan menggunakan pangkalan data (misalnya korpus yang menyimpan berjuta-juta perkataan), manakala sesetengahnya pula lebih sesuai disimpan dan diproses menggunakan perisian yang lebih ringkas (leksikon morfologi).

Selain itu reka bentuk sistem perisian yang ingin dibangunkan perlu mengambil kira penggunaannya. Jika perlu dicapai dari jarak yang jauh (melalui talian/online atau internet), maka sistem perlu berhubung dan boleh dicapai melalui sistem rangkaian internet. Sepertimana pangkalan data korpus DBP yang dapat dicapai melalui aplikasi web di laman web rasminya. Selain itu ada pula sesetengah institusi mengenakan caj dan bayaran terhadap perkhidmatan kamus atas talian yang ditawarkan. Jadi adakah kamus elektronik bahasa Melayu yang disediakan juga perlu dikenakan bayaran? Jika ya, maka sistem kawalan capaian yang lebih tinggi perlu disediakan bagi memastikan hanya pengguna yang berhak saja boleh mencapainya. Semua keperluan ini perlu dipertimbangkan dalam proses pembangunan kamus berkomputer pada peringkat awal, supaya tidak membebankan pengguna kerana pengubahsuaian dan juga tidak menyukarkan penyedia perkhidmatan seperti DBP yang terpaksa menanggung kos pengubahsuaian yang tinggi.

Secara keseluruhannya, cabaran dan isu berkaitan bidang perkamusan (leksikon dan korpus) juga wujud dalam memenuhi keperluan bidang sains komputer berkaitan linguistik (linguistik terkomputasi). Namun apa yang penting kita dapat mengetahui dan memahami bahawa keperluan bidang perkamusan dan perkembangan bidang linguistik Melayu amnya tidak hanya berkait soal bahasa, tetapi juga mempengaruhi perkembangan bidang lain yang berkaitan. Seandainya bidang perkamusan Melayu mantap, maka mudahlah untuk memantapkan bidang lain yang bergantung kepadanya.

5. Kesimpulan

Sebagai kesimpulan, perkamusan bahasa dan istilah Melayu bukanlah satu bidang yang baharu. Walaupun pada awalnya ia dipelopori oleh bangsa bukan Melayu, perkembangan bidang perkamusan Melayu menunjukkan bahasa Melayu pernah menjadi antara bahasa yang penting kepada masyarakat dunia. Hasil daripada perkembangannya, bidang perkamusan istilah Melayu sudah mencapai tahap yang boleh dibanggakan melalui kewujudan Kamus Dewan pada tahun 1970 sebagai kamus standard bahasa Melayu. Namun perkembangan ini juga mengungkap pelbagai permasalahan, isu dan cabaran yang perlu ditangani dalam bidang perkamusan, terutama bidang leksikologi.

Selain penting kepada perkembangan bidang bahasa Melayu dalam masyarakat, perkembangan bidang perkamusan Melayu juga sangat penting kepada perkembangan bidang sains komputer khususnya bidang linguistik terkomputasi. Bidang ini banyak bergantung pada sumber-sumber dalam bidang perkamusan dan leksikografi seperti korpus dan leksikon. Dengan adanya perkembangan bidang perkamusan yang menyediakan bahan-bahan sumber untuk penyelidikan, dapat membantu usaha penyelidikan bidang linguistik terkomputasi. Pada masa yang sama, hasil penyelidikan ini akan membantu pula meningkatkan kecekapan dalam bidang perkamusan melalui perkembangan teknologi perisian berkaitan linguistik.

Makalah ini cuba menyorot kembali perkembangan perkamusan dan bidang leksikografi di alam Melayu. Sorotan ini disusuli pula dengan meneliti perubahan usaha dan kepentingan bidang perkamusan terhadap perkembangan bahasa Melayu. Selain itu isu-isu dan cabaran semasa dalam bidang perkamusan turut dibincangkan. Daripada situ, makalah ini cuba memberi gambaran tentang kepentingan dan potensi bidang perkamusan terhadap perkembangan bidang selain bahasa iaitu bidang sains komputer dan teknologi maklumat. Kepentingan ini meliputi perkembangannya pada masa sekarang dan keperluannya pada masa akan datang.

Diharapkan dengan memahami isu-isu yang terbabit, dan meneliti cadangan serta penyelesaian yang dikemukakan akan dapat memperluaskan pengetahuan kita terhadap peranan, kepentingan dan potensi yang ada dalam bidang perkamusan, bukan sahaja terhadap perkembangan bahasa Melayu, tetapi juga dalam bidang lain, seperti sains komputer.

Penghargaan

Setinggi penghargaan ditujukan kepada Dr Zaitul Azma Zainon Hamzah (FBMK, UPM) di atas perbincangan tentang bahasa dan linguistik. Juga kepada En. Azmi Abd Kadir (JPM, Putrajaya) di atas sumbangan sebahagian bahan-bahan rujukan bahasa untuk makalah ini.

Rujukan

1. Asmah Omar. Essays on Malaysian Linguistics. Dewan Bahasa dan Pustaka. KL, Malaysia. 1975.

2. Bali, R. M.: Computational Analysis of Affixed Words in Malay Language. Available from URL : http://utmk.cs.usm.my/pdf/ANALYSIS%20OF%20AFFI XED%20WORDS%20IN %20MALAY.pdf

3. Chang May See: The Morphological Analysis of Bahasa Malaysia. COLING 1980. pp578-585.

4. Femphy Pisceldo, Rahmad Mahendra, Ruli Manurung and I Wayan Arka. A Two-Level Morphological Analyser for the Indonesian Language. In Proceedings of the 2008 Australasian Language Technology Association Workshop (ALTA 2008), pp.142-150, Hobart, Australia, 8-10 Dec 2008. 2008.

5. Kamus Dewan, Edisi Keempat. DBP, KL. 2005

6. Knowles, G. O., Mohd Dom, Z.: Word Class in Malay – A Corpus-based Approach. Dewan Bahasa dan Pustaka (DBP). KL, Malaysia. 2006

7. Nor Azizah Abu Bakar. Metabahasa dan pengungkapan definisi dalam kamus Melayu dlm Jurnal Dewan Bahasa. (Zulkifli Salleh ketua ed.). Ogos, 2000. Jilid 44 bil 8. DBP, KL. 2000. pp863-875.

8. Noriah Mohamed. Kesan globalisasi terhadap bahasa dlm Jurnal Dewan Bahasa. (Zulkifli Salleh ketua ed.). September, 2000. Jilid 44 bil 9. DBP, KL. 2000. pp922-936.

9. Quah, C. K., Bond, F., & Yamazaki, T. (2001). Design and construction of a machine-tractable Malay-English Lexicon. In Asialex 2001 Proceedings (pp. 200–205). Seoul.

10. Salinah Ja’afar. Perkamusan Melayu dalam era teknologi maklumat dlm Jurnal Dewan Bahasa. (Zulkifli Salleh ketua ed). Julai, 2000. Jilid 44 bil 7. DBP, KL. 2000. pp809-815.

11. Mohd Yunus Sharum, Muhamad Taufik Abdullah. (2007). LØ : Analysis and Expanded Notation for Malay Word Derivation. In the proceedings of The 3rd Malaysian Software Engineering Conference (MySEC’07), 3-4th Dec 2007. Seri Kembangan, Selangor, Malaysia. pp236-239

12. Zubaidi Abas. Pemajmukan: Kaedah Pembentukan istilah yang produktif dlm Jurnal Dewan Bahasa. (Zulkifli Salleh ketua ed.). September, 2000. Jilid 44 bil 9. DBP, KL. 2000. pp937-950.

1 Komen

  1. […] 5. En. Mohd. Yunus Sharum, FSKTM UPM – Masalah dan Cabaran Terhadap Perkamusan Istilah dalam Bidang Teknologi Maklumat […]

 

----

Nota: Kami ucapkan terima kasih atas semua komen yang diberikan. Dipohon gunakan ejaan yang betul. Elakkan memberi komen yang menyentuh sensitiviti, mengelirukan, atau yang tidak jelas maksudnya.

 

Leave a Reply

Your email address will not be published. Required fields are marked *