Beberapa Pemikiran tentang Peningkatan Terjemahan PDF Gratis, Mengapa Kami Meninggalkan Gemini dengan Setengah Harga
Hari ini, saya ingin melakukan komunikasi yang jujur dengan semua orang, pertama-tama, saya ingin menyampaikan permohonan maaf yang tulus kepada setiap teman yang terkena dampak pengalaman buruk dari produk versi gratis kami baru-baru ini.
Dalam beberapa waktu terakhir, kami menerima banyak umpan balik negatif tentang pengalaman versi gratis. Kami mendengar semua suara ini dan merasakannya. Banyak pengguna menyebutkan bahwa "waktu antrean sangat lama" pada saat puncak; dokumen yang diterjemahkan "kualitas terjemahannya sangat tidak stabil", kadang baik kadang buruk; ada juga yang mengeluh bahwa terjemahan "campur aduk antara bahasa Inggris dan Mandarin, sulit dibaca", penuh dengan "kesan terjemahan mesin" yang tak bisa dihilangkan.
Setiap kali melihat umpan balik ini, tim kami merasa sangat bersalah. Kami sepenuhnya memahami bahwa ketika Anda sangat membutuhkan dokumen akademis penting atau laporan kerja, tetapi harus menghadapi penantian yang panjang dan terjemahan yang tidak jelas dan logis, perasaan kecewa dan frustrasi itu. Ini jelas bukan pengalaman yang kami harapkan dari Doclingo, dan sepenuhnya bertentangan dengan tujuan kami mendirikan produk ini.
Doclingo sejak awal mengadopsi model freemium, karena kami percaya bahwa terjemahan dokumen berkualitas tinggi tidak seharusnya menjadi hak istimewa bagi segelintir orang. Kami ingin melalui versi gratis yang cukup baik, memungkinkan lebih banyak orang untuk mengatasi hambatan bahasa dan mengakses pengetahuan dan informasi terkini. Namun, pengalaman gratis yang buruk tidak hanya tidak dapat mempertahankan pengguna, tetapi juga merupakan pengkhianatan terhadap kepercayaan semua orang. Kesadaran inilah yang membuat kami bertekad: kami harus menyelesaikan masalah ini secara menyeluruh, dengan segala cara.
Setelah diskusi internal yang berulang dan evaluasi teknis, kami sampai pada kesimpulan: mesin terjemahan AI yang digunakan oleh versi gratis saat ini sudah tidak dapat memenuhi janji kami terhadap kualitas dan efisiensi. Untuk secara fundamental menyelesaikan masalah antrean dan kualitas terjemahan, satu-satunya cara adalah mengganti dengan mesin AI yang lebih kuat—sebuah mesin yang benar-benar layak untuk pengguna kami.
Keputusan ini membawa kami ke persimpangan yang sulit. Mesin AI terkemuka di pasar saat ini sebagian besar berasal dari seri GPT dari OpenAI dan seri Gemini dari Google. Keduanya mewakili tingkat tertinggi dari kecerdasan buatan saat ini, tetapi gaya, biaya, dan kinerja dalam tugas terjemahan tertentu memiliki kelebihan dan kekurangan masing-masing.
Oleh karena itu, artikel ini ingin berbagi dengan Anda proses pemikiran lengkap di balik keputusan peningkatan besar ini: bagaimana kami membuat keputusan sulit antara dua mesin AI terkemuka ini? Mengapa kami akhirnya meninggalkan Gemini yang biayanya hanya setengah, dan memilih opsi yang lebih mahal?
Kami berharap melalui komunikasi yang transparan ini, tidak hanya untuk meminta maaf atas pengalaman buruk di masa lalu, tetapi juga untuk menunjukkan kepada Anda tekad dan komitmen kami untuk meningkatkan pengalaman produk.
Pengalaman atau Nilai?
Saya setiap hari berpikir tentang bagaimana menciptakan lebih banyak nilai bagi pengguna. Namun, dalam dunia bisnis, di balik penciptaan nilai, selalu ada tagihan biaya yang tidak terlihat. Ketika Doclingo memutuskan untuk meningkatkan mesin terjemahan inti, tim kami berada di persimpangan yang sulit: di satu sisi ada godaan besar untuk mengurangi biaya hampir setengah, di sisi lain adalah pengalaman pengguna yang selalu kami pegang teguh.
Setiap orang yang bertanggung jawab atas keuntungan dan kerugian produk tahu bahwa pengendalian biaya adalah pedang Damocles yang menggantung di atas kepala. Ketika kami mengevaluasi mesin model besar yang baru, sebuah opsi yang sangat menarik muncul di depan kami—seri Gemini dari Google.
Secara jujur, strategi penetapan harga Gemini sangat menggoda bagi kami. Menurut penelitian kami, biaya memilih Gemini lebih rendah dibandingkan GPT, jika kita menghitung secara sederhana, jika beralih ke Gemini, biaya pemanggilan mesin inti kami hampir bisa dikurangi setengah. Bagi Doclingo yang setiap hari menangani permintaan terjemahan dalam jumlah besar, penghematan ini cukup signifikan. Uang ini bisa diinvestasikan dalam pemasaran, pengembangan tim, atau langsung tercermin dalam strategi penetapan harga yang lebih fleksibel. Menghadapi keuntungan biaya yang begitu besar, mengatakan bahwa kami tidak tertarik, itu pasti bohong.
Namun, setelah diskusi internal yang intens, kami akhirnya membuat keputusan yang tampaknya "tidak ekonomis": mempertahankan pengalaman, memilih GPT.
Karena, kami memiliki alasan yang cukup kuat.
Tiga Alasan Memilih GPT
1. Ketepatan dalam Istilah Akademis
Untuk setiap alat terjemahan yang ditujukan untuk bidang penelitian dan akademis, ketepatan dalam istilah profesional adalah dasar keberadaannya. Ini tidak hanya berkaitan dengan "kepercayaan, pemahaman, dan keindahan" terjemahan, tetapi juga secara langsung menentukan apakah nilai inti dari literatur dapat disampaikan dengan akurat.
Dalam evaluasi mendalam kali ini, sebuah contoh yang mencolok membuat tim kami terkesan. Ketika kami menerjemahkan sebuah literatur di bidang fisika kondensasi, kami menemui istilah frekuensi tinggi: "pair distribution function".
- Terjemahan GPT adalah: "fungsi distribusi pasangan"
- Terjemahan Gemini adalah: "fungsi distribusi pasangan"
Secara harfiah, "fungsi distribusi pasangan" tampaknya lebih dekat dengan arti asli "pair", ini adalah terjemahan yang sangat intuitif dan masuk akal. Namun, bagi para akademisi dan mahasiswa di bidang tersebut, "fungsi distribusi pasangan" adalah istilah yang sudah disepakati dan dikenal. Perbedaan kecil ini, seperti garis pemisah, dengan jelas membedakan "orang luar" dan "orang dalam". Meskipun terjemahan Gemini tidak salah secara harfiah, tetapi mengungkapkan kesan "terjemahan mesin" yang kaku, sementara GPT menunjukkan pemahaman mendalam tentang pengetahuan di bidang akademis tertentu.
Perbedaan ini bukanlah satu-satunya contoh. Penelitian menunjukkan bahwa dalam bidang yang sangat profesional seperti kedokteran dan sains, model setingkat GPT-4 sering kali lebih akurat dan ketat dalam menangani konsep dan istilah yang kompleks dibandingkan dengan produk pesaing. Misalnya, dalam evaluasi perbandingan, GPT-4 menunjukkan tingkat kebenaran yang lebih tinggi dan lebih sedikit kesalahan serius saat menjawab pertanyaan klinis yang sulit. Meskipun terkadang jawaban Gemini lebih mudah dipahami, tetapi sering kali itu mengorbankan ketepatan teknis. Kecenderungan "mengorbankan akurasi demi keterbacaan" ini sangat berbahaya dalam terjemahan akademis.
Kami sangat menyadari bahwa pengguna inti Doclingo—sejumlah besar peneliti dan mahasiswa—setiap hari berurusan dengan istilah-istilah yang sangat khusus ini. Bagi Anda, "kesalahan kecil" dalam istilah dapat menyebabkan "kesalahan besar" dalam pemahaman. Istilah yang tidak akurat tidak hanya akan mengganggu alur baca yang mendalam, memaksa Anda untuk berhenti dan memverifikasi, tetapi yang lebih serius, dapat membengkokkan argumen inti penulis asli, bahkan menyesatkan arah penelitian Anda. Ketepatan istilah adalah dasar untuk menjamin ketelitian akademis dan juga merupakan garis hidup untuk meningkatkan efisiensi membaca literatur.
Model GPT mampu melakukan ini bukanlah kebetulan. Kemampuan kognitif dan penalaran yang kuat telah terbukti dalam pengujian standar industri seperti MMLU (Pemahaman Bahasa Multitugas Skala Besar). Misalnya, bahkan sebagai versi ringan, GPT mencapai skor MMLU yang mengesankan sebesar 82.0%, yang cukup untuk membuktikan akumulasi pemahaman dan penalaran di berbagai bidang akademis. Justru karena "fondasi pengetahuan" yang kuat inilah, ia mampu melampaui makna harfiah saat menerjemahkan, menangkap ekspresi yang tepat dalam konteks disiplin tertentu.
Oleh karena itu, ketika kami melihat terjemahan "fungsi distribusi pasangan" yang tepat ini, kami tahu bahwa di baliknya terdapat pemahaman mendalam model terhadap pengetahuan profesional. Untuk menjaga "ketepatan" dan "ketelitian" dalam komunikasi akademis ini, kami percaya bahwa memilih GPT adalah satu-satunya jawaban yang benar.
2. Konteks Bahasa Mandarin
Kami sangat menyadari bahwa alat yang baik tidak hanya harus kuat secara fungsional, tetapi juga harus "memahami" pengguna. Dalam konteks terjemahan literatur akademis, "memahami" berarti memahami kebiasaan membaca dan konteks budaya pembaca berbahasa Mandarin. Sebuah detail yang tampaknya sepele sering kali dapat menentukan kualitas pengalaman pengguna, bahkan mempengaruhi profesionalisme seluruh produk. Dan dalam perbandingan kali ini, perbedaan antara GPT dan Gemini dalam menangani nama penulis berbahasa Mandarin adalah contoh yang sangat baik dari "kebenaran dalam detail".
Ketika kami menerjemahkan sebuah literatur yang mencakup penulis "Xiaohao Yang" ke dalam dua model, sebuah detail yang mengejutkan muncul: GPT hampir "berpikir sama" dengan mengembalikan nama pinyin ini menjadi "杨晓浩", sementara Gemini hanya mengikuti prosedur dengan mempertahankan pinyin aslinya. Perbedaan ini kecil, tetapi sangat berarti. Bagi setiap pembaca berbahasa Mandarin, terutama saat membaca terjemahan yang ditujukan untuk memenuhi kebiasaan tata letak jurnal berbahasa Mandarin, melihat nama dalam karakter Mandarin yang dikenal alih-alih serangkaian pinyin yang panjang, memberikan kelancaran dan keakraban yang sangat berbeda. Ini bukan hanya terjemahan, ini adalah perhatian budaya, sebuah penghormatan terhadap "manusia".
Mengapa GPT mampu melakukan ini? Di baliknya adalah kemampuan pemahaman konteks dan pengenalan entitas bernama (NER) yang kuat. Penelitian menunjukkan bahwa GPT-4 telah mencapai tingkat kualitas terjemahan yang setara dengan penerjemah manusia pemula, dan memiliki kemampuan penilaian kualitas terjemahan yang tajam, yang berarti ia tidak hanya melakukan penggantian kata secara mekanis, tetapi memahami makna mendalam di balik teks. Dalam menangani nama-nama seperti ini, GPT dapat lebih akurat menggunakan petunjuk konteks untuk membuat penilaian. Misalnya, dalam sebuah penelitian tentang pengenalan nama dalam berita budaya Rusia, GPT mencapai skor F1 yang tinggi sebesar 0.93 dengan petunjuk yang tepat, menunjukkan kinerjanya yang luar biasa dalam bahasa dan jenis entitas tertentu. Kemampuan ini memungkinkan ia untuk menyimpulkan bahwa "Xiaohao Yang" kemungkinan adalah seorang penulis berbahasa Mandarin, dan mencoba mencari kombinasi karakter Mandarin yang paling cocok dalam pengetahuan bahasanya, akhirnya berhasil "menebak" menjadi "杨晓浩". Ini adalah kecerdasan berbasis probabilitas dan konteks, bukan sekadar pencocokan aturan.
Sebaliknya, kinerja Gemini di sini mengonfirmasi beberapa masalah yang ditemukan dalam penelitian terkait. Meskipun Gemini menunjukkan kinerja yang baik dalam beberapa tugas NER (seperti mengenali nama yang sensitif terhadap konteks), ia sering kali menunjukkan inkonsistensi, kesalahan terjemahan, atau kelalaian saat menangani nama-nama. Beberapa penelitian menunjukkan bahwa Gemini kurang akurat dalam menangani nama, tempat, dan istilah khusus lainnya, sering kali mengalami kelalaian atau kesalahan terjemahan. Misalnya, saat menerjemahkan literatur klasik, ia dapat menerjemahkan istilah khusus seperti "佛國白禪師" menjadi kalimat deskriptif. Oleh karena itu, ketidakmampuan Gemini untuk mengembalikan "Xiaohao Yang" menjadi karakter Mandarin kemungkinan mencerminkan ketidakstabilan dalam penanganan nama khusus dan kedalaman penilaian konteks.
Perbedaan kecil dalam terjemahan nama ini sangat berarti bagi kami. Ini bukan hanya bukti keunggulan teknis, tetapi juga mencerminkan "suhu" produk. Sebuah model yang "memahami" konteks bahasa Mandarin dapat memprediksi kebutuhan potensial pengguna—di dunia berbahasa Mandarin, kami terbiasa memanggil nama langsung. Mengembalikan nama pinyin penulis berbahasa Mandarin menjadi karakter adalah pengakuan terhadap identitas penulis dan juga penyesuaian terhadap kebiasaan membaca pembaca berbahasa Mandarin. Detail "cerdas" dan "perhatian" ini dapat secara signifikan meningkatkan rasa imersi dan kepercayaan pengguna dalam konteks membaca yang mendalam.
3. Pemahaman Konteks
Dalam umpan balik pengguna kami, ada satu pengamatan yang sangat tajam, yang dengan tepat menunjukkan perbedaan inti dalam gaya antara dua model utama saat ini: "Ciri Gemini adalah informasi yang sangat lengkap, seolah-olah ingin menerjemahkan setiap catatan kaki, yang kadang-kadang membuat tulisan terlalu bertele-tele. Sementara ekspresi GPT lebih ringkas."
Pernyataan ini sangat tepat. Dalam konteks terjemahan akademis dan literatur yang mengejar efisiensi dan kedalaman, "ringkas" bukan hanya sekadar keindahan kata, tetapi langsung berkaitan dengan "rasa proporsional"—sebuah kebijaksanaan untuk tahu kapan harus mendetail dan kapan harus menahan diri, sehingga memaksimalkan efisiensi penyampaian informasi. Ketika Anda menghadapi lautan literatur, waktu adalah hal yang paling berharga. Sebuah asisten terjemahan yang memahami "rasa proporsional" dapat membantu Anda dengan cepat menghilangkan informasi yang tidak perlu, langsung menuju inti argumen, bukan membanjiri Anda dengan detail yang terlalu banyak. Ini tidak hanya berkaitan dengan akurasi, tetapi juga dengan efisiensi membaca dan beban kognitif.
Lalu, dari mana "rasa proporsional" ini berasal? Itu berasal dari pemahaman mendalam dan menyeluruh model terhadap konteks. Menariknya, meskipun Gemini terkenal dengan jendela konteks yang sangat besar hingga jutaan token, secara teori dapat "melihat" lebih jauh, tetapi dalam terjemahan teks panjang, menjaga konsistensi gaya dan nada emosional menjadi tantangan. Beberapa penelitian menunjukkan bahwa Gemini mungkin melemahkan warna emosional teks asli selama proses terjemahan, dengan konsistensi gaya yang menunjukkan variabilitas yang besar. Terkadang, ia bahkan dapat membingungkan alur cerita dalam narasi yang panjang, menyebabkan "pergeseran gaya".
Sebaliknya, meskipun GPT juga memiliki jendela konteks yang mencapai 128K token, ia menunjukkan kinerja yang lebih baik dalam menjaga konsistensi nada emosional dan gaya. Beberapa penelitian menunjukkan bahwa output GPT lebih mendekati terjemahan ahli manusia dalam hal emosi, dan lebih resonan. Ia dapat lebih baik mempertahankan suara naratif yang konsisten, dalam hal makna, struktur kalimat, dan koherensi konteks, menjadi "model yang paling konsisten dan dapat diandalkan". Kemampuan output yang stabil dan setia pada nuansa teks asli ini adalah contoh sempurna dari "rasa proporsional". Ia memahami bahwa terjemahan yang baik bukanlah tumpukan informasi, tetapi penyajian yang selektif dan terfokus.
Dari sisi lain, perbedaan ini juga dapat dibuktikan. Kami memperhatikan bahwa beberapa pengguna melaporkan bahwa filter keamanan Gemini terkadang terlalu "sensitif", menghentikan terjemahan karena beberapa kata dalam teks akademis atau sejarah yang sepenuhnya normal. Ini juga mencerminkan sedikit kekurangan model dalam memahami konteks nyata dan menangkap "rasa proporsional"—ia melihat "pohon" (kata sensitif), tetapi tidak dapat memahami "hutan" secara keseluruhan (konteks akademis).
Secara keseluruhan, pemahaman konteks yang sebenarnya tidak hanya bergantung pada seberapa panjang teks yang dapat diproses, tetapi seberapa dalam ia dapat memahami niat, nada, dan gaya teks, dan merepresentasikannya dengan cara yang tepat. Bagi kami yang berlayar di lautan pengetahuan, seorang mitra AI yang memiliki "rasa proporsional" jauh lebih berharga daripada sekadar "database" yang hanya menuangkan informasi.
Harapan dan Komitmen: Awal Baru, Pengalaman yang Lebih Baik
Setelah menjelaskan dengan rinci pilihan sulit namun tegas yang kami buat, sekarang, dengan perasaan yang sangat bersemangat, saya secara resmi mengumumkan kepada Anda: layanan terjemahan gratis yang terintegrasi dengan mesin GPT baru kini berada di tahap pengujian internal terakhir dan akan diluncurkan secara penuh untuk semua pengguna dalam minggu ini!
Ini berarti bahwa masalah antrean yang terlalu lama, kualitas terjemahan yang tidak stabil pada saat puncak, dan keluhan lainnya yang Anda sampaikan kepada kami selama ini akan mendapatkan banyak perbaikan. Kami sangat menyadari bahwa setiap menit menunggu menguras kesabaran Anda, dan setiap hasil terjemahan yang tidak memuaskan mengkhianati kepercayaan Anda. Peningkatan kali ini adalah untuk mengakhiri semua itu.
Membuat keputusan ini tidaklah mudah. Memilih opsi yang lebih mahal berarti tekanan besar bagi tim yang masih dalam tahap pertumbuhan. Namun, kami terus bertanya pada diri sendiri: Apa makna keberadaan Doclingo? Jawabannya selalu sama: menciptakan nilai bagi pengguna. Kami percaya bahwa pengalaman pengguna yang luar biasa dan dapat diandalkan adalah inti dan jiwa produk, dan tidak seharusnya dikompromikan oleh biaya. Oleh karena itu, peningkatan kali ini bukan hanya sekadar iterasi teknis, tetapi juga merupakan pemenuhan komitmen kami terhadap "pengguna pertama". Kami bersedia berinvestasi lebih banyak, hanya untuk mendapatkan fokus dan kelancaran Anda saat membaca literatur.
Tentu saja, awal baru ini memerlukan kita untuk membukanya bersama. Mesin yang lebih kuat hanyalah titik awal, dan pengalaman nyata Anda adalah satu-satunya standar untuk mengukur nilai kerja kami. Oleh karena itu, kami dengan tulus mengundang setiap pengguna, setelah mesin baru diluncurkan, untuk merasakan, menggunakan, dan menilai.
- Apakah paragraf panjang yang kompleks kini lebih alami dan lancar, setia pada "rasa proporsional" teks asli?
- Apakah masalah nama orang dan lembaga yang mengganggu telah hilang?
- Apakah terjemahan makalah Anda kini lebih akurat dan profesional?
Silakan sampaikan pengalaman nyata Anda melalui saluran umpan balik dalam produk. Setiap like dari Anda adalah dorongan terbesar bagi kami; setiap kritik Anda adalah kekuatan paling berharga untuk perbaikan dan iterasi kami. Kami berjanji akan membaca dan menganalisis setiap umpan balik dengan serius, dan mengintegrasikannya ke dalam peta jalan produk kami di masa depan, membentuk siklus umpan balik yang transparan dan efisien.
Ini bukan hanya akhir dari sebuah peningkatan, tetapi juga awal dari kami bersama Anda dalam mengasah alat terjemahan terkemuka. Kami penuh percaya diri terhadap masa depan dan berharap dapat bersama Anda, menyaksikan setiap kemajuan Doclingo.