Українська мова
Корпоративна версія

Деякі роздуми про безкоштовне оновлення перекладу PDF, поговоримо про те, чому ми відмовилися від половинної ціни Gemini

Сьогодні я хочу провести відверту розмову з вами, перш за все, вибачитися перед кожним, хто постраждав від нещодавнього поганого досвіду нашого безкоштовного продукту.

Протягом останнього часу ми отримали велику кількість негативних відгуків про безкоштовний досвід. Ми почули ці голоси і відчули їх. Багато користувачів зазначили, що "час очікування в години пік просто неймовірний"; перекладені документи мають "дуже нестабільну якість перекладу", іноді добре, іноді погано; деякі скаржилися, що переклад "містить англійську та китайську мови, читати важко", наповнене незабутнім "машинним перекладом".

Кожного разу, коли ми бачимо ці відгуки, наша команда відчуває велику провину. Ми повністю розуміємо, що коли вам терміново потрібен важливий науковий документ або робочий звіт, але ви змушені стикатися з тривалим очікуванням і неясним, логічно заплутаним перекладом, це викликає розчарування. Це зовсім не те, що ми хочемо, щоб Doclingo приносив вам, і це абсолютно суперечить нашій меті створення цього продукту.

Doclingo з самого початку використовував модель безкоштовного доповнення, оскільки ми віримо, що якісний переклад документів не повинен бути привілеєм небагатьох. Ми хочемо, щоб через достатньо зручну безкоштовну версію більше людей могли подолати мовні бар'єри та отримати доступ до передових знань і інформації. Однак поганий безкоштовний досвід не тільки не може утримати користувачів, але й є зрадою довіри. Саме це усвідомлення змусило нас вирішити: ми повинні повністю вирішити ці проблеми, не зважаючи на витрати.

Після численних внутрішніх обговорень і технічних оцінок ми дійшли висновку, що поточний AI-двигун перекладу, що використовується в безкоштовній версії, вже не може відповідати нашим зобов'язанням щодо якості та ефективності. Єдиний спосіб вирішити проблеми з чергами та якістю перекладу — це замінити його на більш потужний AI-двигун — двигун, який дійсно заслуговує на наших користувачів.

Це рішення поставило нас на важкий роздоріжжя. Найкращі AI-двигуни на ринку — це, в основному, серії GPT від OpenAI та серії Gemini від Google. Вони обидва представляють найвищий рівень сучасного штучного інтелекту, але стиль, вартість і результати в конкретних завданнях перекладу мають свої особливості.

Отже, ця стаття має на меті поділитися з вами повним процесом роздумів, що стоїть за нашим рішенням про це значне оновлення: як ми зробили важкий вибір між цими двома провідними AI-двигунами? Чому ми врешті-решт відмовилися від Gemini, вартість якого становить лише половину, і вибрали дорожчий варіант?

Ми сподіваємося, що через цю прозору комунікацію ми не лише вибачимося за поганий досвід у минулому, але й продемонструємо нашу рішучість і зобов'язання щодо покращення продукту.

Досвід чи вартість?

Я щодня думаю про те, як створити більше цінності для користувачів. Але в бізнес-світі за створенням цінності завжди стоїть невидимий рахунок витрат. Коли Doclingo вирішив оновити основний двигун перекладу, наша команда опинилася на такому важкому роздоріжжі: з одного боку, величезна спокуса знизити витрати майже вдвічі, з іншого — досвід користувачів, якого ми завжди дотримувалися.

Кожен, хто відповідає за прибуток і збитки продукту, розуміє, що контроль витрат — це меч, що висить над головою. Коли ми оцінювали нові великі моделі двигунів, перед нами постала дуже приваблива опція — серія Gemini від Google.

Чесно кажучи, цінова стратегія Gemini була для нас дуже привабливою. Згідно з нашим дослідженням, витрати на вибір Gemini нижчі, ніж на GPT, простий підрахунок показує, що якщо перейти на Gemini, наші витрати на виклик основного двигуна можуть знизитися майже вдвічі. Для Doclingo, який щодня обробляє величезну кількість запитів на переклад, ця економія є досить значною. Ці гроші можна вкласти в маркетинг, розвиток команди або безпосередньо відобразити в більш гнучкій ціновій стратегії. Перед такою величезною перевагою у витратах, стверджувати, що ми не були вражені, було б абсолютно неправдою.

Однак після запеклих внутрішніх обговорень ми врешті-решт ухвалили рішення, яке здавалося "економічно невигідним": дотримуватися досвіду, вибрати GPT.

Тому що у нас є достатні підстави.

Три причини вибору GPT

1. Точне розуміння академічної термінології

Для будь-якого перекладного інструменту, орієнтованого на науку та академічну сферу, точне розуміння спеціалізованих термінів є його основою. Це не лише стосується "достовірності, зрозумілості та елегантності" перекладу, але й безпосередньо визначає, чи може бути точно передана основна цінність документа.

У цьому глибокому оцінюванні один яскравий приклад справив на нашу команду велике враження. Коли ми перекладали документ з області конденсованої матерії, ми зіткнулися з терміном, що часто вживається: "pair distribution function".

  • Переклад GPT: "функція парного розподілу"
  • Переклад Gemini: "функція розподілу пар"

На перший погляд, "функція розподілу пар" здається ближчою до первісного значення "pair", це дуже інтуїтивний і розумний переклад. Однак для вчених і студентів у цій галузі "функція парного розподілу" є тим, що є загальноприйнятим терміном. Ця маленька різниця, як межа, чітко розділяє "зовнішніх" і "внутрішніх". Хоча переклад Gemini не є помилковим, він все ж таки видає певну жорсткість "машинного перекладу", тоді як GPT демонструє глибоке розуміння специфічних знань у цій академічній сфері.

Ця різниця не є поодинокою. Дослідження показують, що в медичних, наукових та інших високоспеціалізованих областях моделі рівня GPT-4 часто перевершують конкурентів у точності при обробці складних концепцій і термінів. Наприклад, у порівняльних оцінках GPT-4 продемонстрував вищу правильність і менше серйозних помилок при відповіді на складні клінічні питання. Хоча відповіді Gemini іноді легше зрозуміти, це часто відбувається за рахунок технічної точності. Така тенденція "жертвувати точністю заради легкості читання" є вкрай небезпечною в академічному перекладі.

Ми добре знаємо, що основні користувачі Doclingo — це численні науковці та студенти, які щодня мають справу з цими високоспеціалізованими термінами. Для вас "незначна" помилка в термінах може призвести до "величезної" помилки в розумінні. Неправильний термін не лише перериває потік читання, змушуючи вас зупинитися, щоб перевірити чи здогадатися, але й може спотворити основну точку зору автора оригіналу, навіть ввести вас в оману щодо напрямку вашого дослідження. Точні терміни є основою академічної строгості та життєво важливими для підвищення ефективності читання документів.

Модель GPT здатна досягти цього не випадково. Її потужні когнітивні та логічні здібності були підтверджені визнаними тестами, такими як MMLU (масштабне багатозадачне розуміння мови). Наприклад, навіть як легка версія GPT, її оцінка MMLU досягла вражаючих 82.0%, що свідчить про її глибокі знання в розумінні та логіці в багатьох академічних сферах. Саме ця потужна "освітня база" дозволяє їй під час перекладу перевершувати буквальне значення, точно вловлюючи правильні вирази в контексті конкретної дисципліни.

Отже, коли ми бачимо "функцію парного розподілу" як точний переклад, ми знаємо, що за цим стоїть глибоке розуміння професійних знань. Щоб зберегти цю "точність" і "строгість" в академічному спілкуванні, ми вважаємо, що вибір GPT є єдино правильним рішенням.

2. Китайський контекст

Ми добре знаємо, що хороший інструмент не лише має бути потужним, але й "розуміти" користувача. У контексті перекладу академічних документів "розуміти" означає глибоко усвідомлювати звички читання та культурний контекст китайських читачів. Здається, незначна деталь може визначити якість користувацького досвіду, навіть вплинути на професіоналізм усього продукту. І в цьому порівнянні різниця між GPT і Gemini у обробці імен авторів є відмінним прикладом "досвіду в деталях".

Коли ми перекладали документ, що містить автора "Xiaohao Yang", для обох моделей, з'явилася приємна деталь: GPT майже "зрозумів" і відновив це ім'я як "杨晓浩", тоді як Gemini просто зберіг оригінальне піньїнь. Ця різниця, хоч і невелика, але суттєва. Для будь-якого китайського читача, особливо при читанні перекладу, що відповідає стандартам китайських журналів, бачити знайоме китайське ім'я замість довгого рядка піньїнь — це зовсім інший рівень плавності та близькості. Це не просто переклад, це культурна чутливість, повага до "людини".

Чому GPT може це зробити? За цим стоять його потужні здібності до розуміння контексту та розпізнавання іменованих сутностей (NER). Дослідження показують, що GPT-4 досяг рівня початкового людського перекладача в загальній якості перекладу і має чутливість до оцінки якості перекладу, що означає, що він не просто виконує механічну заміну слів, а розуміє глибокий зміст тексту. При обробці імен, як спеціальних термінів, GPT може точніше використовувати контекстуальні підказки для прийняття рішень. Наприклад, у дослідженні, що стосується розпізнавання імен у російських культурних новинах, GPT досяг F1-оцінки 0.93, демонструючи свою видатну продуктивність у специфічних мовах та типах сутностей. Ця здатність дозволяє йому, коли він стикається з "Xiaohao Yang", припустити, що це, ймовірно, китайський автор, і спробувати знайти найбільш відповідну комбінацію китайських ієрогліфів у своїй базі знань, врешті-решт успішно "вгадати" "杨晓浩". Це інтелект на основі ймовірності та контексту, а не просте правило.

На відміну від цього, Gemini в даному випадку підтверджує деякі проблеми, виявлені в відповідних дослідженнях. Хоча Gemini демонструє відмінні результати в деяких завданнях NER (наприклад, розпізнавання контекстно чутливих імен), він часто виявляє непослідовність, помилки або пропуски при обробці спеціальних термінів. Дослідження вказують на те, що Gemini має недостатню точність при обробці імен, географічних назв та інших спеціальних термінів, що призводить до пропусків або помилок. Наприклад, під час перекладу класичних текстів він може помилково перекласти спеціальне ім'я "佛國白禪師" як описове речення. Тому, що Gemini не зміг відновити "Xiaohao Yang" у китайське ім'я, ймовірно, є наслідком його нестабільності в обробці спеціальних термінів та недостатньої глибини контекстуального розуміння.

Ця маленька різниця в перекладі імені має для нас велике значення. Це не лише доказ технічної переваги, але й відображення "тепла" продукту. Модель, яка "розуміє" китайський контекст, може передбачити потенційні потреби користувачів — у китайському світі ми звикли звертатися до людей за іменем. Відновлення піньїнь імені китайського автора в ієрогліфи є підтвердженням особи автора та відповіддю на звички читачів китайською мовою. Ця "розумність" і "турбота" в деталях можуть значно підвищити занурення та довіру користувачів у контексті глибокого читання.

3. Розуміння контексту

У наших відгуках користувачів є одне спостереження, яке дуже точно вказує на основну різницю в стилі між двома основними моделями: "Особливість Gemini полягає в тому, що інформації занадто багато, і вона намагається перекласти кожен знак, що іноді призводить до надмірної багатослівності. А вираз GPT більш стиснутий."

Ця оцінка влучно вказує на суть. Для академічного та документального перекладу, де важливі ефективність і глибина, "стислість" не є просто естетичним аспектом, вона безпосередньо пов'язана з "відчуттям міри" — знанням, коли бути детальним, а коли стриманим, щоб максимізувати ефективність передачі інформації. Коли ви стикаєтеся з величезною кількістю документів, найцінніше — це час. Перекладач, який розуміє "відчуття міри", може швидко виділити зайву інформацію, зосередившись на основних аргументах, а не загромаджуючи вас деталями. Це стосується не лише точності, але й ефективності читання та когнітивного навантаження.

Отже, звідки береться це "відчуття міри"? Воно походить від глибокого, глобального розуміння контексту моделлю. Цікаво, що хоча Gemini відомий своїм величезним контекстуальним вікном, яке налічує мільйони токенів, теоретично здатним "бачити" далі, на практиці збереження єдиного стилю та емоційного тону в довгих текстах стало викликом. Дослідження вказують на те, що Gemini може послабити емоційний колорит оригіналу під час перекладу, його стильова послідовність демонструє значну варіативність. Іноді він навіть може сплутати сюжет у тривалих наративних текстах, що призводить до "стильового зсуву".

На відміну від цього, GPT, хоча його контекстуальне вікно також досягає 128K токенів, демонструє кращі результати в збереженні емоційного тону та стильової послідовності. Багато досліджень показують, що виходи GPT емоційно ближчі до перекладів людських експертів і мають більшу резонансність. Він краще підтримує єдиний наративний голос, демонструючи "найбільшу послідовність і надійність моделі" в значенні, структурі речень і зв'язності контексту. Ця стабільність виходу, вірність оригінальному духу, є відмінним прикладом "відчуття міри". Він розуміє, що хороший переклад — це не просто накопичення інформації, а вибіркове, акцентоване представлення.

З іншого боку, це також підтверджує цю різницю. Ми помітили, що деякі користувачі скаржилися, що безпекові фільтри Gemini іноді занадто "чутливі", і при обробці цілком нормальних академічних або історичних текстів вони можуть перервати переклад через окремі слова. Це в певній мірі також відображає деякі недоліки моделі в розумінні реального контексту та відчутті "міри" — вона бачить "дерева" (чутливі слова), але не розуміє "ліс" (академічний контекст).

Отже, справжнє розуміння контексту полягає не лише в тому, щоб обробляти довгі тексти, а в тому, наскільки глибоко можна зрозуміти наміри, тон і стиль тексту та відтворити їх у відповідний спосіб. Для нас, хто мандрує в океані знань, AI-партнер, який має "відчуття міри", є набагато ціннішим, ніж "бібліотека", яка просто скидає інформацію.

Перспективи та зобов'язання: новий початок, кращий досвід

Після детального пояснення нашого важкого, але рішучого вибору, зараз я з великим хвилюванням оголошую вам: безкоштовна послуга перекладу, інтегрована з новим GPT-двигуном, наразі перебуває на останньому етапі внутрішнього тестування і буде запущена для всіх користувачів протягом цього тижня!

Це означає, що проблеми, з якими ви довгий час скаржилися, такі як надмірний час очікування та нестабільна якість перекладу в години пік, будуть значно зменшені. Ми добре знаємо, що кожна хвилина очікування виснажує вашу терплячість, а кожен незадовільний результат перекладу підриває вашу довіру. Це оновлення покликане покласти цьому край.

Прийняття цього рішення було нелегким. Вибір дорожчого варіанту для команди, яка все ще розвивається, означає величезний тягар. Але ми постійно запитували себе: у чому сенс існування Doclingo? Відповідь завжди однакова: створювати цінність для користувачів. Ми віримо, що видатний і надійний користувацький досвід є ядром і душею продукту, і ніколи не повинен бути затьмарений витратами. Тому це оновлення є не лише технічною ітерацією, але й серйозним виконанням нашого зобов'язання "перш за все, користувач". Ми готові вкласти більше, щоб забезпечити вам ту безтурботну увагу та плавність під час читання документів.

Звичайно, новий початок потребує нашої спільної роботи з вами. Потужніший двигун — це лише початок, а ваші реальні враження є єдиним критерієм оцінки цінності нашої роботи. Тому ми щиро запрошуємо кожного користувача після запуску нового двигуна насолоджуватися ним, використовувати його та оцінювати.

  • Чи стали довгі складні абзаци більш природними та плавними, зберігаючи "відчуття міри" оригіналу?
  • Чи зникли ті набридливі проблеми з плутаними іменами та назвами організацій?
  • Чи став ваш переклад статей більш точним і професійним?

Будь ласка, поділіться своїм реальним досвідом через канали зворотного зв'язку в продукті. Ваше кожне схвалення — це найбільша підтримка для нас; ваша кожна критика — це найцінніший двигун для нашої оптимізації та ітерації. Ми обіцяємо уважно прочитати та проаналізувати кожен відгук і включити його в нашу майбутню дорожню карту продукту, створивши прозорий і ефективний цикл зворотного зв'язку.

Це не лише кінець оновлення, а й початок спільної роботи над створенням провідного інструменту перекладу. Ми сповнені впевненості в майбутньому і з нетерпінням чекаємо на те, щоб разом з вами спостерігати за кожним кроком прогресу Doclingo.

Copyright © 2025 Doclingo. All Rights Reserved.
Продукти
Переклад документів
Більше інструментів
API
Корпоративна версія
Ресурси
Pro-учасники
Завантажити додаток
Про нас
Центр допомоги
Угода користувача
Політика конфіденційності
Оновлення версії
Блог
Контактна інформація
Електронна пошта: support@doclingo.ai
Copyright © 2025 Doclingo. All Rights Reserved.