Réflexions sur la mise à niveau de la traduction PDF gratuite : pourquoi nous avons abandonné Gemini à moitié prix

Aujourd'hui, je souhaite avoir une communication franche avec vous. Tout d'abord, je tiens à présenter mes excuses les plus sincères à tous ceux qui ont été affectés par la mauvaise expérience récente de notre version gratuite.

Au cours de la dernière période, nous avons reçu de nombreux retours négatifs concernant l'expérience de la version gratuite. Nous avons entendu ces voix et nous les comprenons. De nombreux utilisateurs ont mentionné que le "temps d'attente pendant les heures de pointe est ridiculement long" ; la qualité de traduction des documents est "très instable", parfois bonne, parfois mauvaise ; d'autres se plaignent que les traductions sont "mélangées en chinois et en anglais, rendant la lecture difficile", avec un sentiment persistant de "traduction automatique".

Chaque fois que nous voyons ces retours, notre équipe se sent profondément coupable. Nous comprenons parfaitement que lorsque vous avez besoin d'un document académique ou d'un rapport de travail important, devoir faire face à une longue attente et à une traduction incohérente et illogique est décevant et frustrant. Ce n'est absolument pas l'expérience que nous souhaitons que Doclingo vous offre, et cela va à l'encontre de la raison pour laquelle nous avons créé ce produit.

Doclingo a adopté dès le départ un modèle freemium, car nous croyons fermement que la traduction de documents de haute qualité ne devrait pas être un privilège réservé à quelques-uns. Nous souhaitons qu'un bon version gratuite permette à un plus grand nombre de personnes de surmonter les barrières linguistiques et d'accéder à des connaissances et informations de pointe. Cependant, une mauvaise expérience gratuite ne peut non seulement pas fidéliser les utilisateurs, mais constitue également une trahison de la confiance que vous nous accordez. C'est cette prise de conscience qui nous a poussés à prendre la décision de résoudre ces problèmes de manière définitive, à tout prix.

Après de nombreuses discussions internes et évaluations techniques, nous avons conclu que le moteur de traduction IA utilisé par la version gratuite actuelle ne peut plus soutenir notre engagement envers la qualité et l'efficacité. Pour résoudre fondamentalement les problèmes de file d'attente et de qualité de traduction, la seule solution est de remplacer le moteur IA par un moteur plus puissant - un moteur qui mérite vraiment nos utilisateurs.

Cette décision nous a placés à un carrefour difficile. Les meilleurs moteurs d'IA sur le marché proviennent principalement de la série GPT d'OpenAI et de la série Gemini de Google. Ils représentent tous deux le summum de l'intelligence artificielle actuelle, mais leurs styles, coûts et performances dans des tâches de traduction spécifiques varient considérablement.

Ainsi, cet article vise à partager avec vous le processus de réflexion complet derrière notre décision de mise à niveau majeure : comment avons-nous fait un choix difficile entre ces deux moteurs d'IA de premier plan ? Pourquoi avons-nous finalement abandonné Gemini, qui coûte seulement la moitié du prix, pour choisir une option plus coûteuse ?

Nous espérons qu'à travers cette communication transparente, nous ne nous excusons pas seulement pour l'expérience insatisfaisante passée, mais nous souhaitons également vous montrer notre détermination et notre engagement à améliorer l'expérience produit.

Expérience ou rapport qualité-prix ?

Je réfléchis chaque jour à la manière de créer plus de valeur pour les utilisateurs. Mais dans le monde des affaires, la création de valeur est toujours accompagnée d'une facture de coûts invisible. Lorsque Doclingo a décidé de mettre à niveau son moteur de traduction principal, notre équipe s'est retrouvée à un carrefour difficile : d'un côté, la tentation énorme de réduire les coûts de presque moitié, de l'autre, l'expérience utilisateur que nous défendons toujours.

Quiconque est responsable des bénéfices et des pertes d'un produit sait que le contrôle des coûts est une épée de Damoclès suspendue au-dessus de sa tête. Lorsque nous avons évalué le nouveau moteur de modèle, une option très attrayante s'est présentée à nous - la série Gemini de Google.

Pour être honnête, la stratégie de tarification de Gemini est très séduisante pour nous. Selon nos recherches, le coût de Gemini est inférieur à celui de GPT. En faisant un simple calcul, si nous passons à Gemini, le coût d'appel de notre moteur principal pourrait presque être réduit de moitié. Pour une application comme Doclingo, qui traite chaque jour un grand nombre de demandes de traduction, cette économie est considérable. Cet argent pourrait être investi dans le marketing, le développement de l'équipe, ou se refléter directement dans une stratégie de tarification plus flexible. Face à un tel avantage de coût, dire que nous n'avons pas été tentés serait un mensonge.

Cependant, après de vives discussions internes, nous avons finalement pris une décision qui semble "non économique" : défendre l'expérience et choisir GPT.

Car nous avons de bonnes raisons.

Trois raisons de choisir GPT

1. Précision des termes académiques

Pour tout outil de traduction destiné au domaine de la recherche et académique, la précision des termes spécialisés est fondamentale. Cela ne concerne pas seulement la "fidélité, la clarté et l'élégance" de la traduction, mais détermine directement si la valeur centrale des documents peut être transmise avec précision.

Dans cette évaluation approfondie, un exemple frappant a marqué notre équipe. Lorsque nous avons traduit un document dans le domaine de la physique de la matière condensée, nous avons rencontré un terme fréquent : "pair distribution function".

La traduction de GPT est : "fonction de distribution de paires"
La traduction de Gemini est : "fonction de distribution appariée"

Littéralement, "appariée" semble plus proche du sens original de "pair", ce qui est une traduction très intuitive et raisonnable. Cependant, pour les chercheurs et étudiants de ce domaine, "fonction de distribution de paires" est le terme convenu et reconnu. Cette petite différence est comme une ligne de démarcation, séparant clairement les "initiés" des "non-initiés". Bien que la traduction de Gemini ne soit pas incorrecte au sens littéral, elle révèle une certaine rigidité de "traduction automatique", tandis que GPT démontre une compréhension profonde des connaissances spécifiques à un domaine académique.

Cette différence n'est pas un cas isolé. Des études montrent que dans des domaines hautement spécialisés comme la médecine et la science, les modèles de niveau GPT-4 surpassent souvent les concurrents en termes de précision et de rigueur lors du traitement de concepts et de termes complexes. Par exemple, dans des évaluations comparatives, GPT-4 a montré un taux de réussite plus élevé et moins d'erreurs graves lors de la réponse à des questions cliniques difficiles. Bien que les réponses de Gemini soient parfois plus faciles à comprendre, cela se fait souvent au prix de la précision technique. Cette tendance à "sacrifier la précision pour la lisibilité" est extrêmement dangereuse dans la traduction académique.

Nous savons pertinemment que les utilisateurs principaux de Doclingo - les chercheurs et étudiants - traitent chaque jour ces termes hautement spécialisés. Pour vous, une "erreur de quelques millimètres" dans les termes peut entraîner une "erreur de milliers de kilomètres" dans la compréhension. Un terme imprécis non seulement interrompt le flux de lecture immersif, vous obligeant à vous arrêter pour vérifier ou deviner, mais plus gravement, il peut déformer le point central de l'auteur original et même induire en erreur votre direction de recherche. La précision des termes est la pierre angulaire de la rigueur académique et la bouée de sauvetage pour améliorer l'efficacité de la lecture des documents.

Le fait que le modèle GPT puisse réaliser cela n'est pas un hasard. Sa puissante capacité de cognition et de raisonnement a été pleinement validée dans des tests de référence reconnus dans l'industrie tels que le MMLU (Massive Multitask Language Understanding). Par exemple, même en tant que version allégée, GPT a atteint un score MMLU impressionnant de 82,0 %, prouvant ainsi sa solide compréhension et capacité de raisonnement à travers de nombreux domaines académiques. C'est cette forte "base de connaissances" qui lui permet, lors de la traduction, de dépasser le sens littéral et de capturer avec précision l'expression correcte dans le contexte d'une discipline spécifique.

Ainsi, lorsque nous voyons "fonction de distribution de paires" comme traduction précise, nous savons que cela reflète la compréhension approfondie du modèle des connaissances spécialisées. Pour protéger cette "précision" et "rigueur" dans les échanges académiques, nous pensons que choisir GPT est la seule réponse correcte.

2. Contexte chinois

Nous savons qu'un bon outil doit non seulement être puissant, mais aussi "comprendre" l'utilisateur. Dans le contexte de la traduction de documents académiques, "comprendre" signifie saisir profondément les habitudes de lecture et le contexte culturel des lecteurs chinois. Un détail apparemment insignifiant peut souvent déterminer la qualité de l'expérience utilisateur, voire influencer le professionnalisme de l'ensemble du produit. Dans cette comparaison, la différence entre GPT et Gemini dans le traitement des noms d'auteurs chinois est un excellent exemple de "la vérité se cache dans les détails".

Lorsque nous avons soumis un document contenant l'auteur "Xiaohao Yang" à traduire par les deux modèles, un détail surprenant est apparu : GPT a presque "deviné" pour restituer ce nom en pinyin en "杨晓浩", tandis que Gemini a simplement conservé le pinyin original. Cette différence, bien que petite, touche au cœur du problème. Pour tout lecteur chinois, en particulier lors de la lecture d'une traduction destinée à respecter les normes de mise en page des revues chinoises, voir un nom chinois familier plutôt qu'une longue chaîne de pinyin change complètement la fluidité et la convivialité de la lecture. Ce n'est pas seulement une traduction, c'est une attention culturelle, un respect pour "l'humain".

Pourquoi GPT peut-il faire cela ? Cela repose sur sa puissante capacité de compréhension contextuelle et de reconnaissance d'entités nommées (NER). Des études montrent que GPT-4 atteint un niveau de qualité de traduction équivalent à celui d'un traducteur humain débutant et possède une capacité aiguë d'évaluation de la qualité de traduction, ce qui signifie qu'il ne se contente pas de faire des substitutions mécaniques de mots, mais comprend les significations profondes derrière le texte. Lors du traitement de noms propres, GPT peut utiliser plus précisément les indices contextuels pour faire des jugements. Par exemple, dans une étude sur la reconnaissance des noms dans les nouvelles culturelles russes, GPT a atteint un score F1 de 0,93 grâce à des indications appropriées, montrant son excellence dans des langues et types d'entités spécifiques. Cette capacité lui permet, lorsqu'il rencontre "Xiaohao Yang", de déduire qu'il s'agit probablement d'un auteur chinois et d'essayer de trouver la combinaison de caractères chinois la plus appropriée dans sa base de connaissances, réussissant finalement à "deviner" "杨晓浩". C'est une intelligence basée sur des probabilités et le contexte, plutôt qu'un simple appariement de règles.

En revanche, la performance de Gemini ici confirme certains problèmes identifiés dans des recherches connexes. Bien que Gemini excelle dans certaines tâches NER (comme la reconnaissance de noms sensibles au contexte), il montre souvent des incohérences, des erreurs de traduction ou des omissions lors du traitement de noms propres. Des études ont indiqué que Gemini manque de précision lors du traitement de noms propres, de lieux, etc., et est susceptible de faire des omissions ou des erreurs de traduction. Par exemple, lors de la traduction de documents classiques, il pourrait traduire un nom propre comme "佛國白禪師" en une phrase descriptive. Ainsi, le fait que Gemini n'ait pas pu restituer "Xiaohao Yang" en chinois pourrait bien être le reflet de son instabilité dans le traitement des noms propres et de sa compréhension contextuelle insuffisante.

Cette petite différence de traduction de nom a une grande signification pour nous. Ce n'est pas seulement une preuve de supériorité technique, mais aussi une manifestation de la "température" du produit. Un modèle qui "comprend" le contexte chinois peut anticiper les besoins potentiels des utilisateurs - dans le monde chinois, nous avons l'habitude d'appeler les gens par leur nom. Restituer le nom en pinyin d'un auteur chinois en caractères est une confirmation de l'identité de l'auteur et une conformité aux habitudes de lecture des lecteurs chinois. Cette "intelligence" et cette "attention" dans les détails peuvent considérablement améliorer l'immersion et la confiance des utilisateurs dans des scénarios de lecture approfondie.

3. Compréhension du contexte

Dans nos retours utilisateurs, une observation est particulièrement pertinente, soulignant avec précision la différence de style entre les deux modèles principaux : "Gemini se caractérise par une quantité d'informations extrêmement complète, presque trop, ce qui rend parfois le texte trop verbeux. En revanche, l'expression de GPT est plus concise."

Cette évaluation touche au cœur du problème. Dans le contexte de la traduction académique et documentaire, la "concision" n'est pas simplement une question d'élégance littéraire, elle est directement liée à la "sensibilité" - une sagesse qui sait quand être détaillée et quand se retenir, maximisant ainsi l'efficacité de la transmission de l'information. Lorsque vous êtes confronté à une mer de documents, le plus précieux est le temps. Un assistant de traduction qui comprend la "sensibilité" peut vous aider à éliminer rapidement les informations superflues et à atteindre le cœur des arguments, plutôt que d'encombrer votre lecture avec des détails superflus. Cela concerne non seulement la précision, mais aussi l'efficacité de la lecture et la charge cognitive.

D'où vient cette "sensibilité" ? Elle provient de la compréhension profonde et globale du modèle du contexte. Fait intéressant, bien que Gemini soit réputé pour sa fenêtre contextuelle ultra-large de plusieurs millions de tokens, lui permettant théoriquement de "voir" plus loin, maintenir un style et un ton émotionnel cohérents dans la traduction de longs textes s'est avéré être un défi. Des études ont montré que Gemini peut affaiblir la couleur émotionnelle du texte original pendant le processus de traduction, et sa cohérence stylistique présente une grande variabilité. Parfois, il peut même confondre les intrigues dans une narration prolongée, entraînant un "dérangement stylistique".

En revanche, bien que GPT ait également atteint une fenêtre contextuelle de 128K tokens, il excelle dans le maintien de la cohérence émotionnelle et stylistique. Plusieurs études montrent que les sorties de GPT sont émotionnellement plus proches des traductions d'experts humains et résonnent davantage. Il parvient mieux à maintenir une voix narrative cohérente, étant le "modèle le plus cohérent et fiable" en termes de signification, de structure de phrase et de cohérence contextuelle. Cette capacité à produire des sorties stables, fidèles à l'esprit du texte original, est une excellente illustration de la "sensibilité". Il comprend que la bonne traduction n'est pas un empilement d'informations, mais une présentation sélective et ciblée.

D'un autre côté, cette différence peut également être confirmée par d'autres retours. Nous avons remarqué que certains utilisateurs ont signalé que le filtre de sécurité de Gemini est parfois trop "sensible", interrompant la traduction en raison de mots individuels dans des textes académiques ou historiques tout à fait normaux. Cela reflète en partie le manque de compréhension du modèle du contexte réel et de la "sensibilité" - il voit les "arbres" (mots sensibles), mais ne parvient pas à comprendre la "forêt" entière (contexte académique).

En résumé, la véritable compréhension du contexte ne réside pas seulement dans la capacité à traiter de longs textes, mais dans la profondeur avec laquelle le modèle peut saisir l'intention, le ton et le style du texte, et les reproduire de manière appropriée. Pour nous, explorateurs dans l'océan de la connaissance, un partenaire IA doté de "sensibilité" est bien plus précieux qu'une simple "base de données" qui ne fait que déverser des informations.

Perspectives et engagement : un nouveau départ, une meilleure expérience

Après avoir expliqué en détail notre choix difficile mais ferme, je suis maintenant extrêmement enthousiaste d'annoncer officiellement que le service de traduction gratuit intégrant le nouveau moteur GPT est actuellement dans la dernière phase de test interne et sera lancé pour tous les utilisateurs cette semaine !

Cela signifie que les problèmes de temps d'attente excessif et de qualité de traduction instable pendant les heures de pointe, dont vous vous êtes plaints depuis longtemps, seront considérablement atténués. Nous savons que chaque minute d'attente épuise votre patience et que chaque résultat de traduction insatisfaisant trahit votre confiance. Cette mise à niveau vise à mettre fin à tout cela.

Prendre cette décision n'a pas été facile. Choisir une option plus coûteuse représente une pression énorme pour une équipe encore en croissance. Mais nous nous sommes répété : quel est le sens de l'existence de Doclingo ? La réponse est toujours la même : créer de la valeur pour les utilisateurs. Nous croyons fermement qu'une expérience utilisateur exceptionnelle et fiable est le cœur et l'âme du produit, et ne devrait jamais être compromise par des coûts. Ainsi, cette mise à niveau n'est pas seulement une itération technique, mais un engagement solennel à notre promesse de "mettre les utilisateurs en premier". Nous sommes prêts à investir davantage, juste pour vous offrir cette concentration et cette fluidité sans distraction lors de la lecture de documents.

Bien sûr, ce nouveau départ nécessite que nous l'ouvrions ensemble avec vous. Un moteur plus puissant n'est qu'un point de départ, et vos véritables ressentis sont le seul standard pour évaluer la valeur de notre travail. Par conséquent, nous vous invitons sincèrement, après le lancement du nouveau moteur, à l'expérimenter, l'utiliser et l'examiner.

Les longs paragraphes complexes, sont-ils plus naturels et fluides, respectant la "sensibilité" du texte original ?
Les problèmes de confusion des noms de personnes et d'institutions ont-ils disparu ?
La traduction de vos articles est-elle plus précise et professionnelle ?

Veuillez nous faire part de votre expérience réelle via les canaux de retour dans le produit. Chaque "j'aime" que vous nous donnez est le plus grand encouragement pour nous ; chaque critique que vous formulez est le moteur le plus précieux pour notre optimisation et notre itération. Nous nous engageons à lire et analyser chaque retour avec soin et à l'intégrer dans notre feuille de route produit future, formant ainsi une boucle de retour transparente et efficace.

Ce n'est pas seulement la fin d'une mise à niveau, mais le début d'un processus de perfectionnement d'un outil de traduction de premier plan avec vous. Nous sommes confiants pour l'avenir et avons hâte de témoigner avec vous de chaque progrès de Doclingo.