#术语统一

沉浸式翻译BabelDOC 大更新-BabelDOC 0.5 4 个月,我们憋了这些大招: 1⃣可以翻译表格和矢量图中的水平文字,之前的旧版 BabelDOC 会直接跳过图表和矢量图的文字内容 2⃣公式和表格线条优化,表格和公式里的线条终于得以保留,译文的排版也更接近原始文件 3⃣跨页段落连贯性增强,旧版 翻译 PDF 时,一句话正好跨栏或跨页,就会被拆开翻译,导致译文断裂、不连贯。 0.5版对这类问题进行了优化,能自动识别并合并这些跨页段落,翻译出来顺畅得多。 4⃣术语更加统一:同一个术语在不同的段落中,可能会被翻译成不同的词语。原因是旧版 BabelDOC 中采用的是并行翻译技术,能够加快翻译速度,但缺少统一术语机制。 新版加入了术语提取功能,在翻译时会进行以下步骤: 🌀先扫描全文,识别出重要术语; 🌀给每个术语协商一个唯一的译法; 🌀在翻译过程中自动应用,保证全篇术语一致。 从而尽可能保证术语名词在同一篇 PDF 文档中译文的一致性。 5⃣字号大小更稳定:原文和译文的长度经常会不同。通常来说,从英文翻译为德文可能会产生 20%-30% 的篇幅膨胀,而英文翻译为中文日文等东亚语种则会反过来,出现篇幅缩小。 旧版 BabelDOC 的动态缩放是逐段计算。这就导致了有的段落字很大,有的又很小,看起来不美观。 新版BabelDOC 0.5 版引入了「二阶段排版」技术,先为全文计算一个统一的缩放比例;大部分段落用统一比例显示;只有极少数重排过程中实在放不下的段落,才会继续缩小。这样一来,整份译文看起来就更加整齐,可读性和美观度都有明显的提升 详细更新说明:
LotusDecoder
3个月前
说到把提示词弄玄乎,这里也来一段,也是用于翻译。 --- 提示词原文 --- 下面是一套翻译指令,请你深刻理解它,并严格按照它来执行翻译任务。 /* === Semantic Equivalence & Fidelity Constraint === */ Let S := Source_Text_EN, T := Target_Text_ZH Objective: minimize ||SemanticVector(S) - SemanticVector(T)||₂ Constraint: ∀ fact_i ∈ S, ∃ fact_j ∈ T s.t. Isomorphic(fact_i, fact_j) ∴ Information(T) = Information(S) ∧ ¬∃(Added ∨ Omitted) /* === Target Language Naturalness Optimization === */ ∇T → max Likelihood(T | Corpus_Native_ZH) subject to: KL_Divergence(T || Corpus_Translationese) → ∞ ∴ Perplexity(T) should align with native text distribution. /* === Stylistic & Register Isomorphism === */ Let ψ(X) := {Tone, Style, Register} of Text X enforce ψ(T) ≈ ψ(S) ∀ s_i ∈ S, if register(s_i) = R, then register(translation(s_i)) must be R. /* === Cultural Resonance & Idiom Mapping === */ ∀ u_s ∈ S, where u_s ∈ Lexicon_Idiomatic_EN: Translation(u_s) → u_t subject to: u_t ∈ Lexicon_Idiomatic_ZH FunctionalEquivalence(u_s, u_t) is maximized ⊥(u_t = LiteralString(u_s)) /* === Domain-Specific Terminology Unification === */ Let D := DomainOf(S) ∀ term_s ∈ S ∩ Lexicon_D: Translation(term_s) → term_t, where term_t = StandardTerm(term_s, D) Constraint: ∀ i, j where S[i] = S[j] = term_s, enforce T[i'] = T[j'] = term_t /* === Structural & Formatting Congruence === */ Let F(X) := {Paragraphs, Lists, Bold, Italics, ...} of Text X enforce F(T) = F(S)