CCJK及泰语字数统计方法、差异 由于各语种存在不同的特性,尤其是许多亚洲语种,包含双字节语种和特殊语系等特点, 在统计相关字数时,应根据该语种特点,灵活采用不同的方式计算: 一、 中日韩等双字节语种 CCJK 为原语言的文件,现在基本都用 MemoQ 统计字数。 下表为 MemoQ、Trados 和 MS Word 三种工具统计 CCJK 字数的差异(未考虑标点问题,需掌握): 工具 MemoQ Trados CCJ 的文件中,无论什 么语言均按字符;KO 文 件中均按 word 有 5+0+1=6 统计 CCJ 字数时会将文 件中的英文和数字按字 符统计,因此不准确 影响统计结果的其他因素包括(了解即可): MS Word 统计方式 Fuzzy/重复 CCJ 按字符,英文 /数字/KO 按 word 有 1+0+1=2 CCJK 按字符,英 文/数字按 word 无 1+0+1=2 无重复率,没有 折扣 例“MemoQ 的”字数 弊端 因素 单独成句的 数字 标点 超链接 Trados Studio Memoq 2009 包含,按字符 数算 不包含 按字符数算 Trados 2007 MS Word (2007) 包含,按字符 数算 包含 不包含 包含,按字 算 算字 不算字 包含,按字算 不包含 不包含 不包含 不包含 转 ttx 按字符数算, doc 设置后台不转 ttx 不包含 包含,按字符数算 不算字 不算字 包含,按字符 句子中的英文、 包含,按字 数算 数字 算 域 隐藏文本 总结: 算字 不算字 不算字 不算字 Trados(2007 和/或 Studio 各版本)对中文支持不好,没有参考价值;而 MS Word 会把标点符号等无需处理的内容也统计到字数里;相比之下,MemoQ 的统计结果相对合理。 为避免韩文字数统计不一致的问题,也可以按目标语言字数计费。如 KO-EN,按英文计费, 费率可能是按韩文的 2 倍。 二、 泰文 泰文是一种拼音文字,而且基本不使用标点符号和空格,所以一般工具很难自动统计出泰文的 Wordcount,通常的做法是以语言对的另外一种语言作为标准。比如英文-泰文,无论是从英文翻译成泰文还是泰文翻译成英文,都以英文作为计算字数的语言。如必须按泰文计费,则可以按一个英文等于 1.5 泰文折算。 本文来源:https://www.wddqw.com/doc/803e96d0adf8941ea76e58fafab069dc50224730.html