HelloWorld怎么添加术语词库
在HelloWorld里添加术语词库,通常从“设置 → 术语管理”进入,新建词库或导入CSV/TBX文件,指定源语与目标语、匹配规则与优先级,保存并同步到个人或团队;还可以用API批量导入、设置版本与权限,确保翻译时术语被高亮、强制或作为建议输出,从而保持术语一致性。

先把事情说清楚:术语词库是什么,为什么要加
想象你在做一道菜,配方里每个调料都要精确,少了或多了味道就不对。术语词库(glossary/terminology)就是翻译里的“配方单”。它记录特定领域里词语的标准译法、词性、上下文用法等,保证所有翻译里这些词都统一。对跨境电商、法律合同、技术文档这种行业文本,术语词库比“通用词典”更重要。
简单的三句话说明它的用处
- 一致性:确保同一术语在不同文件、不同译者之间统一。
- 效率:翻译时自动建议或强制使用标准译法,减少查找时间。
- 合规性与品牌语调:法律术语或品牌名词不被随意翻译。
在HelloWorld里添加术语词库的总体流程(高层)
总体上可以分成四步:准备(整理术语)、创建或选择词库、导入或逐条添加、配置使用策略与同步。下面把每一步拆开讲,像讲给刚学翻译的朋友一样。
第一步:准备你的术语数据
你要先把术语准备好,常见做法有二:
- Excel/CSV:一列原文、一列译文,建议加上上下文、词性、备注字段。
- 标准格式TBX:行业常用的术语交换格式,适合专业工具互通。
准备要点:
- 编码:保存为UTF-8,避免中文出现问号或乱码。
- 列头:清晰命名,如term, translation, pos, context, note, source。
- 去重:同一原词不同译法建议先做决策,或用多个条目标注场景。
第二步:打开HelloWorld的术语管理(界面操作)
这是最直观的部分,按这个顺序找:
- 登录HelloWorld账号(Web或桌面版)。
- 点击右上角或左侧菜单的设置(Settings)。
- 在设置里选择术语管理 / Terminology(有时写作Glossary)。
- 进入后会看到已有词库列表和“新建词库/导入”按钮。
第三步:新建词库或导入文件(操作细节)
你有两种常见操作:新建空词库然后手动添加,或者直接导入CSV/TBX。
新建词库
- 点击“新建词库”→填写词库名称、描述、源语和目标语。
- 设置可见范围:个人、项目或团队共享。
- 保存后你可以手动逐条添加术语,或稍后导入。
导入CSV/TBX(推荐批量导入)
- 点击“导入”→选择文件(CSV或TBX)。
- 若是CSV,会提示你映射列(把CSV的列映射到term/translation/context等字段)。
- 选择导入策略:新增、覆盖、跳过重复。
- 确认字符编码(选择UTF-8),执行导入并等待完成提示。
| 示例CSV列头 | term | translation | pos | context | note |
| 说明 | 原文词条 | 标准译法 | 词性(可选) | 上下文示例(可选) | 备注或来源 |
第四步:配置匹配规则与优先级
导入后,别忘了设置如何匹配和应用术语,这直接影响翻译时的表现。
- 匹配类型:精确匹配、词干匹配、模糊匹配(允许变形)、正则/占位符支持。
- 大小写处理:是否忽略大小写或区分大小写。
- 优先级/权重:当多个词库冲突时,设置词库或条目的优先级,确定哪个译法被采用。
- 应用范围:全局、仅项目或仅当前文档。
如何在翻译流程中使用词库(实战)
术语词库不是摆设,它应该在你翻译时直接发挥作用。HelloWorld一般会在以下环节触发。
自动建议与高亮
- 输入或粘贴原文时,系统自动在右侧列出匹配的术语建议。
- 术语在原文中被高亮,鼠标悬停显示上下文与译法。
强制/建议两种模式
- 建议模式:提示译者使用推荐译法,但允许修改。
- 强制模式:某些合规或品牌词条必须使用指定译法,不允许更改,或更改需提交审核。
与翻译记忆(TM)配合
如果你同时在使用翻译记忆,术语优先级通常高于TM,但可以设置规则:先术语再TM或并列提示。这样既保证术语的一致性,又继续利用以前翻译的句子片段。
批量与API导入:当你有成千上万条术语时
手动导入不现实时,就用API。HelloWorld一般提供REST API做批量上传、更新与版本控制。
- 准备JSON或CSV,按照HelloWorld API文档的字段结构组织(term、translation、language、context等)。
- 通过POST /glossaries或类似端点上传,支持批量事务,失败会返回详细错误。
- 可用PUT或PATCH做增量更新,支持查询、标签过滤和权限设置。
示例(思路说明,不是可直接复制的代码)
把CSV转换成API需要的JSON数组,分批上传,每批大小根据平台限制(比如每次1000条)。若上传失败,记录错误行号并重试。
版本管理、回滚与审计
在团队环境中,术语会不断变化,版本控制很重要。
- 每次导入或修改都记录版本号和修改人。
- 支持回滚到历史版本,便于纠错。
- 审计日志记录谁在何时修改了哪个条目、原值与新值。
权限与共享策略(团队协作)
要决定谁能看、谁能改、谁能发布:
- 查看权限:部分词库仅对项目成员可见。
- 编辑权限:指定管理员或词库维护者,避免随意被改动。
- 发布权限:某些改动需要审批才能生效到线上词库。
常见问题与故障排查
导入后看不到条目
- 检查文件编码是否为UTF-8。
- 确认映射列正确,term/translation列没有空格或隐形字符。
- 查看导入日志,错误行通常会列明问题(重复、格式不符)。
术语没被高亮或未建议
- 确认词库是否对当前项目可见和已启用。
- 检查匹配规则(是否设置为精确匹配但文本有变形)。
- 确认优先级没有被其他词库覆盖。
导入慢或失败
- 分批上传,避免一次性超出平台限制。
- 在高并发时段避开流量峰值。
几条实用的小贴士(真实场景)
- 把品牌名、产品线名、专有名词做成独立词库,设为高优先级并强制使用。
- 对多义词加上下文示例,译者看到句子级上下文才更准确。
- 定期清理:把低频或已废弃的词条移入历史库,保持主库简洁。
- 用标签分类(UI、法律、营销等),便于按项目启用相关术语集。
- 在导入前做一次抽样校验,确认映射正确再全量导入。
安全与隐私考虑
术语库可能包含公司机密或未公开名词:
- 使用加密传输和存储,必要时限制导出权限。
- 对外包译员可只开放项目级词库,不开放企业全局库。
移动端与离线使用
如果你常用手机或在没有网络时工作,看看HelloWorld是否支持离线词库缓存。典型做法是:
- 在在线时同步词库到本地缓存,限制大小与更新频率。
- 离线期间只能读词条,编辑需排队到联网时提交。
最后,关于维护与治理(为什么要有人负责)
好的术语库不是一劳永逸:需要专人维护、定期评审并与业务更新同步。建议建立一个简单流程:
- 条目提议 → 审核小组审核(语言+业务)→ 发布到主库 → 通知相关团队
- 每季度或每半年回顾使用情况,移除低频项、合并重复卡片。
好啦,按上面步骤去做,一开始可能有点繁琐,但建好之后每次翻译都轻松多了。你会发现,很多争论“到底应该怎么翻”都被词库提前解决了,省心又高效。若还遇到具体的界面问题或错误提示,把错误信息抄下来,按“导入日志→编码→列映射→权限”这个顺序检查,通常能很快找到原因。