骑马与砍杀中文站论坛

 找回密码
 注册(Register!)

QQ登录

只需一步,快速开始

搜索
楼主: Rivendare

[分享] 汉化辅助工具(2009/9/13 2:32 更新)

[复制链接]
鲜花(0) 鸡蛋(0)
发表于 2009-8-18 08:22:56 | 显示全部楼层
很高兴看到楼主编写的工具,方便了骑杀的中文化。

其实楼主的工具提供的功能随着不断更新正在接近本地化翻译业内普遍使用的计算机辅助翻译(CAT)工具的功能。市场上已经有很多成熟的作品,可能的话希望同诸位大大一同探讨下这方面工具的使用,也希望为CAT在国内游戏汉化界的普及出份力,谢谢!
鲜花(9) 鸡蛋(0)
发表于 2009-8-18 09:59:18 | 显示全部楼层
本帖最后由 alixyang 于 2009-8-18 10:03 编辑

看来楼上是专业人士,首贴就到这边来了.....   还请指教一二......

骑砍是一个较为狭窄的语境,很多词汇都有固定的意义,要如何将自动翻译限制在这个区域呢
鲜花(0) 鸡蛋(0)
发表于 2009-8-18 10:10:04 | 显示全部楼层
术语表是可以自定义挂接的,只是个表格文本就可以,而且具备术语检查功能,具体见回复啦~希望能够帮到
鲜花(1) 鸡蛋(0)
 楼主| 发表于 2009-8-21 15:01:47 | 显示全部楼层
不晓得ls有米实践一把的意愿捏?~~
鲜花(1) 鸡蛋(0)
发表于 2009-8-25 20:20:47 | 显示全部楼层
lz啊,我下最新版还是有30楼出现的问题,不能解决吗?
鲜花(1) 鸡蛋(0)
 楼主| 发表于 2009-8-27 18:49:37 | 显示全部楼层
本帖最后由 Rivendare 于 2009-8-27 20:21 编辑

35# zck1006

啊,抱歉,刚意识到问题出在csv文件,而不是字典里,哎……找老杨商量去,貌似我没有印象见过游戏里面有换行的文字的说…… >_<

另外,能不能发一个会出问题的csv文件?thx~
鲜花(3) 鸡蛋(0)
发表于 2009-8-30 08:53:09 | 显示全部楼层
如楼上所说,所有的文件都打不开
鲜花(3) 鸡蛋(0)
发表于 2009-8-30 09:24:36 | 显示全部楼层



出现以上问题,请问是怎么回事情,是不是缺少什么文件!!
鲜花(1) 鸡蛋(0)
 楼主| 发表于 2009-8-30 13:24:10 | 显示全部楼层
看起来貌似是没有.net framework3.5或者版本不到的缘故?
鲜花(0) 鸡蛋(0)
发表于 2009-8-30 14:40:27 | 显示全部楼层
1# Rivendare


其实想问一下你给我们下载的那些东西怎么用啊?
鲜花(1) 鸡蛋(0)
 楼主| 发表于 2009-8-30 19:15:39 | 显示全部楼层
40# 285081450

饿,下载那个可执行程序,执行之,然后在文件菜单下选择打开,然后找一个M&B的mod的英文语言文件(比如troops.csv),然后就。。。
我觉得我写的程序的功能逻辑不难猜出来的说…… >_<
鲜花(3) 鸡蛋(0)
发表于 2009-8-30 23:14:51 | 显示全部楼层
39# Rivendare


果然版本不到,目前正在升级,希望能解决问题!
鲜花(1) 鸡蛋(0)
 楼主| 发表于 2009-8-31 17:00:08 | 显示全部楼层
42# wmw860123

看老杨的签名,貌似他在研究比较工业化的解决方法了,so,这个东西以后可能是没有必要更新了呢
另,.net framework 3.5已经有sp1的说,不晓得有没有必要升级这个才可以 >_<
抱歉,搞得这么麻烦……
鲜花(3) 鸡蛋(0)
发表于 2009-9-1 00:35:09 | 显示全部楼层
已经可以正常打开了!!不过为什么我随便打开一个文件都会卡死,整个软件都卡死了!!??
鲜花(9) 鸡蛋(0)
发表于 2009-9-1 10:23:44 | 显示全部楼层
已经可以正常打开了!!不过为什么我随便打开一个文件都会卡死,整个软件都卡死了!!??
wmw860123 发表于 2009-9-1 00:35


自动相似匹配的确要花些时间,一般半分钟足够了  ---- 当然,也要看你的机器性能....

看老杨的签名,貌似他在研究比较工业化的解决方法了,so,这个东西以后可能是没有必要更新了呢
另,.net framework 3.5已经有sp1的说,不晓得有没有必要升级这个才可以 >_<
抱歉,搞得这么麻烦 ...
Rivendare 发表于 2009-8-31 17:00


我看了sp1的说明  跟咱没多大关系。  wordfast我在看   但是这个工具才是主力啊  
语言文件提取,字典生成、空格处理这些,都是这里独有的,那些工具要转化起来不知道多麻烦.....
我试着改了改源程序,然后承认对C#还相当不熟......

现在的问题:
无Utf-8开头(EFBBBF)则内部乱码:
imod_plain|绱?鑹?鐨?%s

有空行 每行无分隔符或者两个分隔符则出错
在文本编辑器的16进制模式下  可以看到dos格式的回车换行是0D 0A (就是Cr/Lf)
但是有些非标准格式会变成0D   或者 0D 0D 0A   会让你的程序认为有一个空行 然后出错

期望的新版功能........
1.  可存储选择后的未翻译文档(直接在未翻译显示过滤那里输出好了...),方便任务分割。
2.  相似度对比需80%以上方可有效,可减少干扰  先做长度比较也可提高效率。
鲜花(1) 鸡蛋(0)
 楼主| 发表于 2009-9-1 21:11:50 | 显示全部楼层
我印象那个时候看到的所有的汉化文件都是utf8的,而且个人不怎么喜欢gbk和gb2312编码,所以直接就默认全部按照utf8处理了……
换行的貌似不是非标准什么的,印象有三种换行的方法,一个是\r\n,一个是\r,一个是\n。。。这个我会继续处理的,不过真的有汉化文件里面有强制换行的么?
这几天开始忙了,edc第二个作业出来了,spi每周一个作业,本周还多了两个report,sep的GUI也需要在一周内做出来,玩意谈到我头上的话,恐怕周末都睡不好了 >_<

上一次老杨就有提到需要模糊匹配的东西多的时候会很卡,我只是换了一个算法,稍稍简短了一点时间,本想着什么时候能有空把这个程序重构一下,然后添加一些东东,不过一直都没时间弄,实在对不起大家啊 >_<

ps,老杨斑斑要是能学会用cat做翻译辅助的话,我估计这个软件唯一有用的就是空格处理了,到时候可以单独弄出来撒~~老杨加油~~  ^_^

另,44楼的兄弟可不可以把那个打开就卡死的文件发一个给我?谢谢~~
鲜花(1) 鸡蛋(0)
 楼主| 发表于 2009-9-1 21:15:49 | 显示全部楼层
说道GUI,看到这个帖子的谁对实现这样的GUI有心得,可否指教?

我到现在还不知道java里面按钮怎么才能做成这个样子 >_<

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册(Register!)

x
鲜花(9) 鸡蛋(0)
发表于 2009-9-2 00:39:53 | 显示全部楼层
也许你可以先问问番茄(foxyman)
鲜花(6) 鸡蛋(0)
发表于 2009-9-3 15:23:48 | 显示全部楼层
本帖最后由 winkle_phone 于 2009-9-9 23:48 编辑

怎么有很多文件会说索引超出数组界限而不能打开呢?而且为什么会有些显示未翻的(就是粉色高亮的行)会自动替俺乱翻还不可修改呢?就是因为那个空行问题么?MS很多汉化都有文件这样,希望LZ尽快解决
鲜花(0) 鸡蛋(0)
发表于 2009-9-14 22:02:32 | 显示全部楼层
好强大啊!我现在在学这个。
鲜花(9) 鸡蛋(0)
发表于 2009-9-25 15:26:54 | 显示全部楼层
本帖最后由 alixyang 于 2009-9-25 15:31 编辑

我跑去把wordfast等等工具玩了一圈   发现还是自己做的工具有针对性。
依附于MS Word 的工具制作翻译库和词典较为麻烦,来回转码很容易出错,索引及译文中的寄存器也容易被破坏。

后来问了游戏汉化界一位资深人士,他也说那些CAT工具起到的作用不大,重点还是在人本身。
由于他们要不停接新任务的本身性质,基本上每次都是全新的开始,工具也确实用处不大。
一般的项目也就几个人在做,也谈不上什么在线协作工具之类,直接QQ讨论好了。
控制每个人的翻译质量/效率才是真正重点,这也是他们一开始就严格考察的。

能在同一个游戏上做下去,每次只要在原版汉化基础上做些更新,更不用考虑破壳解码之类,实在是一种幸福.....
希望小文或者各位有兴趣的能将这个软件发展下去。
鲜花(1) 鸡蛋(0)
 楼主| 发表于 2009-9-28 17:09:03 | 显示全部楼层
最近在做一个小组项目,所以基本上没有时间再搞这个了,所以才会把那个类似翻译的功能先屏蔽了……
虽然这两周是middle break,不过,万恶的小组作业啊,无论是国内还是国外,结果都是一样的啊,哎……

自动化的工具对使用字母的一维语言有不小的帮助,不过对二维语言真是帮助很小……
简单的一维语言在很多地方的优势很明显
本科的人工智能的课的作业就要求做一个基于决策树的简单OCR(只识别数字)了,而中文的OCR恐怕不是随便谁就能搞出来的了……而且在决策树值钱的贝叶斯逻辑部分的知识就可以做一个浏览器里面常用的spell check,而中文的spell check实在是完全没有头绪……
鲜花(1) 鸡蛋(0)
发表于 2009-10-23 22:05:07 | 显示全部楼层
请问源代码文件有什么用?
鲜花(0) 鸡蛋(0)
发表于 2009-10-28 12:43:45 | 显示全部楼层
有繁化的嗎?
小弟問一下
鲜花(1) 鸡蛋(0)
 楼主| 发表于 2009-10-29 14:04:48 | 显示全部楼层
53# mzjowood
担心有人认为程序包含恶意代码之类的啊什么的……--b

54# t8989889o
没有繁化,不过可以使用已有的方法(比如VB.net的某一个方法)把简体中文的字符变成繁体的
鲜花(5) 鸡蛋(0)
发表于 2009-11-16 02:54:18 | 显示全部楼层
1# Rivendare


下载试一下,看怎么样。
鲜花(7) 鸡蛋(0)
发表于 2009-12-16 16:33:37 | 显示全部楼层
1# Rivendare


本人闲人一个...学校一年有5个月放假..(12,5,6,7,8月)....想为骑砍的汉化出点力.....不过我程序盲.....但是英文水平不错...汉语水平还可以(汗!)....如果汉化组愿意把单纯的翻译工作分一部分让我分担一下...本人愿意效劳....翻译校订我也可以帮忙看看.....PS...本人中世纪知识丰富....现在在大学TAKE HIST 211 HISTORY OF MEDIEVAL EUROPE 论文写了不少书也啃了挺多了....应该能为汉化工作做点贡献
鲜花(5) 鸡蛋(0)
发表于 2010-1-10 14:43:42 | 显示全部楼层
以原有的翻译为基础创建字典:
程序出错。
鲜花(0) 鸡蛋(0)
发表于 2010-2-22 08:14:21 | 显示全部楼层
好东西     等我成功进入中山大学       我也为期刊源代码研究出份力

高三先学习了
鲜花(0) 鸡蛋(0)
发表于 2010-2-22 08:49:07 | 显示全部楼层
LZ,1.011可以用么?
您需要登录后才可以回帖 登录 | 注册(Register!)

本版积分规则

Archiver|手机版|小黑屋|骑马与砍杀中文站 ( 鄂ICP备07001403号 )

GMT+8, 2018-11-14 02:33 , Processed in 0.249155 second(s), 97 queries , Gzip On, Memcache On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表