图书馆里的清洁工 少林寺里的扫地僧

《Data Mining》翻译工作安排

全书概览

《Data Mining》一书由Charu C.Aggarwal所著,出版于2015年4月14日,目前没有引进中国,亚马逊原版教材售价约为350元(会员价,非会员1000+)。豆瓣无评分,亚马逊评分4星(5星满分),从CSDN社区一些讨论情况来看,普遍认为本书质量较高。故我们选取本书进行翻译,旨在帮助更多中国学习者阅读优秀教材。

全书共有20章,743页,内容详细,逻辑严谨,其中包含大量图表与公式。

协作方案

Markdown是当前比较流行的轻量级标记语言,适合快速简便的编辑出高质量的文本。

本团队采用Markdown进行写作。目前有30左右加入团队。
初步分工

  • 20-23人进行专职翻译
  • 将全书分为3个部分,由3人担任小组长,负责督促本组的进度
  • 3人负责翻译过程中的技术支持
  • 3人负责最终成书的统稿校对

按照自愿报名原则,鼓励能者多劳,即一人可以参加全部上述四个流程。

技术难点

  1. Markdown使用,考虑到本团队所有成员均为985院校硕(博)士,初步认为即使没有Markdown基础,也可以快速上手
  2. 英语水平,提倡采用Google翻译,毕竟是人类智慧的精华,但是要求机翻之后必须有检查。
  3. 公式编辑,Markdown支持LaTeX的公式书写,所以本书公式全部采用LaTeX语法进行书写,部分同学可能不太熟悉,由技术团队提供支持
  4. 图、表插入,为了节省时间,本书不再对原书图表进行重绘,图表以及其编号保持与原书一致。但是Markdown中的图表与Word不一样,不是嵌在文件中的,而是一个路径指向一个图片文件,这种做法在生成PDF之后倒看不出来,但是直接分享.md源文件时就会出现问题(比如,写一个Python或者C程序中读取了一个文件,是通过一个路径指向这个文件,那么分享的时候需要把这个文件也带上)。目前在互联网博客中,主流的解决方案是采用图床(相当于一个云盘,把图片存里面)然后在Markdown文件中放该图片对应的url地址。这部分解决起来稍麻烦,在前期工作中可以先跳过,主要翻译文字和公式。

进度安排

全书翻译计划时间为4周。2018.4.23-2018.5.20

  • 4.23-5.6,主要进行翻译核心工作,文字和公式部分的翻译。
  • 5.7-5.13,主要进行统稿工作。汇总各人的工作,帮助部分同学解决图片插入问题。形成初稿。
  • 5.14-5.20,主要进行校对工作。检查翻译质量,校对公式正误,最终成书。

具体分工

章节 负责人
1 李尧
2 程琳
3 朱广阳
4 曹春,张巍烨
5 徐建秋
6 杨天威,刘丹阳
7 张万龙
8 司呈呈
9 王俊
10 刘立新,于雷
11 彭龙,吴旭桥
12 张伟,朱锦锟
13 李建鹏
14 逯旺旺,李泰立
15 贺亮,蒋孝卿
16 张宇
17 朱向典
18 杨山,刘仲康
19 赵纳森,王建秋
20 宋宇

其余人员

小组长 技术组 校对组
李尧(1-6章) 李尧 刘蕾
王俊(7-13章) 程琳 孙旭
蒋孝卿(14-20章) 陈南宇 李楚茵
柯达 李润浩
程煜 杨刚

成果

电子书网站:数据挖掘

2019.11.14 由于七牛云的图床挂掉了,这个网站目前很多图片已经无法显示,不失是一种遗憾。