徐云碧 - 我的科学生涯与 BASIC 编程 | 折腾人生

创业   2024-11-27 21:40   上海  
编辑:智种网
来源:分子育种践行者 徐云碧

2024 年 11 月 12 日,在新罕布什尔州黎巴嫩的一家临终关怀中心,达特茅斯学院数学系教授 Thomas E. Kurtz 与世长辞,享年 96 岁。Kurtz不仅是 BASIC 语言的共同发明人,更是推动计算机教育民主化的先驱者。他的离去让整个计算机界为之动容。

  Professor Thomas Kurtz 

一位程序员在听闻 Thomas E. Kurtz 离世消息后写下了如下简单的 BASIC 代码:

  • 10 PRINT "深切悼念 Thomas E. Kurtz"

  • 20 PRINT "他让编程不再是少数人的专利"

  • 30 PRINT "他的精神永远活在每一个因BASIC走进编程世界的人心中"

  • 40 LET memories = memories + 1

  • 50 GOTO 30


达特茅斯学院在得知这一消息后发表了悼文:“他与 John Kemeny 共同创造的 BASIC 语言,让计算机科学走出象牙塔,走向普通大众。他的贡献将永远铭刻在计算机科学的历史上。” 美国计算机协会(ACM)和国际计算机协会 IEEE 也发表联合声明,特别提到,就在 2021 年,IEEE 还将BASIC 的诞生地列入了里程碑遗址,与爱迪生发明电灯的门洛帕克实验室,以及马可尼发送第一次跨大西洋无线电传输的博洛尼亚山丘并列。


随着计算机技术的发展,DOS 让位给了 Windows 3.1,命令行被图形界面取代,GWBASIC 也演变成了 QBASIC。许多程序员经历了从 BASIC到 CLIPPER,再到 FOXPRO,最后是 MFC 和 Borland C++ 的技术演进过程。正如一位程序员在悼念文章的评论区写道:“一切都始于 BASIC。这是一门神奇的语言。如果没有那段经历,我的人生可能会完全不同。”


Kurtz 的离世恰逢 BASIC 语言诞生 60 周年。1964 年 5 月 1 日,在达特茅斯学院的计算机实验室里,第一个 BASIC 程序开始运行。60 年后的今天,当我们回首这段历史,更能体会到 Kurtz 的远见卓识。CSDN 程序人生 11 月 18 日发表悼念文章:

悼念BASIC语言之父:启蒙数代程序员,让编程不再是少数人的专利

https://mp.weixin.qq.com/s/f6cxbLL6gja66WEevBjPiQ
CSDN 程序人生
BASIC 编程作为软件编程的基础,与今天广为流行和可能主导未来科技的人工智能有着密切的联系。人工智能可以看作是一种特殊的软件编程,它使用算法和数据模型来模拟来实现。


我 1982 年考上硕士研究生之后,开始学习的第一门计算机课程,就是 BASIC 语言。到现在,已经四十多年过去了。回忆自己学习和掌握 BASIC语言及其编程的过程,深感 BASIC 编程对科学研究生涯,特别是 QTL 定位和分子育种的重大影响,忍不住文情大发,写下这些话,与同行和朋友们分享,包括博士项目研究期间达到编程巅峰,随后又在十年磨一剑期间自废武功。相信很多 BASIC 的编友们也有类似的感受和经历。谨以此文,怀念BASIC 语言之父 Thomas E. Kurtz 和纪念 BASIC 语言诞生 60 周年。


一、科技翻译助力BASIC编程


作为改革开放恢复高考后的第二届大学生(抱歉,第一年考文科,被“胡编乱造命题作文”——“学雷锋的故事”给坑了,估计就差几分没能考上(因为那年不公布高考成绩,第二年离高考只有四个月时毅然决定改考理科),我从华中农学院农学系毕业后,1982 年 8 月的某一天,我从武汉乘船沿江而下达到上海。乘船途中,与一位来自芬兰的船友用英文交谈甚欢,让我对未来的科技英语交流充满了信心。哪知一下船我彻底蒙圈了,码头上的上海话广播和周边完全无法交流的上海人,我好不容易才登上了去杭州的绿皮火车。大学本科期间同一专业两个班级 60 多人四年总成绩排名第一、遗传育种专业的研究生考试打败本校考生而名居榜首的我,居然在研究生课程上基本上听不懂绍兴话、宁波话醇厚的任课老师在讲什么,于是有几门课程考试只考了个及格(差不多 60 分万岁啊),成为我人生中最黑暗的年代。我时常抱怨,我的导师硬生生剥夺了我出国留学的机会:看到我写得一手好字,答题如行云流水,“这个考生我要了,出国你们另外派人吧”。当时因为报考出国留学生才选择了浙江农业大学,那几年教育部认定由北京农业大学、南京农业大学和浙江农业大学等几所学校负责代招农口的出国留学生。华中农学院的谢岳峰教授见我本科学业第一,鼓励我报考出国留学,说万一浙江农大录取不了,还可以回华农。是他给我吃了定心丸。


很难想象,一点语言天赋都没有、中国地方话都整不明白的我,居然自信满满地报考出国留学。研究生考试虽然英文考了 83 分,差两分就可以免修英语了,但那是经过四年努力,花费 70% 以上的大学时光专攻英语而获得的哑巴英语,虽然英语广播课程没有少听。出国留学不成,我尝试着如何学好英文,争取在国内也能达到出国留学的目的。


作为硕士研究生(不理解现在为什么现在把研究生特指为硕士生,博士研究生则简称为博士生),真正让我大开眼界的第一门科学课程是“BASIC 语言”,除了通过编程可以让我明白科学需要严谨的逻辑之外(一个标点符号也不能错),还认识到必须用英文一步一步写出严格的指令,让计算机为我们进行运算和输出结果。英语和科学的结合,学习和掌握“BASIC 语言”成为我最初的科学启蒙。后来我给大学生讲遗传学。我说如果你对遗传学或某个专业不感兴趣的话,“没有关系,你只要考试及格就行(那时没有选修课)。但不要浪费自己的时间,可以花时间学好英文和计算机,这是两条腿,有了这两条腿可以随时换专业。”这些话,现在看来依然有效。


读硕期间,除了好好学习计算机编程以外,就是不断提升自己的英语水平,因为我上大学之前的英文水平尚停留在五音不全的“Long live Chairmen Mao”(毛主席万岁)阶段。当时检验和锻炼自己哑巴英语能力的最好方式就是业余承担英译汉的翻译工作。改革开放不久,很多人从ABC 开始学习英文,完全看不懂英文科技文章,那时国家出版了很多由英语翻译过来的科技资源,包括科技著作、论文和文摘。在自身不断努力下,我成为浙江农业大学主办的《农业科技译丛》、中国水稻研究所主办的《国外农学——水稻》以及《水稻文摘》等杂志的业余翻译人员。前两个期刊需要竞争性投稿,而后者则是固定的翻译工作,就是把指定的 Rice Abstracts 中的某一部分翻译成中文。曾几何时,德国出版的《理论与应用遗传学》(Theoretical and Applied Genetics)和美国出版的《植物育种评论》(Plant Breeding Reviews)中的很多论文都被翻译成中文发表(因为这些都是浙江农业大学图书馆少有的几本原版期刊或年鉴,有一种对原版书刊的如饥似渴)。这些业余的翻译工作不仅锻炼了英文翻译能力,同时也得到了一些经济实惠,让我常常为每篇论文获得的 20-30 元翻译稿费而欣喜,因为那时副教授的月工资还不到 100 元。硕士研究生的三年时间,我累计大概翻译了近 30 万字的英译汉论文和文摘。现在看来,我是不是当了几年的冤大头,浪费宝贵的时间去不务正业搞翻译。但当年的科技英语翻译锻炼了自己的文献阅读和写作能力,应该说这事一种受益终身的锻炼,这也是科研能力的重要组成。是一个时代给我们留下的烙印,也是改革开放之后马上出国留学的幸运学子们不可想象的。

  汪向明和冈彦一(作者提供)

科技英语翻译的巅峰时期是翻译几本大部头的英文专著。1984 年 10 月,我有幸在读硕士期间参加了武汉大学遗传学系汪向明教授邀请日本学者冈彦一(H. I. Oka)教授、中国大学发展计划驻武汉大学生物系专家在汉举办的“水稻进化遗传学”讲习班。


  武汉大学“水稻进化遗传学”讲习班1984年10月(作者提供,猜猜徐老师在哪)

在研修期间为同学们翻译讲习班课件受到大家的欢迎,也因此与冈彦一教授成为好朋友。根据冈教授 1985 年 2 月的修订版翻译的《水稻进化遗传学》由浙江农业大学图书馆馆长、农史专家游修龄先生校对、中国水稻研究所 1986 年 5 月正式出版(图1)。这成为我独立翻译的第一部专著。这本书的翻译不仅提升了我的英文能力,也让我有机会全面了解作物的进化以及很多多元统计的研究方法,这为 BASIC 编程水平的提高打下了基础。


  游修龄先生(作者提供)

我本人在英语和水稻进化方面的努力深得游先生的喜欢,硕士毕业时游先生曾劝说我留在他的门下从事农史研究,但因导师申宗坦先生希望我留在他的团队而未果。


  图1 《水稻进化遗传学》中译本及其目录

通过《水稻进化遗传学》与 H.l Oka 教授建立的友谊对后来的学术生涯产生了深远的影响。在 Oka 教授的支持下,我成为国际水稻协会(International Rice Cooperative)最早的几名、也是最年轻的中国会员之一,除了参加该协会的活动之外,每年还能收到协会主办的“水稻遗传通信”(Rice Genetics Newsletter ,RGN)年刊,可以在该刊上发表论文,应邀参加学术活动等。在 Oka 教授的编辑和修改下,我成为国内最早在 RGN 上发表论文的科学家之一,包括国际上第一篇采用了多种统计分析方法的水稻 QTL 作图论文(Xu, Yun-Bi, Zong-Tan Shen, Ji-Chen Xu, Ying Chen and Li-Huang Zhu. 1993. Mapping quantitative trait loci via restriction fragment length polymorphism markers in rice. Rice Genetics Newsletter 10:135-138)其中很多数据分析都是通过 BASIC 语言自己编程完成的。同时也在 Oka 教授的帮助下,有机会在 1989 年 8 月第一次出国,参加在筑波科学城召开的第 6 届 SABRAO 大会(21-25日),在会上提交了平生第一份科技英文墙报——Allelism test for polygenes and its application to plant breeding (Proceedings of the 6th International Congress of SABRAO, p.693-696. Organ. Comm. SABRAO, Tokyo, 1989),后来 allelism 被等同为数量性状同效等位基因的分散分布(dispersed distribution of similar alleles)。这篇论文在现在看来仍然具有重要的现实意义,因为很多初学者依然不太明白为什么两个表型没有差异的亲本也能用于发展群体进行 QTL 作图、为什么在其分离群体中也能发现很多 QTL,这种机制也是导致超亲变异的原因之一。一尘不染的街道和安静祥和的聚集场合成为我第一次出国(Japan之行)所留下的最为深刻的印象,这依然是改革开放高速发展四十多年之后两国之间最大的直观差异。【Oka 教授后来在《水稻进化遗传学》讲义的基础上,撰写和出版了具有重要影响的科技专著《栽培稻的起源》(Origin of Cultivated Rice, Elsevier 1988)】。

  申宗坦先生(作者提供)
《水稻进化遗传学》的翻译,不仅在理论上帮助我理解了有关聚类分析和主成分分析等统计分析方法,也为后来通过 BASIC 编程进行多元统计分析打下了基础。当然这也得益于申宗坦先生在我读硕期间逼迫着我选修数学系本科的很多统计学和数学课程(包括高等数学、线性代数、概率论、多元统计等),为数理统计和计算机编程打下了重要的基础。非常感恩申先生对于数学和多元统计的高瞻远瞩,尽管我觉得自己不是学数学和统计的那块料。如果没有那些训练,我就不会有不同于常人对于经典数量遗传学的深刻认知,也不可能紧紧抓住利用分子标记定位数量性状基因的先机。
  Bruce S. Weir Professor Emeritus , Biostatistics
我主导翻译的第二部重要的科技著作是由数量遗传学家 Bruce Weir 撰写的《遗传数据分析》(Genetic Data Analysis, Sinauer Associates, Inc. Sunderland, MA 1990;徐云碧 王志宁 俞志华 (译) 朱军 (校) 1996. 中国农业出版社,北京;图2)。时任浙江农业大学大学教授的朱军在 Weir 实验室获得博士学位回国后采用这本书作教材,开设了改革开放后农学系第一门博士生英文课程。在职博士修课过程中,我把该书中每一章节后面的所有习题都用 BASIC 语言进行了编程,并和几位修课的学生一道把全书翻译成中文。估计我可以算作精读该书并做到如此程度的第一人。该书中介绍的利用刀切法进行重复抽样分析(jackknife resampling)获得参数估值抽样方差的方法对我的科学研究产生了深刻影响。通过对水稻双列杂交群体的抽样分析和不同发育阶段数量性状的遗传分析,1991 年在《理论与应用遗传学》(Theoretical and Applied Genetics,83:243-249)杂志上发了平生第一篇全英文论文。在当时,国人每年在国外发表的英文论文数量远远低于如今每年发表的 CNS 论文。


  图2 《遗传数据分析》中文版及其目录
有关重复抽样的分析方法,不仅极大地影响了我的 BASIC 编程生涯,也对我的科学方法产生了深远影响。比如,目前正在进行的利用大数据进行重复抽样以确定品种知识产权保护所需检测的分子标记数量、遗传率丢失和基因组选择中预测率丢失等问题。这些都与统计分析和 BASIC 编程有关的训练关系极大。


二、博士论文研究:BASIC编程巅峰时刻

——“分子数量遗传学”在中国诞生


经典数量遗传学采用数量性状的平均数和方差等估计群体的遗传变异,只能估计多个基因的总体效应,而无法把单个基因的效应分解开来,更谈不上把相关性状的基因定位在染色体上。上个世纪八十年代发现的 DNA 限制性片段长度多态性,因为其变异的丰富性,使之很快成为定位数量性状基因的分子标记。利用变异丰富的分子标记,可以把控制数量性状的多个基因分解开来,定位于染色体上,这给走进死胡同的经典数量遗传学带来了新的希望和曙光,也令长期徘徊在经典遗传学边缘的我激动不已,下决心要从事分子标记定位数量性状基因的研究。于是,开始关注每一篇发表的与数量基因定位有关的文献,包括各类遗传标记和数量基因定位方法。特别在 DNA 分子标记之前发展的形态学标记、细胞学标记和蛋白质(同工酶)标记及其在数量基因定位中的应用。植物基因组学之父 Steven D. Tanksley 与 T. J. Orton 编著的《植物遗传育种中的同工酶》(Isozymes in Plant Genetics and Breeding, Part A and Part B, Elsevier, 1983)成为对我的科学生涯影响最大的两册书。通过学习和钻研,从九十年代初开始在国内发表有关分子标记和数量基因定位的综述文章(徐云碧 1992 分子标记在数量基因定位中的应用。遗传 14(2):45-48。徐云碧 1993 发展中的遗传学分支学科-分子数量遗传学。遗传学基础理论问题讨论文集,北京师范大学出版社,第152-166页)。


在我如饥似渴地学习利用经典标记进行数量性状基因定位的同时,积极在国内联系可以接纳我从事在职博士研究的机构和指导教师。80 年代末期,在洛克菲勒基金会生物技术项目 Career Fellowship 的资助下,中国科学院遗传研究所的朱立煌先生开始在康奈尔大学 Tanksley 实验室进修分子标记技术,并很快成为国内最早开始分子标记应用研究的少数专家之一。我的数量遗传学功底以及利用分子标记进行水稻数量性状基因定位的相关设想,得到了朱先生的首肯,并很快得以来回穿梭在北京和杭州之间,一边教学,一边从事博士论文研究。


利用分子标记进行数量性状的基因定位,就必须利用覆盖全基因组、足够数量的分子标记对足够大的植物分离群体进行基因型检测。当时在国内,分子标记技术引入不久,很多研究都是利用少数标记对为数不多的遗传或育种材料进行变异或多样性分析。要在国内开展大规模 RFLP 分析困难重重,不仅很多试剂包括限制性内切酶需要从国外进口,放射性同位素稀缺,RFLP探针也是通过国际合作从国外引进。但是,决心和志向让我成为国内利用RFLP 进行水稻群体分析和 QTL 定位的第一人。朱老师逢人就说,“徐云碧够勇敢,居然要做群体的 RFLP 分析。”


利用群体开展分子标记分析的想法一发不可收拾,除了利用水稻的籼粳交组合窄叶青 8 号/京系 17 所产生的 F2 作为主要工作群体外,还与遗传所陈英老师合作利用同一组合的双单倍体(DH)群体开展无性系变异的研究以及 F2 和 DH 群体的比较分析(图3)。陈老师长期从事水稻组织培养的研究,积累了大量研究经验和遗传材料。分子标记技术似如虎添翼,可以用于分析很多组织培养所产生的材料,包括 DH 系及其群体。当年采用花粉培养,在小麦和水稻等很多作物中,实现了单倍体育种。但这些自花授粉作物的DH育种迄今仍然没有达到异花授粉作物玉米的广泛应用程度。究其原因,还是因为自花授粉作物容易通过连续自交达到稳定纯合的状态,而花粉培养需要在常规育种的基础上多出一些人员和设施的投入,自交纯合只需要种种收收这种简单的重复操作即可完成。然而,近年来,随着土地和用工成本的急剧增加以及对于快速育种需求的增加,采用玉米的单倍体诱导基因进行基因编辑的DH育种技术可能性增加,大规模 DH 育种有望在未来成为所有作物,包括自花授粉作物的重要育种途径。


  图3 徐云碧博士论文及其目录
有关多群体的接触和工作,对后来发展植物遗传育种的群体概念帮助极大。多群体概念很快从 F2 和 DH 等双亲群体开始,逐步扩大到数量遗传群体和多亲本群体,使《分子数量遗传学》以及后来《分子植物育种》中关于群体的一章成为读者的最爱。有关群体概念的认识和发展,也为利用多元统计方法进行群体遗传分析和 BASIC 编程打下了坚实的基础。


因为在数量遗传学与育种方面的坚实基础,也因为对分子标记技术的情有独钟,我博士期间在遗传所的工作很快得到时任所长陈受宜研究员的赏识。她建议我为遗传所的学生和员工主办“数量遗传的分子基础”专题讲座(1992 年 3-8 月)。于是就有了一段传奇:一个博士没有毕业的地方院校讲师,居然应邀在中国科学院举办连续十讲的系列讲座。记得讲座开始那天,报告厅内部和厅外的走廊上挤满了看热闹的人们,要看看主讲人究竟是何方神圣。

连续十讲的数量遗传分子基础,其讲义打印出来,就是一本厚厚的小册子,颇受大家的欢迎。1992 年 10 月在浙江农业大学硕士研究生开设了“数量遗传的分子基础”专题讲座。等到博士研究项目完成,掌握了分子标记和数量性状的第一手资料,通过 BASIC 编程,完成了包括 QTL 定位的全部分析软件的编制,并获得了不同 QTL 定位方法的第一套实例(图3)。


鉴于同行对于讲座的厚爱,以及亲手累积的大量第一手资料,于是我决定把系列讲座写成一本书,取名为“分子数量遗传学”。这是国际上第一本以此为名的科学专著,不仅扩充了“数量遗传的分子基础”系列讲座的内容,而且全面介绍了本人有关水稻数量性状基因(QTL)定位的各种分析方法。通过 BASIC 编程,在个人电脑上实现各种 QTL 分析和定位,取代了当时国际上流行 QTL Mapmaker 软件。所有相关的 BASIC 程序都作为附件罗列在《分子数量遗传学》专著中(图4)。


  图4 《分子数量遗传学》及其目录
利用分子标记进行数量性状基因(QTL)定位,当时在国内很少有单位开展。我有关水稻的系列研究成为国内主要刊物争相发表的内容。把博士论文按照 QTL 定位方法、性状、计算机编程等进行细分,分别发表了八篇论文(当时国内很少发英文论文,很多高校只需要在国家一级学报上发表两篇论文就可以晋升副高级职称)。这些论文的发表使我成为国内 QTL 作图的第一人。同时采用 BASIC 编程,分析了各种 QTL 作图方法及其影响因素,并进行了 QTL 特性的蒙特卡罗模拟(图5)。其中 QTL 区间作图法是当时及随后很长一段时间成为 QTL 作图最为常用的经典方法(图6)。


  图5 根据徐云碧博士论文研究发表的相关论文
  图6 QTL区间作图法的核心及其BASIC程序
八篇国内首发的 QTL 研究论文、系列讲座以及第一部《分子数量遗传学》专著,一时让自己风声鹤唳,加上女性化的名字,当时的我被很多未曾蒙面的人误认为是一位五十多岁的老太太。(小编注:LOL,我在读这段的时候的感受.jpg)

  陈受宜与朱立煌(作者提供)

因为系列讲座的成功以及首次利用分子标记进行的一系列数量性状的基因定位,时任遗传研究所所长陈受宜和学术委员会主任朱立煌两位老师极力劝说我毕业后到遗传所工作。此处省略 500 字… …。因为调动工作未果,两位老师建议我争取去国外进修或做博士后。正好当时水稻生物技术项目在洛克菲勒基金会的资助下每年为发展中国家的科学家去发达国家去做博士、博士后和高级访问学者提供帮助。这些需要本人申请、国内选送单位和国外接受单位的支持。很快康奈尔大学的Tanksley博士接受朱立煌老师的推荐,同意接受我做博士后。这样我就拿到了洛克菲勒的博士后全额奖学金(Rockefeller Foundation postdoctoral fellowship in plant breeding and genetics, for advanced study under the direction of Dr. Steven Tanksley, Department of Plant Breeding and Biometry, Cornell University)。


虽然 1994 年 9 月就拿到了洛克菲勒的博士后奖学金,但我还是决定把《分子数量遗传学》的写作任务完成后再出国,当时在很多人看来是一件不可思议的事情。为了加快进度,除了加班加点写作之外,还专门购买了农学系第一台激光打印机,准备文稿打印后直接照相排版,省去排版和校对的程序。当时的文字处理软件是 WPS,那时的版本编辑数学公式的能力很差,特别是上角和下角字体很小,常常看不太清楚。就这样凑合着激光打印后照排。写完和打印完书稿,粘贴好没法编排的图表,交给出版社,关照我招收的第一位硕士生(熊兆飞),在专著出版后寄送给相关的专家、各个农业大学和省农业科学院的图书馆。没等专著印刷出版我就出国了,而且一去就是多年。于是,很多后来从事 QTL 定位的同行,看到我发表的系列论文以及出版的专著,仿佛这位作者从地球上消失了一般。直到若干年后回到中国,很多同行才惊讶地发现,当年的所谓女性大咖,如今只是一位四十多岁的男士!(小编注:大笑.jpg)


三、《分子植物育种》与计算机编程自废武功


康奈尔大学博士后研究结束后,我在美国水稻技术公司(RiceTec, Inc.)找到一份分子育种的工作,期间有机会回到国内访问和交流。当很多陌生人见到仿佛从地球上消失的我,好奇地聊起那本书——《分子数量遗传学》,除了赞赏有嘉外,非常关心该书是否再版或更新。很多认识的朋友也告诉我,该书成为很多大学的教学参考书,年轻一代人就是读着这本书长大的。看到当年匆忙中撰写的《分子数量遗传学》受到如此的欢迎,我开始考虑把这一领域与植物育种结合起来,写一本理论与实践相结合的英文专著,让更多国家的科技人员受益。


于是我大约从 2000 年开始思考英文专著的撰写。2001 年 10 月底, 我完成了一个书名为“Plant Molecular Breeding”的写作大纲,开始联系英国的出版社 CABI Publisher。出版社请两位专家进行专著建议书的评审。12 月收到两位专家的评审意见。除了肯定我的建议大纲令人感兴趣以外,一位评审专家认为以我当时的英文写作水平,出版社编辑将要花费许多额外的时间进行语言润色,因此建议找一位母语是英文的合作者,与我一道完成专著的写作。另一位评审专家则建议把专著的名称改为“Molecular Plant Breeding”, 因为 Plant Breeding 是一门非常成熟的学科,Molecular 只是对其提供一些修饰和改良,并没有改变Plant Breeding 的根基。一开始,我觉得 Molecular Plant Breeding比较拗口,但在内心反复默念了一百遍之后,开始接受了这个更改的建议。如果您和我一样,一开始不能接受这个书名,那就在内心里默诵 100 遍吧。


  肖金华博士、Susan McCouch和作者(Jan. 11,2010. PGA Conference,作者提供)

为了寻找英语是母语的合作者,我几经周折,与出版社反复商量,最后邀请当时在孟山都公司工作的肖金华博士和我的博士后合作导师 Susan McCouch 作为共同作者,于 2002 年 3 月与 CABI 签署了正式的出版协议。在理论上,所有章节都有我执笔起草,两位合作者提供文稿的修改补充意见并进行语言润色。原计划 2003 年 9 月 30 日完成并交付的书稿,因为工作量巨大以及工作变更等诸多原因未能按时完成。出版社最终给予了无限期延期的许可,直到完成时为止。

2004 年,肖金华博士因为研究工作繁忙而申请退出。2005 年,当我把完成的几章初稿提交给 Susan 润色时,看到每一章的书稿分量是如此之大,她婉言表示没有时间来完成全部书稿的润色。于是,我又重新给 CABI 提出请求,希望能够让我独立撰写。鉴于我在过去几年在国际杂志上发表了多篇英文研究论文,同时独立发表了多篇长篇评论和综述文章,包括国际会议专辑论文(Xu. 2002. Global view of QTL — rice as a model)和长达 102 页的 Plant Breeding Reviews 年鉴论文 (Xu. 2003. Developing marker-assisted selection strategies for breeding hybrid rice. Plant Breeding Reviews 23: 73-174),CABI 最终同意由我一人单独撰写,并于2006年2月重新签订了出版协议。


  诺贝尔奖获得者布拉格
2006 年 3 月我有幸加盟国际玉米小麦改良中心(CIMMYT),担任玉米分子育种高级科学家。这为专著的独立撰写提供了一个更加合适的平台。CIMMYT 的工作岗位让我对分子育种有了更深、更全面的理解,并开始逐渐认识到分子育种实践中所面临的诸多挑战和问题。CIMMYT 也为广泛的国际合作和交流、深入了解不同国家和种业公司的育种现状提供了机会。在CIMMYT 常常与诺贝尔奖获得者布拉格(Norman E. Borlaug)博士一起早餐;通过国际交流,我结识了很多相关领域的专家学者,包括美国科学院院士、植物基因组学领域的知名科学家 Ronald L. Phillips。这两位著名学者后来为 Molecular Plant Breeding 专门撰写了前言。


  Ronald L. Phillips
在专著作写作期间,分子育种的很多领域快速发展。当专著的初稿完成时,前面完成的书稿已经有些过时了,于是开始对每章书稿进行逐一更新。15 章书稿,半个月更新一章,一轮下来,最早更新的章节又该要更新了。最终在 2009 年 1 月提交了全部书稿,2010 年正式出版(图7)。Molecular Plant Breeding 从开始计划到正式出版,花了整整十年时间,真是十年磨一剑。十年时间,我把全部的周末、节假日以及所有可能利用的时间都用在了这本专著的撰写上。当我把书稿完成,把写好的前言寄给Susan 提意见时。她发自肺腑说了一段话:“… 我含着眼泪读完了你撰写的前言,我被深深地打动。如此巨大的努力和付出,我希望你一辈子只经历一次, … … ”。


  图7 《分子植物育种》及其目录
十年磨一剑,铸就了一部具有广泛国际影响的巨著(欧美很多大学用作教学参考书,被翻译成中文和波斯文出版),这不仅受益于我对于复杂数学运算和统计分析的理解,也因为 BASIC 编程所训练的强大的逻辑思维能力。但长期关注写作也彻底废弃了我的软件编程。在我专注写作的十年期间,软件编程领域发生革命性的变化。因为强调实用性,我专注于 BASIC 语言或其演化版本 Quick BASIC 而没有与时俱进学习 C 语言和 C++ 等,也没有继续学习和应用新的编程软件和工具。同时,在科学研究上开始依赖研究生和博士后从事具体工作,主要靠使用现存的服务和科技软件来进行分析和研究,因此渐渐地被现代软件编程技术甩在了后面。


四、计算机编程:苦乐均在其中


科学研究和软件编程可以相互促进,共同进步。我的科学生涯受益于BASIC 编程,但在编程的路上虽然收益颇多,但没有能够走的更远。编程经历告诉我,只有理解不了的科学问题,没有无法编程的科学计算;编程过程是一个理解科学问题的过程;没有对科学问题的彻底理解,就无法准确编程。而计算机编程及其所涉及的科学研究,苦在其中,乐也在其中。


我们现在广泛使用的 SAS 软件和一些其他统计分析软件,提供了大量最基本的统计分析的计算机工具。可是在上个世纪八十年代,改革开放之初,我们还没有与国际接轨,因为经济落后,太贵的软件我们也买不起。因此很多的基础统计分析,包括方差分析、回归分析、相关分析都靠自己编程来完成,那些涉及多元统计的复杂分析就更不用说了。在浙江农业大学农学系,我的导师申宗坦教授对新技术非常敏感,是农学系最早买电脑的。记得当时购买了第一台长城 0520 电脑,可以开始编程和基本运算。但遇到比较复杂的多元分析,就要到学校的中心实验室去借用功率较大的电脑,后来采用功能更加强大一些的 PC386 和 PC486 微机(图8)。记得我的硕士论文要分析水稻异交率的影响因素,期间聚类分析与主成分分析就是依靠全校共享的中心实验室。那时候电脑很宝贝,要放在有空调没有灰尘的电脑房里。为了充分利用,我经常夜不归宿地待在电脑房里。随着聚类分析时电脑屏幕上显示的每一个字节跳动每一步运算而激动不已。也时而为一段电脑程序的优化绞尽脑汁,时而为一个电脑程序缺陷(bug)的消除而彻夜难眠。我一生中少见的失眠都出现在那个年代。也因此,我与学校中心实验室的老师们混得很熟悉。那时能够编程,能够让电脑 24 小时不停地运算常常被看成为一件很了不起的事情。那时需要一昼夜才能完成的分析,现在大概只需要几秒钟甚至更短时间就能完成了。


  图8 在浙江农业大学期间从事的与 BASIC 编程有关的研究
我佩服那些对数学、统计学、智能模拟等方面的问题都能编程自如的同行们,因为他们是真正弄懂了相关问题的根本,否则无法编程。比如,对于QTL 作图,编程过程必须真正理解 LOD  的正确含义,才能计算出 LOD值,很多使用商用软件进行 QTL 作图的人,常常对 LOD 相关概念一知半解。记得我加盟 CIMMYT 后第一次招收分子育种的博士后,我提问关于QTL 作图中的 LOD 概念,三位候选人中只有一位的回答勉强合格。定位和发表了一大堆 QTL,在表格中罗列过一大堆 LOD 值的专家们,都需要问一下自己对 LOD 值背后的意义了解了多少。


我从事博士后研究的 Susan 实验室的主要研究方向是水稻。那些年在洛克菲勒基金会的资助下,大批来自亚洲国家的留学生和访问学者来到实验室从事水稻生物技术研究,实验室里充满着讲中文、日文和韩文的人。同时,Susan 实验室积累了来自全球各地、不同群体的标记数据,是分析和比较标记偏分离的最佳材料。在实验室里有一位难得一见的白人学生,被我们中国人戏称为小白脸。有一天,小白脸看见我在计算机上鼓捣 BASIC 程序,就问我在干什么。我说在编程定位 QTL。小白脸惊大双眼看着我,不是有现成的 QTL Mapmaker 吗?我告诉他对于多个群体的比较分析和一些附加分析,输出结果的比较不太方便,还是自己编程比较好。直到有关利用多个群体进行偏分离比较分析的结果以极快的速度完成并发在 Molecular and General Genetics 上 (目前该篇论文已获得了 600 余次的引用,成为高被引论文之一),小白脸彻底改变了对我的看法,至今我们仍然是经常联系的好朋友。也因为如此,Susan 在我三年的博士后期间基本上对我放任自流,但我虽优哉游哉,却是实验室产出最高的研修人员之一。这些都源于我的知识背景和 BASIC 编程的功底。


从研究生到法律上退休,回顾我一生走过的路、工作过的不同机构、经历过的不同科学研究,每换一个地方都实现了一个跨越。在浙江农业大学,在先生的逼迫下钻研数学和统计,助力我深刻地理解了经典的数量遗传学极其发展瓶颈,通过与中国科学院遗传研究所合作,在朱立煌老师的支持下、抓住了利用分子标记进行数量基因定位的先机。BASIC 编程让我如虎添翼。遗传所为我提供的“数量遗传的分子基础”系列讲座平台成为撰写《分子数量遗传学》、BASIC 编程达到巅峰的助推器。在遗传所的博士论文研究,让我有机会获得洛克菲勒基金会的博士后奖学金去康奈尔大学进修和深造。在那里,我学习了以PCR为基础的微卫星标记和荧光标记,实现了分子标记技术的跨越。在那里我的 BASIC 编程能力和分子数量遗传学功底给了我巨大的竞争优势,在很多中国同学或访问学者看来,我就是一颗闪闪发光的金子,完全没有必要在康奈尔大学再读一个博士给金子身上镀铜,这也是为什么我一直以浙江农业大学的土博士为荣而没有再读一个洋博士。同时因为与RiceTec 在博士后期间的成功合作,为后来在公司从事水稻分子育种工作打下了基础。我的英语能力也从刚开始进入康奈尔大学时连电话都不敢,到RiceTec 工作后因为中国人很少而英语口语能力得到加强。从分子数量遗传到分子植物育种,CIMMYT 为我提供了更加宽广的舞台,应用于作物育种的分子标记也从 SSR 发展到了 SNP,并发展了第一款玉米的 SNP 固相芯片。同时,国际合作、交流和培训的能力得到显著提升。因为中国农业科学院-CIMMYT 的国际合作关系,2010 年我以 CIMMYT 高级科学家的身份回到国内,得到作物科学研究所的大力支持。在过去 15 年间,努力践行分子育种,期间的许多经历和收获无法在此细数,待专文回顾。


【结语】

在结束本文之前,我想说,计算机编程,对于我来说是 BASIC 编程,对于我的科研生涯,直接和间接的影响是巨大的。潜在影响还包括对逻辑思维能力的训练和提高。计算机编程中我遇到的最大挑战是逻辑判断及其运算,而不是有“章”可循的数学计算和统计分析。认识自己、认识世界、认识人和事,都需要基本的逻辑和判断。数学、统计学、逻辑学的训练对于科学研究的重要性毋容置疑。在自媒体泛滥的今天更需要明辨是非,也更需要最基本的逻辑训练。我曾经把英文和计算机技术比作是我们的两条腿。而计算机编程用的是英语,毫无疑问,英语和编程在科学研究中的重要性怎么强调也不过分。也可以想象在编程中使用中文将会遭遇到多么大的困难。虽然目前有几种类型的中文编程语言,但真正自主研发了汉语编程的脚本语言还为数极少。创新一种可以用纯中文背景+纯中文语言编程的计算机语言是年轻一代国人的使命。在超级人工智能来到之前,在人工智能将逐步取代人类劳动和创作的今天以及不远的将来,具备计算机编程能力,可以帮助我们更好的理解和使用各种智能软件和工具。


小编注:
读了徐老师的文章,觉得没有把 BASIC 编程学好,真的是非常非常遗憾!于是我做了一些 homework ,把徐老师文章中提到的几本书整理了一下,如有需要的,加我微信 leafsword 获取。以此,向徐老师致敬。
Cam

-- 小福利 --
我整理了徐老师在文中提到的几本书:
1)H. I. Oka 《Origin of Cultivated Rice》
2)徐云碧译等 《 水稻进化遗传学》
3)Bruce Weir 《 Genetic Data Analysis》
4)徐云碧译等 《 遗传学数据分析 - 群体遗传学离散型数据分析方法》
5)徐云碧 朱立煌《分子数量遗传学》
6)Yunbi Xu 《Molecular Plant Breeding》
欢迎关注和转发,加微信 leafsword 获取上述资料。

编辑@新锐恒丰研究院

联系: novoseed@163.com 

智种网NOVOSEED
“智种网”,专业打造玉米研发产品互通第一平台,致力于引导完善行业知识产权应用;利用互联网+,实现研发产品分段商品化的双向互通;尊重知识产权,使研发产品互通充分商业化。助推玉米研发领域的快速提升和发展!
 最新文章