自然语言(人类语言)与编程语言之间有着很多惊人的相似之处。前些天我做了一个关于这两种语言相似性的讨论,惊讶地发现自己很容易就找到了它们之间的许多共同点。
然而实际上,两种语言之间具有如此多的相同之处也尚在情理之中,这两种形式的语言都是非常基础层面上的语言,它们本质上是为同一个目的服务的——那就是沟通。尤其是用来沟通思想和表达方式,有时也可以用来传达指令。
编程语言之间的相似之处比人们乍看上去的还要多得多。这意味着如果你很了解某一门编程语言,学习其他编程语言(至少同类型的编程语言)就变得十分容易。最开始的两种语言是最难学的,但是从学习第三门语言开始就会变得越来越轻松。
这其实与自然语言没什么不同。如果你会说英语,学习其他印欧语系的语言(比如法语和西班牙语)就会比较容易。然而,了解英语对于学习印欧语系以外的语言帮助就没有那么大了——比如印地语、阿拉伯语或者日语,它们与英语、法语相比有着显著的不同。
我的编程语言学习经历就是一个很好的例子。最开始学习的两门编程语言是BASIC和PHP,学完这两种语言之后,再学习其它类似的语言,比如C、C++、C#、MATLAB、Javascript、Ruby和Python就易如反掌了,我只需要了解它们之间的区别就好了。然而,学习它们圈外的语言时就得小心了,比如 LISP/Scheme、 AMPL、 SQL、 Regex和Dart,这种感觉就像一个已经说了25年英语的人去学习日语一样。
幸运的是,你懂得的语言越多,学习一门新语言就会越容易。在已经很好地掌握一门编程语言的基础之上,如果你愿意再花点儿时间做些必要的练习,你就可以很容易地同时掌握多门编程语言了。另外,你了解的语言种类越丰富,学习新语言也会越轻松。
这也就是为什么好的软件公司在招人的时候并不十分介意你是否已经掌握了他们所需的编程语言技能,他们会转而去看你了解多少门编程语言,期望在你的简历上看到你已经掌握了许多足够多样化的编程语言,此时学习一门新语言对于你来说并非难事。
21世纪程序员之间关于语言的一大争论就是:同时掌握多种编程语言与学习一门新的自然语言之间是否有互相促进的作用。坊间传闻和一些经验表明:优秀的程序员通常可以讲一口标准的英语,反之却不一定成立。关于这一点人们尚未达成共识,但是我们可以肯定的是,掌握更多的语言没有什么坏处。毕竟,你的思维广度是你所了解的所有语言的交集。
编程语言不能与算法混为一谈。精通Java并不意味着你就明白如何在不调用内置方法的情况下对一组数进行排序。算法之于编程语言,就同思维之于自然语言的关系一样。编程语言只是一种表达算法的手段,一组计算机需要执行的指令。同样地,我们使用自然语言来表达自己的思想,或者传达一条命令给其他人。
然而与人类语言不同的是,我们一般不会通过诗歌向计算机传情达意,因为计算机不知道如何对诗歌做出响应。如果不是一条确切的指令,计算机就会选择忽略它。
如果你说自己很了解一门编程语言,这意味着什么呢?这仅仅说明你经常使用这门语言并且用的很熟练吗?也许吧,但这并不是全部。诚然,熟能生巧,语言用得越多就越熟练。但究其原因是因为不断地练习会让你对语言的基本表达非常的熟悉。例如,控制结构可能是任何一门编程语言中最基本的概念——诸如if, then, else, while. do/while, foreach, goto, blocks, yields等等。了解一门编程语言意味着你了解如何在程序中自如地使用这些控制结构和控制流来表达思想。
不同编程语言之间的语法可能会有些许不同,但是编程语言之间基本的表达式大体是一样的。就像在所有的人类语言当中,讲话最基本的部分是一致的——名词(包括性别与数量),动词,形容词,副词等。但从表象上来看,它们在不同的语言中都不一样。
我对发明新的编程语言有着十分浓厚的兴趣。为什么有人会想要去发明一门新的编程语言呢?自然语言,由于其本身的定义,是自然产生的。它们源于人类之间相互交流的需求。并没有一群人坐在一起像制定委员会章程那样来制定一门语言的规则。好吧,的确有人做过这样的尝试,但是以彻底的失败而告终,那就是“世界语”。
另一方面,计算机语言的发明是用来满足人类与计算机交流的需要。因此,编程语言的能力是由你给计算机指令的复杂程度和完备程度所决定的。所以,人们会认为一门具有高级概念(比如递归,闭包和匿名函数)的编程语言比那些没有这些概念的编程语言更加强大。就像一门含有代词和感叹词的语言要优于没有这些概念的语言一样。
一门编程语言能力的大小在很大程度上也取决于传达指令效率的高下。现在,简洁的语言可以提升开发人员的效率,从而比那些冗长复杂的语言更受欢迎。然而,过分简洁的语言可能会存在问题,因为他们在未来会变得更加难以维护。可维护性是十分重要的,因为几乎90%以上的编码工作是用来向现有程序中添加特性的,而不是开发新的程序。一门没人愿意使用的编程语言能好到哪去?
在编程语言的表达能力和简洁程度上做出权衡是一门艺术。程序语言设计师在做出有关语言特征集的复杂性,同时还要保持简洁无歧义的重要决策时,常常会感到战战兢兢,如临深渊,如履薄冰。
对编程语言从哪里来这个问题感到好奇吗?编程语言的来源有很多。它们可能来源于一个学校计算机科学课程的编译器项目,后来逐渐演变成了一门语言。就像Linux一样,曾经是Torvald的课堂项目,后来开放了源码。
一些程序员,尤其是那些疯狂的(优秀的)程序员,以设计编程语言为乐趣。一部分原因是因为设计优秀的编程语言非常具有挑战性,另一部分原因是因为到最后可能会因此带来非常可观的收益。由于设计者没有任何时间压力,这些兴趣之作最后往往演变为非常优秀的语言。设计者可以花尽可能多的时间来为他们的语言做出正确的决策。而与这些兴趣爱好者不同的是,一些人有偿地为大公司设计编程语言,比如Google(Dart),Microsoft(C#)和Sun(Java)。
谈到自然语言与编程语言之间的差异,编程语言比自然语言更加严格,对错误的容许程度更低。这是因为人类语言具有显著的内置冗余机制,容许我们使用上下文来消除歧义。编程语言几乎没有冗余,因为这对于编写语言编译器的人们来说是额外的工作。英语在内置冗余性方面尤其臭名昭著。你可以很容易地在去掉30%的单词(过滤掉介词、连词和冠词等词汇),删掉所有的元音字母,打乱一个单词内除首尾字母外所有单词的顺序的情况下仍然能够表达清楚你想说的意思。
编程语言相较于人类语言更加严格这个事实没什么可惊讶的。计算机对于拟接收的指令要求非常的精确严谨。此外,计算机没有接受过像人类那样的消除表达歧义的训练。所以在很多方面,一门编程语言的优劣也可以由程序员编程时出错(也就是bug)的概率来衡量。
基于以上这些原因,编程语言实际上是由一个或者一群高端人才从零开始设计出来的。由于常常事关重大,编程语言设计失败的成本是非常高的。特别是当你知道你的语言可能会被用于驱动交通灯控制、国际空间站机械臂、NASA的火箭、核弹头,核磁共振机,亦或是你的下一款Facebook游戏的时候。你肯定不会乐意自己Farmville中的奶牛会随机消失吧?
注:FarmVille(台湾翻译为农场乡村)是一个社交网络服务网站Facebook上的农场模拟游戏,由Zynga公司开发,在游戏中Facebook的用户有一个虚拟的农场,可以种植及收成虚拟的作物、树木及动物,用户也可以拜访其他用户的农场。
原文链接:http://meetrajesh.com/archives/natural-vs-programming-languages.html by RAJESH KUMAR
本文链接:http://bookshadow.com/weblog/2014/02/14/natural-vs-programming/
请尊重作者的劳动成果,转载请注明出处!书影博客保留对文章的所有权利。