04月06, 2010

浅谈数据抽象、过程抽象与泛型(一)

现代计算机语言很关注问题的数据层面,高级语言提供了很强大的数据抽象能力。例如面向过程的语言提供了对数据操作流程的抽象,而面向对象的语言则更进一步提供了构造对象、封装以及继承等能力。对于JavaScript而言,原型机制也是一种相当灵活的抽象数据的工具。

如果说数据抽象是与现代程序设计发展相匹配的语言能力的扩充,那么对过程的抽象或许是被现代程序设计所忽略的一种能力。范型成为一种模式,而不是一个根本的语言核心上的本质特征,至少主流语言从语法层面上对过程抽象的支持很少,这一点不得不说是一种遗憾。

我们说数学是定义问题和赋予符号,而计算是描述过程,过程抽象既是将过程用符号来表示,它是将数学和计算统一起来的工具。

举一个简单的例子,我们说乘方“pow”是一个过程,事实上它可以用一组乘法“mul”过程来描述。在数学表达层面上,我们并不关心pow和mul的数据对象是什么类型,而这在计算机语言中,通常被弱化为某种基本数据类型(例如浮点数)的基本运算操作。

在JavaScript中,Math.pow函数提供了计算浮点数乘方的功能,但是如果我们需要计算向量或矩阵的乘方,那么就需要另外去实现一个pow方法,或者说,Math.pow在过程上的抽象程度是很低的。

在表达数学问题上,我们可能会用一种超越数据类型的符号表示方法,比如我们定义乘方这个操作——

define D pow E ->
    E < 0 and normalize D div (D pow -E),
    E = 0 and normalize D,
    E > 0 and
        E rem 2 and D mul (D pow (E-1)),
        or (D mul D) pow (E div 2).

这种描述一气呵成,我们在这个问题领域内并没有深究and、 div、rem、 mul、 normalize等计算的实现,而仅仅是用符号来描述。当然并不影响过程定义本身的完备性,只是,这些符号还不能被解释成具体的可操作的步骤。下面我们来规定它——

defind A and B ->
    A && B.
define A div B ->
    (A - (A rem B)) / B.
define A rem B ->
    A % B.
define A mul B ->
    A * B.
define normalize A ->
    1.

好,现在我们分别赋予了计算符号本身的意思,但是说到这里也没有什么特别之处,因为我们只是描述了过程而没有去描述数据模型的结构。例如普通来说,A mul B等同于A * B,这几乎是废话,但是如果A、B是二阶矩阵的时候,一切就有了变化:

define [[X11,X12],[X21,X22]] mul [[Y11,Y12],[Y21,Y22]] ->
         [[X11 * Y11 + X12 * Y21, X11 * Y12 + X12 * Y22],
          [X21 * Y11 + X22 * Y21, X21 * Y12 + X22 * Y22]].
define normalize [[X11,X12],[X21,X22]] ->
        [[1,0],[0,1]].

在这里我特别定义了一个二阶矩阵的mul和normalize方法,一个二阶矩阵是一个具有形如[[X11,X12],[X21,X22]]结构的二维数组。这个定义完成之后,你会发现pow对于矩阵来说几乎完全适用(可能还要额外定义一下div),而这是过程抽象的好处所带来的。

如果语言支持,实际上多定义一层mul是完全没必要的,可以直接

define [[X11,X12],[X21,X22]] * [[Y11,Y12],[Y21,Y22]] ->
         [[X11 * Y11 + X12 * Y21, X11 * Y12 + X12 * Y22],
          [X21 * Y11 + X22 * Y21, X21 * Y12 + X22 * Y22]].

如果这样的话,语言就具有了同数据类型抽象相匹配的过程抽象能力,但很遗憾,目前大多数语言并不从语法层面上具备这种抽象能力(也许erlang比较接近,这篇文章里的伪代码也是类似erlang语法的),所以前面描述的这些东西,是不能够这样被直接实现的,但是,这只是一个开始,我们将在后续的文章里逐步深入介绍怎样改造程序的模式甚至怎样设计一种新的语言,以达到数据和过程抽象相匹配的符号表达能力。

最后,用一个简单实例结束这篇文章,下面的过程直接调用pow计算菲波纳契数列,具体的原理留待下一篇文章解释——

define fib N ->
         [[X11,X12],[Y11,Y12]] = pow([[1,1],[1,0]], N - 1), X11;

本文链接:https://www.h5jun.com/post/过程抽象.html

-- EOF --

Comments