登录

/

注册

首页 > 科技媒体 > 媒体详情
【亿科创新智库】谢耘博士:盘点信息技术产业80年的发展史
醉卧青云 2016-04-05
导语

能看透多远的历史,就能看清多远的未来。在潮流中就需要有洞察的智慧,看清历史主线,抓住主要矛盾,找到发展的本质。本文是e科网专访神州数码首席科学家谢耘博士报道系列的第二篇。

                         

导语:近几年来,随着互联网、移动 互联网、物联网、云计算、大数据的出现,各种创新概念眼花缭乱、层出不穷。面对纷至沓来的各种潮流,身处飞速变革时代的我们,是否已经感到了无所适从?

能看透多远的历史,就能看清多远的未来。在潮流中就需要有洞察的智慧,看清历史主线,抓住主要矛盾,找到发展的本质。

亿科创新智库特邀专家、科技北京百名领军人才、神州数码首席科学家谢耘博士就是这样的一位具有深刻洞察智慧的企业家和科学家。本文是《谢耘博士看未来》系列的第二篇, 对信息技术产业的八十年历史做了深入透彻的盘点

一、引言

计算机的应用,粗略可以分为两大领域方向。一个是信息处理,一个是过程控制。所谓信息处理,就是说计算机(及相关设备)作为一个独立完整的人工系统,接受输入信息(数据),经过处理后其输出也是信息(数据)。或者说,人们向计算机系统输入信息(数据),然后从计算机系统得到的还是信息(数据)。

而在过程控制类应用中,计算机自身不是一个完全独立的系统,而是一个更大的人工系统中的一部分,计算机在其中承担信息(数据)处理任务,其输出的信息(数据)用于系统的控制而不是提供给人使用。计算机所从属的人工系统,或者输出信息(数据)之外的其它产物如化工、汽车与家电产品等等,或者系统直接服务于人,如大量使用计算机实现飞行控制的飞机作为交通工具为人所用。

我们后面的讨论,将限制在计算机的信息处理类应用领域。计算机信息处理类具体的应用五花八门种类繁多。为了看清历史主线,抓住主要矛盾,找出产业发展的核心本质,我们略去次要的非典型应用或旁枝末节,以主流典型应用为主线,回顾历史,寻找规律,以探究未来。

二、历史进程

在计算机信息(数据)处理应用的发展过程中,计算机处理的信息(数据)类型,在逐步发生着变化,它也最直观地标志出计算机应用的不同阶段。

按照计算机处理的信息(数据)不同类型,我们可以将计算机应用的历程,从计算机诞生开始分为三个大的阶段:数值计算阶段基于结构化数据的应用阶段,以及现今所处于的大量非结构化信息处理阶段,见图1

1 计算机应用的三个大的阶段示意

在这三个阶段中,除了计算机处理的信息(数据)类型有很大差异外,计算机应用的基础理论或工具方法,应用的基本模式等等,也具有明显的不同。

具体来看,有五个核心的要素可以概括性反映出计算机应用不同阶段的本质特征。它们是:1.计算机的输入和输出的信息(数据)类型;2.计算机应用的理论基础或采用的工具方法;3.计算机信息(数据)处理过程的特点,主要体现为应用软件的特点;4.计算机信息(数据)的管理及其与处理过程(应用软件)之间的关系;5.如何把需要解决的实际问题映射(变换)为计算机可以解决的数值基本计算类问题。

下面我们从这五个角度来分析计算机信息处理的三个不同阶段所具有的特征。

1、第一阶段:雏燕初飞---数值计算时代(上世纪40年代到50年代

当年催生计算机诞生的基本动力,就是人类开始面对大规模的、传统手段无法处理的数值计算问题。所以计算机诞生后,最初始的应用领域就是解决我们在物质世界中遇到的大规模计算问题。其面对的问题属性,基本都是科学或工程技术领域内的数值问题,比如核武器与航空航天中的设计与仿真。所以这类应用也被称为科学计算类应用

(1)信息(数据):

在科学计算中计算机处理的数据,是自然物质对象自然属性的数值表达。通常都是一些物理数值。站在语义的角度来看,这些数据只具有非常单一的语义性质。也正是由于这些数据所具有的语义特征的单一,所以我们一般称之为数据,而不是信息。由于每一个数据所反映的,是对象的局部物理状态,所以我们可以称之为“微观数据”;

(2)支撑应用的基础理论:

支撑这个阶段应用的是各种计算数学的方法,比如现代计算力学中的有限元方法等等。其中值得一提的是,对现代力学中普遍使用的有限元方法的创建,中国学者冯康有自己完整独立的贡献(冯康,19201993,应用数学与计算数学家,中国科学院院士);

(3)应用软件的特点:

数值计算应用软件的核心,是由各种数值算法组成,通过对输入数据的计算,而得出有意义的数值结果。比如核武器的设计,大型力学结构的设计,大气变化的模拟等等。在这些应用中,软件的设计从软件系统工程的角度来看不是很复杂。应用的复杂性在于数值算法设计和其高效的实现。挑战则在于计算机的运算能力是否足够强大。因为数值计算的专业性很强,数值计算应用软件主要不是依靠软件工程师编制,而是各个领域的专业技术人员设计编制。数值计算应用软件属于专业化工具,通常只完成一类特定的具体任务。

从其完成的任务在现实中的作用上来看,每一个具体的科学计算任务所完成的都是局部的的问题。

(4)信息(数据)的管理及其与应用软件之间的关系:

数值计算类应用,典型的是以独立的计算任务为特征的。每次计算任务会准备不同的数据,用相应的软件对数据进行处理,得到需要的结果数据。所以,数据是以计算任务为边界进行管理,与软件是通过任务相结合。应用软件,因其承担任务的不同可以接受不同的数据进行处理。因此数据与软件之间没有紧密不可分的关系。

(5)实际问题到数值问题的映射:

科学技术中的实际计算问题,天然的就是数值计算问题,基本不需要做人为的映射。只需提供合适的具体数值算法,计算机就能解决问题。算法的核心通常就是将连续数值计算问题用离散数值问题来近似,并保证计算的现实可实现性。

后来,这种大型数值计算也被应用到了社会领域,对于社会对象(如宏观经济问题)的数值表达做复杂的运算,以找出我们需要的结论。但是因为社会领域的问题通常不是纯逻辑化的问题,其运动变化规律不能完全映射为数值算法,所以计算机在这方面的应用,有根本性的局限。问题不是计算机的计算能力是否足够,而是待解决的问题本身的本质,不完全适合用计算机来解决。所以问题解决的满意度,远不能与科学计算相比。

这个时期IT产业在基础理论,核心技术与产品等方面取得的主要进步简述如下。

艾伦·图灵在1936年,冯·诺伊曼在1947年,克劳德·埃尔伍德·山农(1916—2001,数学家,贝尔实验室/麻省理工学院任职1948年分别奠定了可计算理论,计算机架构与数字通讯理论的基础。

在这个时期计算机的硬件由电子管发展到了晶体管。计算机的运算速度达到每秒几万次的水平。1954年,美国贝尔实验室研制成功第一台使用晶体管的计算机,取名TRADIC。它使用了800个晶体管这个时期的计算机基本上是比较个性化的单件或小批量生产,不同机型之间缺少统一的软件与硬件的技术与产品标准。

早期的计算机主要采用磁环来存储程序和数据,每个磁环存一个二进制的位。这种方式的存储方式容量非常低。革命性的变化发生在1956年,IBMIBM350机器上首次采用了硬盘。从此,硬盘成为了计算机标准的数据存储设备。硬盘技术从根本上解决了大数据量的存储问题。

由于数值计算是这个时期的核心应用,IBM John Backus1924-2007,计算机科学家,IBM任职)和他的研究小组1957年开发出面向科学计算的高级程序语言FORTRANFORmula TRANslator)。这是第一个计算机高级程序语言,并且至今依然是计算机科学计算的主要工具。

1958年,仙童半导体公司研制出第一个集成电路,见图2。它成为计算机在60年代进入集成电路时代的先声。


2 1958年仙童半导体公司研制的第一个集成电路

中国的计算机产业在50年代起步。在苏联的帮助下,中国科学院计算技术研究所与北京有线电厂合作于1958年研制成功中国第一台通用数字电子计算机103机,运算速度每秒1500次。1963年中国科学院计算技术研究所完成中国第一台晶体管大型通用数字电子计算机109机。

这是IT产业的奠基时期,形成了产业所需的比较完整的基本理论,开始将这些理论付诸实践。在实践的过程中,完成了计算机硬件核心技术的突破,计算机在关键科技领域显示出了革命性的重要作用。

2、第二阶段:繁荣发展---结构化数据应用的时代(上世纪60年代到90年代)

随着计算机计算能力的快速提高,计算机从纯数值计算领域里走了出来,逐步进入到非数值计算领域。主要应用领域是与数值计算最接近的、具有严格逻辑规则的数据处理应用。计算机应用发展到这个阶段,开始从高傲的象牙塔似的科学技术领域逐步进入到了其它社会领域,开始了计算机对社会的一些重要领域产生比较普遍性影响的阶段。

(1)信息(数据):

这个阶段计算机处理的数据与上一阶段不同,数据处理应用中的数据以社会实体(包括社会物质实体,和抽象逻辑实体)的社会属性的数值化表达为主,而不是单纯物质自然属性的表达。这些对象的属性中那些原本不是数值化的属性,通常经过简单的编码规则即可映射为数值。这些数据,有着明确无歧义的意义,能有效利用计算机的数值逻辑处理能力进行处理。

在这个阶段,计算机处理的数据是以所谓的“结构化数据”为主。结构化数据是指一个基本的完整数据,是由多个有明确定义的数据段组合而成。比如一张电子飞机票是一个典型的完全结构化的数据,它由人名数据段、航班号数据段等等构成。每个数据段都有明确无歧义的意义,整张机票也是明确无歧义的,而且所有机票都是一样的。银行账户等也属于典型的结构化数据。

从语义的角度来看,如果我们把以有限数量的、有单一明确无歧义意义的、并且可以被赋予不同具体值的语义概念,如航班号、目的地、姓名等,作为一组基而构成的空间称为有限维度(离散)“语义空间”的话,结构化数据就是在一个有限维度语义空间中的点或点的集合。也就是说,结构化数据是可以被一个有限维度语义空间来严格定义的。

以电子机票为例,一张电子机票是由乘客姓名、航班号、登机时间、起飞地点、到达地点、座位号、舱位等级等几个语义概念维度构成的一个有限维度语义空间中的一个点。显然结构化数据的语义特征,比数值计算中的数据的语义特征要复杂,但是依然可以用确定和有限维度的语义来完整描述。

由于结构化数据所具有的相对复杂的语义特征,在日常使用习惯上,它既可以被称为数据,也可以被称之为信息。结构化数据由于承载了比反应对象局部特征的物理数值更为复杂广泛的内涵,所以我们称之为“中观数据”。

(2)支撑应用的基础理论:

这个阶段核心的基础理论是关系型数据库理论。基于关系型数据库理论设计出来的关系型数据库,构成了此类软件应用系统的核心基础,用于实现有限维度语义空间,并对语义空间及其定义的数据进行有效的管理和操作,以及支撑基于这些数据的应用。

(3)应用软件的特点:

这个阶段的应用,都是针对现实中可以用数值逻辑算法(组合)表达的(或者说可以映射为数值逻辑算法或其组合的)过程(流程)的软件实现。在这些过程的软件实现中,包括了对相应的结构化数据的处理。这类应用软件,核心是由若干用数值逻辑算法实现的流程组合而成。软件的设计,首先要做业务分析,即将需要实现的功能分解映射为数值逻辑算法的组合。

这些应用软件,不再像科学计算软件那样,通常作为工具性软件被用于各种的独立的一次性任务。它们基本都是作为特定工具,有固定明确的使用者,长期持续地支撑特定的主体进行某一种持续的活动。比如一个企业拥有的ERP软件支撑的是这个企业的持续经营活动,而不是一个在需要时才拿出来使用一下、去解决某个具体问题的工具。在这些软件的支撑下,这些持续的活动实施的效率、一致性与精确性得到了可靠的保证,尽管牺牲了一定的灵活性。

从系统工程的角度来看,这些软件复杂度逐步增加,系统级设计变得越来越重要。软件的整个设计生产过程,需要规范的方法和精细的过程管理。软件工程这一学科正是在这个背景下出现并逐步发展起来的,用于指导复杂软件的设计开发的整个过程,以期达到产出高质量软件的目的。

在这个时期开始出现了专业化的软件工程师这个职业,来负责应用软件的开发。尽管他们通常也需要一些相应的领域知识,但是总体来讲,这类应用软件比数值计算应用的专业性弱。软件外包业务也是主要是针对这类应用。

从计算机完成的任务实际中的作用来看,这些应用不同与科学计算的“点”的作用,而是具有“线”的特征是完成了由许多“点”的活动连接而成的“线”流程。人们普遍抱怨的“信息孤岛”烟囱”式IT系统建设方式,就是源于这种面向流程的应用设计开发方式。

(4)信息(数据)的管理及其与应用软件之间的关系:

这个时期的应用软件,是用来支撑不同主体持续的特定业务活动。在应用中,信息(数据)模型结构是作为应用软件的一个有机组成部分一体化设计出来的。在应用过程中特定的一整套数据始终与一个完整的应用彼此相配合,实现完整的业务过程。离开了特定的数据,业务就无法进行。因此特定数据与特定的业务应用在应用软件设计初始便相对应,数据因应用而获得自己存在的意义。所以在这些应用中,数据是按照业务过程来管理的。

比如在简单的意义上讲,一个企业OA系统的数据,根本就无法直接放到其ERP系统中去。这些数据只有在自己对应的业务系统中才有价值。或者说,数据加上应用软件才形成了一个实际持续运行的、支撑主体特定的持续活动的应用系统。

在这里,特定的一整套数据与应用软件是共生的、紧耦合的关系,彼此不可分离。这与数值计算的中数据与应用之间相对独立的情况不同。这种数据与应用紧密结合的模式,也是现在计算机应用中普遍采用的方法。它是现有的基于结构化数据应用的产物。面对未来新的应用,特别是面对大量非结构化信息的时候,这种模式必然有其严重的局限性。目前大家抱怨的烟囱式的信息系统建设方式以及由此产生的“信息孤岛”都是这种建设模式的必然结果。

(5)实际问题到数值问题的映射

这类应用软件处理的实际问题,在其原本的状态下通常并不是数值逻辑计算类问题。所以,用计算机来解决这些问题需要做人为的映射变换。映射变换的对象包括了两个大的类别,一个是对实体属性的映射,将其映射为数值表达;另外一个就是对实际业务过程的变换,将其变换为数值逻辑算法。第二个变换的准确性与有效性,在根本上决定了计算机应用软件解决实际问题的准确性与有效性。

当后来互联网普及之后,许多基于结构化数据的应用通过互联网而得到了极大的延伸,但应用的基本特征并没有变。由于社会中各个领域内基于结构化数据、可以流程化的应用数量巨大,计算机在信息处理领域里的应用在这个阶段得到了极大的发展。软件应用系统的日益复杂,也促进了计算机技术自身在各个方面的快速成长,以满足日益复杂的软件应用的需求。

特别需要指出的是,基于结构化数据的应用,并不是在科学计算基础上的自然深化与延展,而是计算机在人类社会中开辟了全新的基于结构化数据处理的、更为广阔的应用空间,极大地推进了计算机对人类社会的广泛渗透。

 IT应用的这个时期是IT产业的少年时代。这个时期IT产业在基础理论,核心技术与产品等方面取得的主要进步简述如下。

在这个时期,计算机由中小规模集成电路发展到了超大规模集成电。计算机系统的运算速度从每秒几万次飙升到了每秒万亿次。

Intel公司在1971年研制成功的第一个微处理4004。它采用10微米工艺,集成了2250个晶体管,见图3。虽然这只是一个在今天看来功能简单的、只能执行四位字长运算的处理器,但是这是IT产业历史上第一次将计算机的核心处理功能与控制功能全部集成在一个集成电路芯片上。因而它成为了计算机发展史上的一个划时代的里程碑。


3 Intel公司1971年研制成功的第一个微处理器4004

Intel公司的Gordon Moore1929-,仙童半导体公司与Intel公司创始人之一)在1965年首次提出集成电路发展的“摩尔定律”。在随后的几年里几经修改后,该“定律”表述为:“当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。”至今为止,该“定律”依然有效。

CPU领域,IBM80年代开始发起了一场精简指令集(RISC)对复杂指令集(CISC)的大战。CISC的典型代表就是IntelX86结构的CPU,十分壮观的RISC阵营则有IBM公司的PowerPCHP公司的PA-RISCCSun Microsystems公司的SPARCMotorola公司的MC88000DEC公司的Alpha,以及MIPS和现在大名鼎鼎的ARM等。在90年代,从服务器到嵌入式系统RISC体系大有一统天下的势头。

集成电路技术的飞速发展,导致计算机从高端专业设备领域中走出来进入到了个人应用领域。苹果公司在1976年推出了第一台个人电脑Apple IIBM则在1981年推出了IBM PC,并成为产业标准。IBM PC的出现有力地促进了互联网的发展,并成为IT产业进入下一个发展阶段的重要推动力。东芝公司在1992年推出了第一台笔记本电脑T1000,开创了移动计算时代。PC的出现,标志着计算机开始了从贵族到平民的转变

进入60年代后,计算机逐步摆脱了非标准化生产的初级状态,开始了标准化进程。操作系统开始作为标准化的产品出现。第一个重要的操作系统是IBM1964年推出的System/360。影响最广的Unix操作系统由在AT&T的贝尔实验室工作的Ken Thompson1943-,计算机科学家,贝尔实验室/Google任职,1983年获图灵奖)和Dennis Ritchie1941-2011,计算机科学家,贝尔实验室任职,1983年获图灵奖)1969年开发出来。微软公司在1981年推出MS-DOS,在1985年推出Windows1.01991Linus Benedict Torvalds1969-,软件工程师)在互联网上发布了第一个版本的Linux内核。这是IT产业历史上第一个采用开放源代码软件开放模式的软件协作计划。由此开始开源软件的影响与日俱增。

曾经非常重要,但是现在已经被遗忘的一个产品是软盘。它是IBM1971年开发出来的。2000年以后已经被U盘所取代。

高级程序语言在这个时期也得到了大发展BASICBeginner's All-purpose Symbolic Instruction Code)语言是在1964年由John Kemeny1926-1992,计算机科学家,达特茅斯学院第13任院长)和Thomas Kurtz1928-,计算机科学家,达特茅斯学院任职)设计,并且在他们的指导下由达特茅斯学院的学生实现的。C语言则是伴随Unix1971年被贝尔实验室的Ken ThompsonDennis Ritchie开发出来的。在C语言基础上发展出来的面向对象的C++语言,是贝尔实验室Bjarne Stroustrup1950-,计算机科学家,贝尔实验室/德克萨斯A&M大学任职)于1983推出的。JavaJavaScript的出现则是1995年的事情了。其它一些比较重要的高级程序设计语言还有LISP1958,函数式编程设计语言),Cobol1959,面向商业与数据处理的程序设计语言),ALGOL601960,算法程序设计语言),Simula671967,第一个面向对象的程序设计语言),Pascal1970,第一个结构化程序设计语言),Prolog1972,面向人工智能的逻辑程序设计语言),Ada1983,美国军方主导的面向实时嵌入式应用的程序设计语言)等。

由于计算机开始从科学计算进入到数据处理应用,所以导致了数据库的产生与发展。1961通用电气公司General Electric Co.)的Charles Bachman1924-,计算机科学家,通用电器/巴赫曼信息系统公司任职,1973年获图灵奖)成功地开发出世界上第一个网状数据库管理系统——集成数据存储(Integrated DataStoreIDS),奠定了网状数据库的基础,并在当时得到了广泛的发行和应用。层次型数据库管理系统是紧随网络型数据库而出现的,最著名最典型的是IBM 公司在1968 年开发的IMSInformation Management System

今天被最广泛使用的关系型数据库,源于19706IBM的研究员E.F.Codd博士1923-2003,计算机科学家,IBM任职,1981年获图灵奖)在《Communication of the ACM》上发表一篇名为A Relational Model of Data for Large Shared Data Banks的论文1974年,IBMRaymond F. Boyce1947-1974,计算机科学家,IBM任职)与Donald D. Chamberlin1944-,计算机科学家,IBM任职)定义了用于关系数据库交互的SQLStructured Query Language)语言。1976年霍尼韦尔国际公司(Honeywell International)开发了第一个商用关系数据库系统MRDSMultics Relational Data Store第一个比较完整实现SQL的商用关系型数据库是Oracle公司(当时叫Relational Software Inc.RSI)于1979年推出的。IBM1982年推出了基于SQL的商用数据库管理系统SQL/DS,并于次年推出了著名的DB2关系型数据库。

由于软件系统日趋复杂,1968年秋北大西洋公约组织的科技委员会在前联邦德国召集计算机科学家、软件设计师及企业巨头开会讨论应对“软件危机”的策略。在这次会议上首次提出了“软件工程”(Software Engineering)的概念。随后软件工程不断积累总结软件开发的过程管理方法与设计方法,以保证复杂软件系统的质量。在设计方法上,随着C++语言的出现,80年面向对象的方法成为了主导;基于构件的方法则兴起于90年代。

互联网的雏形出现在60。当时美国国防部国防前沿研究项目署ARPA)出于冷战考虑创建了远程分组交换的ARPA1973ARPA网扩展成互联网,第一批接入的有英国挪威计算机1974ARPARobert Elliot Kahn1938-,计算机科学家,贝尔实验室/麻省理工学院/ARPA任职,非盈利组织CNRI创始人,2004年获图灵奖)和斯坦福大学的Vinton Gray Cerf1943-,计算机科学家,IBM/斯坦福大学/DARPA/CNRI/Google任职,2004年获图灵奖)提出TCP/IP协议198311ARPA网将其网络核心协议由NCP改变为TCP/IP协议1990开始互联网全面向公众开放。

互联网上基于超文本的万维网(World Wide Web)技术是Tim Berners-LeeTimothy John Berners-Lee1955,计算机科学家,万维网的发明者,欧洲粒子物理实验室/麻省理工学院/南安普敦大学任职)在欧洲粒子物理实验室工作时于1989年第一次提出,并于1991年8月6日在互联网上开通了世界第一个网站http: //info. cern. ch/。他由此开创了互联网应用的一个新纪元。

移动互联网源自移动蜂窝通信系统。第一部移动电话是摩托罗拉公司在1973年研制出来的DynaTAC 8000X。它2磅,通话时间半小时,销售价格为3,995美元1978 年,美国贝尔实验室开发了先进移动电话业务(AMPS)系统,这是第一种真正意义上的具有随时随地通信能力的大容量的蜂窝移动通信系统目前移动通讯中最核心的移动CDMA(码分多址)技术,是高通公司(Qualcomm Inc.)在1989年推出的。

在局域网中,最著名的总线竞争的以太网是施乐公司(Xerox Corp.)帕罗阿尔托研究中心的Bob Metcalfe1946-,计算机网络专家,Xerox/3Com任职,3Com公司创始人)于1973年首次提出的。以太网标准正式出台于1980年。随后以太网很快击败了同期出现的令牌环网等其它类型的局域网而成为局域网的标准形态。无线局域网的标准出现于1997年。

通信骨干网中,激光与光纤是两个核心技术。激光的理论源于爱因斯坦。爱因斯坦在1917年指出,物质存在受激辐射的机制。1960515日,美国加利福尼亚州休斯实验室的科学家Theodore Harold Maiman1927-2007,物理学家,休斯公司/TRW公司任职)宣布获得了波长为0.6943微米的激光,这是人类有史以来获得的第一束激光,Maiman因而也成为世界上第一个将激光引入实用领域的科学家。

1966年,在欧洲标准电信实验有限公司工作的高锟(1933-,物理学家,2009年诺贝尔物理学奖获得者)提出了光纤理论。1970年,美国康宁公司Corning Inc..三名科研人员马瑞尔、卡普隆、凯克成功研制成低损耗石英光纤。

这个时期是IT产业的核心技术蓬勃发展完善时期,孕育了我们今天使用的几乎所有的IT基础性核心技术和产品。IT应用从社会的核心重要领域开始,逐步渗透到社会的其它方面,包括个人生活领域,日益显示出IT技术对人类社会的历史性影响。继农业、工业社会之后,人类历史上第三个以技术来标志的社会形态---信息社会的曙光透出了人类历史进程的地平线。

3、第三阶段:初现端倪---非结构化信息应用的时代(本世纪00年代至今)

进入上个世纪90年代之后,随着计算机性价比的持续提高,随着PC以 及如数码相机等新型数字化产品的不断出现,人们逐步开始用计算机来产生或生成大量的非结构化信息。如数字化的文档、照片、语音及视频等。因为它们包含的信 息量明显比一般的数值或结构化数据大,所以在日常使用的习惯上,我们不再称之为数据,而称之为信息。这个时期也正是互联网开始迅速普及的时期。

当上个世纪890年 代互联网从学术界走向社会之后,在互联网上主要出现了两大类不同的应用。一种是前面介绍过的计算机应用第二阶段的、基于结构化数据的应用通过互联网的延 伸,或者直接借助互联网来实现;另外一种是全新的,利用互联网进行非特定用户的非结构化信息分享类的应用。电子邮件可以被视为是这类应用的初始形态,随后 出现的各种新闻门户网站,GoogleFacebookTwitter等等,就是这类应用的典型代表。这种基于互联网的非结构化信息分享,成为了目前计算机信息类应用进入第三个阶段初期的主要特征,也成为了当下IT技术对社会产生革命性影响的新的应用形态

如今非结构化信息应用的时代刚刚起步。在这个新的阶段中,信息分享类应用显然不会是信息应用的全部,甚至也不会是这个时期成熟以后的核心应用形态。它只是IT应用这个新阶段当前的主要应用形态。下面对这个应用形态做个简要的分析,尽管它并不能代表这个时代的未来主流应用。

(1)信息(数据)

人们利用互联网分享的主要是非结构化信息。所谓“非结构化信息,就是无法用一个有限维度语义空间来严格定义的信息。这说明信息本身的内涵大大增加,所以我们不再以“数据”相称。非结构化信息大量增加,源于IT设备的多样性与广泛普及。这使得我们可以利用这些设备直接把各种曾经用传统形式表达的复杂信息,如文档、照片和视频等,方便地进行数值化表达,由原始信息到数值化信息的映射过程由设备自动完成。

非结构化的信息,在对人类有意义的信息中占最大的比重,远远超过结构化数据。就像在所有的系统中,非线性系统远远多于线性系统那样。在系统学中,我们对线性 系统有着统一完善的处理工具,而对处理非线性系统问题却常常举步维艰。类似的情况出现在了信息领域:我们对结构化数据有完整有效的处理工具,而对非结构化 信息的处理,常常颇感茫然,缺少有效的理论与工具支撑。

由于一个非结构化信息常常包含了大量丰富的、跨越一定时空的内涵,远非物理数值与结构化信息可比,所以我们把非结构化信息称之为宏观信息(数据)

(2)支撑应用的基础理论:

互联网上非特定用户信息分享类的应用,并没有特别新的基础理论方面的创新。因为这类应用本质上是比较简单的。当然系统实现的技术难度很大,主要是因为数据量 大和用户量大,互联网的应用环境也比较复杂。但这与基础理论并无太大关系。这类应用之所以社会影响很大,是由网络的广泛覆盖带来的,不是这些应用背后有多 少理论或技术创新。或者说,是网络这个覆盖全球的“效能放大器”,极大地放大了这些本质上简单的应用的社会影响力与商业价值。

(3)应用软件的特点:

互联网上非特定用户信息分享类的应用,本质上是建立了信息流通的渠道和适当的展示方式。应用基本只对信息做格式上的变化以适应信息的传递和展示,对信息做适 当的分类组织,但不对信息做实质性的复杂处理。这一点与前面两种应用方式有很大的不同。所以这类应用自身实现的功能本质上缺少深度,但因为网络而获得了空前的广度。

我们以微博和微信为例。它们满足的不过是人们固有的茶余饭后闲聊的需求,不同的是它们把闲聊的范围,由街坊邻居、同事朋友,扩展到了全球,而且信息传播速度极快。由此它们具有了巨大的社会影响力。

(4)信息(数据)的管理及其与应用软件之间的关系:

这类软件应用的本质在于促进信息分享。应用离开了信息固然没有意义,但是应用却并不依赖具体的信息。不像一个投入运行的银行业务系统,必须使用与系统对应的自己实际客户的具体数据才有意义;信息分享应用,并不在乎分享的是哪些具体信息。

而从信息角度来看,IT产业发展到这个阶段后,大量的电子化信息,特别是非结构化信息也并不是仅仅为了某个具体特定应用而存在的(至少通常情况下是这样)。比如我们拍的照片可能会用到不同的地方,不像银行的数据那样与银行具体的应用不可分割。这既与当今IT设备的大量普级到工作生活的各个方面有关,也是由非结构化信息自身内涵复杂的特点决定的。内涵复杂的信息,自然有多重可能的用途和价值,而不是仅仅为了某个具体的应用而产生和存在。如何使用这些信息是由应用的各个使用者根据具体情况决定的,而不是在应用设计之初就明确了的。所以信息的价值并不依赖于具体的应用。因此,这类软件应用与信息之间的关系是松散的,彼此相对独立。信息与应用的松耦合,可能是未来IT应用的一个基本特征。

目前,面对信息大量无序地涌现的所谓大数据时代,还没有形成主流的信息管理方式。信息杂乱地分散在网络上下的各个角楼,大数据应用强调如何从这些杂乱的数据 矿藏中去挖掘价值,却对信息管理没有给予足够的重视。由于信息不是自然生成之物,而是人工有意识的产物,所以我们不应该对于信息的杂乱置之不理,而应该让 信息在其形成之初,便被置于有效的管理之下,非结构化时代的信息管理是后续着重讨论的核心问题。

(5)实际问题到数值问题的映射

这类问题核心的映射就是非结构化信息的数值化表达。这个过程主要是由各种设备自动完成,不需要人为干预。

从这类应用本质的简单性,而其涉及的非结构化信息的复杂性来看,我们可以推断这类应用的目前形态只是基于非结构化信息的应用的初级阶段。未来必定演化出更为复杂的、能够充分利用非结构化信息价值的全新的应用或应用模式。这正是IT产业正在经历的转折的核心,这些全新的应用或应用模式将主导IT产业的未来发展。

而且根据历史的规律,我们可以下的一个明确判断就是:正如基于结构化数据的应用,不是数值计算的简单外推而是一个全新的应用方式,基于非结构化信息的应用,也绝不是对基于结构化数据应用的深化与拓展,而是会开辟出前所未有的、更为广阔的计算机信息处理类应用的空间,在更深的程度上影响人类社会的各个方面

这个时期的IT产业开始进入青年时代,也是我们正在经历的时代。迄今为止在这个阶段IT产业在基础理论方面没有大的突破。在核心技术与产品上的进步简述如下。

进入21世纪后,IT产业的一个重要的发展便是移动互联网的出现2001101日,日本NTT DoCoMo公司正式推出了第3代移动通信业务(FOMA)这是3G在世界上首次投入市场,由此拉开了移动互联网时代。也催生了种类繁多的包括智能手机在内的移动计算设备。

20121月,国际电信联盟正式通过了第四代移动通信标准,4G正在向我们走来。

而集成电路技术在新世纪也发展到了一个历史性新高度。2005AMD公司首先推出双核处理器。Intel公司也在2005年推出“双核”处理器奔腾D,但是该处理器实际上是两个芯片封装在一起构成的。从此CPU进入了多核时代,也使得各种计算设备的处理能力逐步开始不再成为制约应用发展的瓶颈。这是IT产业进入青年时代的最重要的技术保证。

开启于80年代的RISCCISC大战,在进入新世纪后形势发生了逆转。在Intel公司对集成电路技术的疯狂投入下,随着集成度的不断提高,CISC体系的缺陷大都不再成为问题,而且它也吸收了RISC的一些特点。Intel公司在其于笔记本与台式机市场上所具有的绝对优势的支撑下经过十几年的努力,2010年以后成功地占据了服务器市场的绝大部分。Intel公司给RISC留下的空间,主要在移动与嵌入式设备领域。目前在手机市场上,ARM以其低功耗的优势几乎独霸天下,2011年其市场占有率高达95%。高通公司则正在利用移动市场上巨大的优势,试图基于ARMCPU推向Intel的传统领地。由于集成电路技术的发展以及CPU设计上的互相借鉴,RISCCISC的名称已经不再重要,但是这场大战远未结束

在软件工程方面,随着互联网应用的繁荣,面向服务的系统设计方法(SOA)逐步成为主流。高级程序语言的一个新产品是微软公司在2000年推出的面向对象的程序设计语言C#

 IT应用的这个时期刚刚开始,它也正是IT产业基础技术不再成为瓶颈,IT应用开始主导产业发展的时期。它将成为IT产业全面创造奇迹的时代。随着基础技术平台不再成为IT应用的制约因素,我们将会看到更多的面向不同应用的新技术的出现。这些新技术,将主要围绕非结构化信息的处理与应用而展开,全面渗透到社会的各个领域,深刻地改变传统的做事方式与产业分工,重塑人类社会的方方面面

三、历史进程的关键经验

在进入对计算机应用未来的探讨之前,我们再从另外的角度,从人与计算机的关系上,特别是从人的主观感受和评价上,对计算机应用走过的道路做一个有趣的分析,以期帮助我们能够更好地面对IT产业未来将大量涌现出来的原始性创新。

在计算机应用的第一个阶段,也就是数值计算阶段,人们对计算机是否能够完成人赋予它的使命没有太多的质疑。只要计算机算的足够快,只要有合适的计算方法来支 撑需要解决的问题,让计算机来完成计算任务是一个理所应当的事情,因为计算机就如它的名字表达的那样,生来就是被设计用来算数的。

到了计算机应用的第二个阶段,当计算机试图去完成一个原来由人承担的具体的持续性活动的时候,疑问便产生了。

疑问首先来自习惯的改变。计算机要完成的活动在其原本的状态下,并不都完全符合数理逻辑算法。要想用计算机来承担这些活动,必须对活动进行逻辑化规范性改造设计。这个过程必然与人们原来的做事习惯有不相符合的地方。要改变人的习惯,必然会引起人的不快与排斥性反应。

其次,当将这些活动变换为数理逻辑算法的时候,不止习惯会有变化,而且有些内容也会有变化,需要做适应性改造。这样,计算机应用软件实现的活动与人们原本自然的状态就有了更多的不同。人们自然地要质疑这些不同是否具有根本性或破坏性的变化,从而使得计算机应用软件完成的活动已经失去了原有的意义。

现代计算机的应用历程,正是在这些质疑和抵抗中,逐步从纯数值计算,走向更广阔领域的过程。如果说数值计算任务的完成,计算机可以达到90%以上的满意度的话,基于结构化数据的持续性活动的应用,计算机能够达到的满意度可能只有70~80%

由于满意度是具有主观性的,所以在人尚未适应计算机来完成这些活动的初始阶段,人们对计算应用的主观评价可能更低。而随着人的适应,以及计算机应用的不断改进提高,这个满意度可能也会达到90%以上。

从这个过程我们可以看到,计算机应用领域的扩展过程,就是逐步从人们认为其天然擅长的工作---数值计算开始,不断拓展到我们曾经认为其并不那么擅长的领域之中。由于其并不天然擅长,所以原始的问题需要做映射变换才能被计算机相对有效地解决,而映射变换过程必然带来一系列的问题。包括人的不适应,包括问题本身在一定程度上的扭曲和改变等等。

在这个拓展的过程中,核心问题不是计算机是否适应了人,也不是人是否适应了计算机,而是要看计算机应用解决问题所带来的价值,是否远远超过了它所带来的新的 问题。这是一个收益与损失之间的权衡。只要收益显著高于损失,人们必将逐步适应和接受计算机的应用;反之则会排斥。这个过程,既是计算机应用不断完善、不 断适应人的过程,反过来它也是人不断去适应计算机,被计算机改造,并且不断去寻找更好的方法让计算机替人承担更多的工作的过程。

-机之间的这种相互适应,不只是现代计算机应用所遇到的问题,在其它人类创造的工具的应用中,也存在同样的情况。比如,我们去坐飞机外出,经常遇到航班晚点等 很多的麻烦和不便,但是我们不会因此就认为应该取消飞机。因为那些麻烦和不便,相比飞机给我们带来的益处,即使不是微不足道,也不会严重到使我们排斥乘坐 飞机。当然飞机及相关的服务也在不断地改进。但是不论肮空运输业如何改进,它依然有很多不便。这就是人与工具之间相互适应、相互影响和相互改造的过程。这 是个辨证的问题,不可偏执于一方。

所以,在开拓计算机新的应用领域的时候,我们不能单向地站在人们已有的习惯的角度来向计算机“发难”,一味地用挑剔的眼光来看待新的探索;而是应该站在发展 的角度,根据计算机的本质能力,全面地权衡得失,去客观地分析计算机在新的领域中的应用或计算机新的应用模式是否会成为社会未来的必然趋势。

在未来,计算机开创的全新的应用,特别是一个真正革命性的应用,还会常常很难让我们有那种对已经熟悉了的计算机应用所持有的理所当然的感觉。我们必然有不适应,有不喜欢,有排斥和否定它的“充足”的理由。但是这并不意味着这些计算机应用不会成功地普及开来。

也就是说我们不能用我们已经习惯了的感受,去评价全新的产物。而是应该抛开个人的感受,理性地去分析得失。所以,当前业界非常强调的“用户体验”,对于全新 领域的开拓,是有一定的消极负面作用的。因为用户体验并非是那些真正重要的计算机应用的本质价值,而仅仅是应用对人已有习惯的适应程度。如果认为“用户体验”高于一切,就很难有真正革命性的创新。过分强调“用户体验”,与IT产业近年来缺少实质性创新有关。因为缺少实质性创新,大家的注意力就必然被表层的变化所吸引

这当然并不是否定计算机应用的“用户体验”的重要性,就像我们不会去否定一辆汽车造型设计的重要性那样。但是同时,我们在比较汽车的时候,造型设计常常并非是最为重要的因素,特别是对于高档车而言。

1945年第一台通用电子计算机EDVAC诞 生的时候,它给我们带来了什么样的用户体验?显然那个时代的计算机的使用,远非是一种愉快的体验。但是因为它带来的收益远远大于使用的麻烦,所以计算机飞 速地发展了起来。当年并没有人以“用户体验”不佳为由去否定计算机的价值。所以在今天,我们也要给“用户体验”一个恰当的位置,而不是把它简单地当作计算 机应用中、特别是重大的创新性应用中,最优先考虑的目标。


历史,常常惊人的相似,但并不会简单地重复。因为不是简单的重复,所以给我们接受历史经验,认识客观规律带来了很大的困难。

未来的计算机应用领域的开拓,还会遇到历史上出现过的质疑,而且人们会说这次与上一次有着“根本性”的差别,所以质疑是“绝对”有道理的。但是,不论有多少 质疑,现代计算机随着计算、存贮和通讯能力的持续提高,必然要进入到更多的领域、完成更多的应用,更加深入广泛地走进人的生活的方方面面。

在这个过程中,现代计算机必然会改变人的许多习惯和看法。当然,计算机更必然地在更深、更广、更大的程度上,帮助我们去实现我们的目标,成为我们须臾不可离开的助手。人类在创造的过程中,改变着客观世界,也因为不断地适应着这些改变而在持续塑造着自己。


谢耘博士简介:

谢耘博士,科技北京百名领军人才,神州数码首席科学家,现神州数码集团CTO,神州数码工程院院长。清华大学电子工程系博士,曾历任神州数码工程院院长、神 州数码通用软件公司董事长兼首席执行官、神州数码软件有限公司总经理、神州数码(中国)有限公司首席技术官、联想研究院副院长、中科院计算技术研究所副所 长等职,曾在《IT经理世纪》等杂志开设管理专栏。清华大学职业生涯教练,开复学生网成长顾问。根据自己的经历,在2005年,写作并出版了《修炼--我 的职场十年》一书,2009出版了《成长》一书;在2014年出版了专著转折——眺望IT巅峰  

专著转折——眺望IT巅峰 介绍:

 

本书中,谢耘博士首次将中国哲学和东方思维方式引入信息科学,重新审视IT产业发展,创造性地提出“虚拟映像”思想,以前所未有的互联网思维实现了技术空 间的空前扩展,引领了新的思想潮流。本书完整展示了作者关于虚拟映像和主体认识论的理论,论述了基于非结构化信息管理技术的应用模型。书中提到,建立主体 的“虚拟映像”将成为一种必然。当我们能够建立起主体虚拟世界的数字映像时,信息与主体之间不再是一种无序随机的联系,这使得我们可以把机器与包括人在内 的主体不断接近的过程,推进到应用下面的信息层面,由此将引发信息类应用的一场深刻的变革。以“虚拟映像”为基础的应用模式也将成为未来IT应用的一个具 有重大意义的新模式。

城市“虚拟映像”是智慧城市建设的理论基础,书中基于“虚拟映像”理念建设公共信息服务平台以推进我国智慧城市建设进程的观点,与当前我国智慧城市建设的相关指导意见和方向高度契合,为智慧城市建设标准的制定提供了重要依据和论证。

如若转载,请注明e科网。

如果你有好文章想发表or科研成果想展示推广,可以联系我们或免费注册拥有自己的主页

  • 谢耘
  • 信息技术
  • 未来趋势
分享到
文章评论(0)
登陆后参加评论
作者 醉卧青云

博士生

哈尔滨工业大学

活跃作者
  • 爱因斯坦 科研工作者 北京航空航天大学 博士
  • 梅西 本科生 北京工业大学 本科
  • 金陵 本科生 北京大学 本科


发布成功!

确 定 关 闭