复杂系统的分析与建模
王安麟 马立新 赵群飞 著 上海汽车工业教育基金会 组编
上海交通大学出版社
内 容 提 要
本书以复杂管理科学与工程数字化为主线,从方和应用角度,简明易懂地介绍了复杂系统的分析与建模。本书在突出反映新的智能化、适应化、自组织化、进化方法和技术的同时,将复杂系统的动力学理论引入实际工程学分析与建模的研究。本书反映了管理科学与工程学科的最新动态和发展方向,可供从事管理、工程专业的研究人员和大学师生阅读参考。
图书在版编目(CIP)数据
复杂系统的分析与建模/王安麟等著.—上海:上海交通大学出版社,2004 ISBN7-313-03617-5
Ⅰ.复... Ⅱ.王... Ⅲ.①工业工程—系统管理—系统分析②工业工程—系统管理—系统建模Ⅳ.F402
中国版本图书馆CIP数据核字(2003)第100493号
复杂系统的分析与建模
王安麟 等著
上海交通大学出版社出版发行(上海市番禺路877号 邮政编码200030)
电话:071208 出版人:张天蔚
上海锦佳装璜印刷发展公司印刷 全国新华书店经销开本:787mm×960mm1/16 印张:15.25 字数:287千字
2004年2月第1版 2004年2月第1次印刷
印数:1-1500
ISBN7-313-03617-5/F・487定价:22.00元
版权所有 侵权必究
工业工程系列教材编委会
主任: 翁史烈 委员: (以姓氏笔画为序)
宋国防 胡宗武 徐克林诸葛镇 秦鹏飞 韩正之
钱省三 总 序
作为市场经济产物的工业工程学科,在美国的发展已有100年的历史,它在西方国家的工业化进程中和改善经营管理、提高生产率等方面都发挥了很大的作用。近10多年来,随着商业竞争的加剧,国际市场和全球化制造态势的形成,企业和商家纷纷寻求进一步改善经营管理的方法,试图建立自己的核心竞争力,以便在剧烈的竞争中取胜。企业和商家的这些努力是与管理专家的研究结合在一起的,这样就大大地推动、丰富了工业工程和管理学科的发展和内容的更新。
虽然在上世纪三四十年代,交通大学等一些大学曾设立过与工业工程类似的学科,但后随着计划经济的实施,这个学科也就取消了。这样,这个学科在我国的研究和应用就停滞了30多年。改革开放后,在原机械工业部的积极推动下,我国从19年开始引进工业工程的管理方法,并在一些企业试行,取得了明显的经济效果。西安交通大学、天津大学等高校率先于1992年开始招收工业工程专业的本科生。随后,我国一些大学陆续设立这个专业,至今全国已有70多所高等学校设有这个专业;这个专业的硕士生和博士生也在培养之中。但是,正由于我们起步较晚,无论在工业工程的应用还是人才培养等方面都落在先进国家的后面。
上海汽车工业(集团)总公司是一个现代化的大型企业集团,集团公司所属的许多生产厂不但拥有现代化的设备,而且也努力推行现代的管理方法。在实践中,他们深感缺乏既懂工程又懂管理的复合型人才。为了广泛普及现代的管理方法,公司的高层领导把员工的教育和培训摆到了重要的地位。他们除经常举办短期训练班普及现代管理知识外,还委托上海交通大学连续举办了几届“工业工程”专业工程硕士班。为了解决硕士班的教材,他们引进了部分国外最新教材,供上课老师和学生使用。
为了支持工业工程专业人才的培养,解决工业工程专业的教材问题,由上汽集团及所属企业捐资组建的“上海汽车工业教育基金会”,从2000年起就开始研究资助这个专业教材的编写和出版问题。经上海汽车工业教育基金会与上海交通大学出版社共同策划,并先后与上海交通大学、同济大学、东华大学、复旦大学、上海大学和上海理工大学等校工业工程系老师座谈、讨论,于2001年8月正式成立了“工业工程系列教材编委会”,制订了系列教材编写和出版计划。按照这个计划,系列教材共计14种,由2002年起分3年出版。基金会拨出专款资助
2生产计划与控制
系列教材的编写和出版。我们对上海汽车工业教育基金会给予工业工程专业教育的支持表示感谢。
在确定系列教材的选题时,我们主要考虑了以下原则:一是特色,要有工业工程学科的特色,选题应确属工业工程学科的课程,对一些可与其他学科共用的教材则不再列入;二是精选,编写内容应精选该学科公认的、经典的基本原理和方法,以及先进的管理理念,对一些尚有争论的观点则不予论述;三是实践,遴选的编著者应对该课程有丰富的教学实践经验,并在教材中尽可能地反映企业解决工业工程问题的实际案例。经过认真研究,我们确定了下列选题:工业工程———原理、方法与应用,生产计划与控制,物流工程与管理,现代制造企业管理信息系统,以上为第一批;人因工程,质量管理,决策支持系统,复杂系统解析,工程管理的模糊分析,制造系统建模与仿真,以上为第二批;工程经济学,工作研究,项目管理,工业工程计算方法(暂定名),以上为第三批。
参加这套系列教材编写的是上面提到的这几所大学的老师们,他们都是相应课程的任课教师。他们根据自己教学过程中反复修改过的讲稿,又参考了国内外的相关文献,在较短的时间内完成了教材的编写。他们精选教材内容,配以实例讲解,使学生易于掌握;同时,他们也力图将最近几年,工业工程的最新研究成果做简要的介绍,以使学生接触本专业的前沿。但是,由于编写时间比较仓促,编写者们的经验又各不相同,本系列教材的质量和水平一定是参差不齐的,也一定会存在一些缺点,希望能得到读者的批评和指正。特别要说明的是,在我们筹划这套系列教材的时候“,高等院校工业工程专业教材编审委员会”组编的7种教材尚未出版,当我们的编者拿到这7种教材时,我们的第一批4本书稿已形成初稿,但编者们仍然会从中得到启迪。
在工业工程系列教材第一批教材正式出版之际,我们深感欣慰,并对辛勤工作的老师们表示感谢。祝愿工业工程学科在教育界、工程界同仁的关怀下茁壮成长。
工业工程系列教材编委会主任中
国
工
程
院
院
士
2002年8月
前 言
计算机和信息社会的发展,要求突破传统的系统分析和解析方法的束缚,来解决更为复杂的理论和工程解析、设计问题。传统的系统分析和解析方法,其方是以稳定或均衡系统为前提的;而实际的客观系统,用稳定或均衡理论无法说明和解析的现象却大量存在,我们把其称为复杂系统。例如,先进电子制造产业的极造趋势,无论装备设计或是制造过程,已出现融合微细加工技术、自控技术、计算力学技术、计算机技术、检测技术、新材料技术以及管理技术等为一体的复杂机电工程系统,其中因极造过程中出现的多物理场、多相介质,以及高速、高精度要求,呈现出系统的复杂性。再例如社会层次的复杂系统因为具有思维能力的人的介入而变得极其复杂,其中较为典型的例子有社会经济系统、金融系统、企业组织管理系统等。在这类系统中,因人的参与所产生的不确定性、投机性及主客体易位等特征赋予了额外的复杂性。
复杂系统涉及的范围很广,包括自然、工程、生物、经济、管理、政治与社会等各个方面;它探索的复杂现象从一个细胞呈现出来的生命现象,到股票市场的涨落、城市交通的管理、自然灾害的预测,乃至社会的兴衰等等。由于各学科对复杂性的认识和理解都不一样,所以人们从避开术语上的争论出发,采用了“复杂系统”这个名词。概括起来,复杂系统都有一些共同的特点,就是在变化无常的活动背后,呈现出某种捉摸不定的秩序,其中演化、涌现、自组织、自适应、自相似被认为是复杂系统的共同特征。
复杂性科学是当前世界科学发展的热点和前沿,其研究与应用正在向各个学科渗透,成为受到众多科学家关注的交叉科学研究领域。复杂性科学与管理的结合是复杂性科学发展的一个重要方面,也正在成为一个新的学科交叉研究领域。有关研究与应用的兴起,已经引起越来越多的政治家、军事家、管理学家和企业高层管理者的兴趣和关注。复杂性科学是用以研究复杂系统和复杂性的一门方兴未艾的交叉学科。虽然它还处于萌芽时期,但已被有些科学家誉为是“21世纪的科学”。
克劳斯・迈因策尔在其《复杂性中的思维》一书中指出“:复杂系统理论不是一种形而上学的过程本体论,它也不是一种传统哲学意义上的认识论信念。这种方的原理,对于自然科学和社会科学中建构非线性复杂系统的模型,提供了一种启发性的图式。如果这些模型不能够进行数学处理,其性质不能够进行量化,那么我们得到一种经验模型,这样的模型也许与数据符合,也许不相符合。
2
复杂系统的分析与建模
而且,它力图在奥卡姆剃刀的意义上最小程度地运用假设。因此,他是一种数学的、经验的、可检验的和有启发性的经济的方。而且,它还是一种跨学科研究纲领,结合了多种自然科学和社会科学。”
如何将描述复杂系统的动力学理论引入工程学,是工程应用研究的重要方向。本书以复杂工程数字化建模、复杂工程管理的应用为主要背景,论述其方法和技术。其内容为:分形理论、遗传算法、神经网络、元胞自动机、人工生命等分析方法。目标在于论述自下而上的自组织、自适应、自优化的复杂系统分析方法,从宏观和微观方上进行综合和交叉,构造更高层次系统的技术和方法。这作为跟踪世界发展动向,反映新领域、新知识、新成果、新资料、新方法是有必要的。
本书大部分章节由上海交通大学王安麟教授著;第2章由上海电力学院马立新教授著;3.3.3节、3.3.4节、4.3.1节、5.3.3节、5.3.4节、5.3.7节、6.3节由上海交通大学赵群飞教授著。
本书许多内容是在国家自然科学基金重大项目(50390060)和国家自然科学基金面上项目(50475019)的资助下完成的,在此谨向国家自然科学基金委员会表示感谢。
著 者
2005年1月
目 录
第1章 复杂系统的基本分析……………………………………………………1
1.1 复杂性…………………………………………………………………2 1.1.1 自然界的复杂性………………………………………………2 1.1.2 复杂性的基本概念……………………………………………21.2 工业管理过程的复杂性………………………………………………9 1.2.1 从工业经济看工业管理的复杂性……………………………9 1.2.2 从制造过程看工业管理的复杂性……………………………9 1.2.3 工业管理的发展趋势———自组织化…………………………101.3 复杂系统的控制与决策………………………………………………14 1.3.1 复杂系统管理方法……………………………………………14 1.3.2 复杂管理信息的集成化和智能化……………………………16 参考文献……………………………………………………………………26第2章 复杂系统的分形自相似分析与建模…………………………………27
2.1 复杂系统的自相似过程………………………………………………27 2.1.1 什么是自相似…………………………………………………27 2.1.2 自相似的模拟…………………………………………………29 2.1.3 分形几何的特征………………………………………………302.2 复杂系统的分形建模技术……………………………………………32 2.2.1 分形几何的产生和意义………………………………………32 2.2.2 分形的定义……………………………………………………33 2.2.3 分维的计算……………………………………………………35 2.2.4 分形时间………………………………………………………37 2.2.5 分形几何学的应用……………………………………………372.3 分形在工程系统中的自相似分析与建模……………………………38 2.3.1 股票价格的预测模型…………………………………………38 2.3.2 企业需求的预测………………………………………………41 2.3.3 符合分形原理的企业供应链的管理…………………………43
2
复杂系统的分析与建模
2.3.4 其他预测问题的应用…………………………………………45 参考文献……………………………………………………………………47第3章 复杂系统的元胞自动机自组织分析与建模…………………………49
3.1 元胞自动机与自组织过程……………………………………………49 3.1.1 什么是自组织过程……………………………………………49 3.1.2 元胞自动机的自组织…………………………………………51 3.1.3 模拟自组织过程………………………………………………533.2 复杂系统的元胞自动机建模技术……………………………………55 3.2.1 “生命的游戏”…………………………………………………56 3.2.2 元胞自动机的基础……………………………………………57 3.2.3 元胞自动机的自组织建模方法……………………………… 3.2.4 元胞自动机的应用领域………………………………………673.3 元胞自动机在工程系统中的自组织化分析与建模…………………69 3.3.1 城市交通信号自组织控制模型………………………………69 3.3.2 结构拓扑的自组织进化………………………………………75 3.3.3 股票市场投资行为的模拟……………………………………81 3.3.4 交通流中多自主体人员行为的模型…………………………86 参考文献……………………………………………………………………91第4章 复杂系统的遗传进化分析与建模……………………………………94
4.1 遗传算法与进化过程…………………………………………………94 4.1.1 进化算法的概述………………………………………………94 4.1.2 遗传算法的决策机理…………………………………………9.2 复杂系统的遗传算法建模技术………………………………………97 4.2.1 遗传算法的概貌………………………………………………97 4.2.2 单纯型遗传算法………………………………………………99 4.2.3 模式定理(schematatheorem)……………………………104 4.2.4 遗传算法的有关操作规则和方法…………………………10.3 遗传算法在工程系统中的进化分析与建模………………………111 4.3.1 财务规划问题的解法………………………………………111 4.3.2 非线性强制振动解的解法…………………………………113 4.3.3 无序加工调度………………………………………………118
目 录
3
4.3.4 港口投资辅助决策…………………………………………122 参考文献……………………………………………………………………127第5章 复杂系统的神经网络自适应分析与建模……………………………129
5.1 神经网络与自适应分析概述………………………………………129 5.1.1 什么是自适应过程…………………………………………129 5.1.2 神经网络的适应性模拟……………………………………130 5.1.3 企业的自适应管理…………………………………………1315.2 复杂系统的神经网络建模技术……………………………………135 5.2.1 神经网络的概述……………………………………………135 5.2.2 神经网络的主要特点………………………………………137 5.2.3 细胞元模型…………………………………………………139 5.2.4 神经网络模型………………………………………………142 5.2.5 神经网络的学习……………………………………………146 5.2.6 多层前向神经网络(BP网络)………………………………152 5.2.7 典型反馈网络———Hopfield网络…………………………163 5.2.8 基于概率学习的Boltzmann机模型………………………1685.3 神经网络在工程系统中的自适应分析与建模……………………174 5.3.1 非线性系统的识别…………………………………………174 5.3.2 案例挖掘的神经网络决策…………………………………184 5.3.3 新产品和改型产品成本估计的模型………………………190 5.3.4 企业破产预测………………………………………………194 参考文献……………………………………………………………………202第6章 复杂系统的人工生命模型分析………………………………………204
6.1 复杂系统的人工生命分析…………………………………………204 6.1.1 人工生命的特征……………………………………………204 6.1.2 人工生命的自繁衍…………………………………………206 6.1.3 人工生命的适应性…………………………………………207 6.1.4 人工生命的自组织…………………………………………209 6.1.5 人工生命技术的本质………………………………………2116.2 人工生命的方法……………………………………………………212 6.2.1 人工生命的进化模型………………………………………212
4
复杂系统的分析与建模
6.2.2 L系统与形态生成模型……………………………………218 6.2.3 人工生命的研究内容归纳…………………………………2216.3 人工生命在工程系统中的分析与建模……………………………224 6.3.1 金融证券市场分析决策中的应用…………………………225 6.3.2 计算机动画…………………………………………………227 6.3.3 提速因特网…………………………………………………228 参考文献……………………………………………………………………231
第1章 复杂系统的基本分析
我国著名科学家钱学森于1981年提出三个崭新的科学技术部门:系统科学,思维科学和人体科学。十多年来,他在这三个领域做了大量工作,并于20世纪80年代末总结和提炼出“开放的复杂巨系统”的概念。1990年,《自然》杂志发表了钱学森教授和他的合作者的论文《一个科学新领域———开放的复杂巨系统及其方》,文中首次指出,对于自然界和人类社会中一些极其复杂的事物,可以用开放的复杂巨系统来描述。
克劳斯・迈因策尔在其《复杂性中的思维》著作中指出“:复杂系统原理主张物理的、社会的和精神的世界都是非线性的、复杂的。这个基本的认识论结论对于我们现在的行为和未来的行为,都有重要的影响”。“在自然科学中,从激光物理学、量子混沌和气象学直到化学中的分子建模和生物学中对细胞生长的计算机辅助模拟,非线性复杂系统已经成为一种成功的求解问题方式。另一方面,社会科学也认识到,人类面临的主要问题也是全球性的、复杂的和非线性的。生态、经济或政治系统中的局部性变化,都可能引起一场全球性危机。线性的思维方式以及把整体仅仅看作其部分之和的观点,显然已经过时了。认为甚至我们的意识也受到复杂系统非线性动力学所支配这种思想,已成为当代科学和公众兴趣中最激动人心的课题之一”。
复杂性科学是用以研究复杂系统和复杂性的一门交叉学科。虽然它还处于萌芽时期,但已被有些科学家誉为是“21世纪的科学”。复杂性科学研究的复杂系统涉及的范围很广,包括自然、工程、生物、经济、管理、政治与社会等各个方面;它探索的复杂现象从一个细胞呈现出来的生命现象,到股票市场的涨落、城市交通的管理、自然灾害的预测,乃至社会的兴衰等,目前,关于复杂性的研究受到了世界各国科学家们的广泛关注。1999年,美国《科学》杂志出版了一期以“复杂系统”为主题的专辑,这个专辑分别就化学、生物学、神经学、动物学、自然地理、气候学、经济学等领域中的复杂性研究进行了报道。由于各学科对复杂性的认识和理解都不一样,所以该专辑避开术语上的争论,采用了“复杂系统”这个名词。概括起来,复杂系统都有一些共同的特点,就是在变化无常的活动背后,呈现出某种捉摸不定的秩序,其中演化、涌现、自组织、自适应、自相似被认为是复杂系统的共同特征。
2复杂系统的分析与建模
1.1 复杂性
1.1.1 自然界的复杂性
自然界在我们看来是个十分复杂的系统,在这个庞大的时空域里,存在着无数个变幻无穷的、奇妙的现象。在想象中,要去完全理解这个世界是极具挑战性的事。但是,在研究中,人们发现自然界中的复杂系统并不是完全无规律可循的,相反,它们都可以认为是由许多简单元素按照某种规则交互作用所形成的,而且这些规则也并不是与所有元素相关的,而是各规则只影响很小范围的本地元素,就连整个自然界也可认为是许多简单元素在这样的规则的相互影响下形成的平衡系统。就好像自然界中的食物链和空气成分一样,它们各自动态变化着,但却相互影响,保持着系统的稳定。它们表现出来的复杂现象都是大量元素在一些简单的规则驱动下交互作用的结果。
在这样一个世界里,我们就像一个个微小的分子或单元被吸收进一个十分纷繁的物质空间中,而整个空间所组成的系统在随着时间的流逝或空间位置的迁移千变万化,我们周围的一切,包括我们自己都在做着不停息的、无法捉摸的变化。这些变化经常是复杂的,或者说是毫无规律可循的,但是正是这些变化和变化的主体构成了一个整体上总是保持稳定的世界。在我们的想象中,事物是变化着的,而且是没有规律的,永不循环的,那么这些变化着的事物的集合怎么可能组成一个健强性的整体呢?
人们一直在寻求各种事物的变化规律,就好像有人企图知道圆周率π的值究竟到多少位以后开始循环的,可大家都认为π是无限不循环小数,它永远不会循环的。这就是说在一个系统中不可以只看其中一个事物的变化规律,因为有些规律是永远找不到的。但是,我们知道一个系统是由很多个个体组成的,更重要的是这些个体之间是存在着各种交互作用的,那么我们为什么不从系统整体出发,通过确定个体之间的交互关系来了解整个系统的情况呢?
同时,我们还意识到在复杂系统及其变化规律的研究中,使用传统的思想和方法已经不能给我们比较满意的结果,要想更加深入地了解这些复杂系统,就必须从崭新的角度,应用更为灵活和具有泛用性的方法来处理这些复杂系统。
1.1.2 复杂性的基本概念
1.1.2.1 复杂性的哲学认识
第1章 复杂系统的基本分析3
1.复杂性与简单性
按照传统的理解,复杂与简单只能相比较地把握。一种事物未被认识或一个问题未找到解决办法时被当作复杂的,一旦认识或找到解决方法后就成为简单的了。钱学森在评述这种观点时曾说“:有同志认为‘复杂性’只是人们在面对一个新问题、新领域时的初步感受,后来认识了,就不复杂了。从人认识事物的过程来讲,这也是正确的。由浅到深也就由‘复杂’到不复杂”,在这种被广泛接受的观点后面隐藏的根本哲学观点是,简单与复杂的划分纯属认识论范畴,不具有本体论意义。
从科学方角度看,复杂性应是复杂性科学的首要概念,需要给出它的科学定义。复杂性研究的提出至少可以追溯到20世纪40年代末,明确提出建立复杂性科学这个科学任务也已十多年,不同学者基于不同的学科背景和研究对象,给出不同的复杂性定义。据约翰・霍甘提供的信息,塞思・劳埃德共收集了45种复杂性定义,如分层复杂性、算法复杂性、随机复杂性、有效复杂性、同源复杂性、基于信息的复杂性、时间计算复杂性、空间计算复杂性等。复杂性是现代科学中最复杂的概念之一,至今无法给出统一的定义是正常的,也许根本就不存在统一的复杂性定义。
我们认为,至少目前不必追求这种统一定义,应当容忍和接受不同意义下的复杂性,允许不同学科有不同的定义。多样性、差异性是复杂性固有的内涵,只接受一种意义下的复杂性,就否定了复杂性本身。定义的多样性无疑会增加不同学科之间交流的困难,但可以超越哲学思辩式的议论,开展具有可操作性的实证研究。这种研究成果多了,就可能概括出较一般的复杂性概念。
其次,应当区分不同层次上的复杂性。物理、生物、社会、意识这些现实世界的不同层次各有性质不同的复杂性,既不可以拿低层次的复杂性代替高层次的复杂性,也不可以拿高层次的复杂性否定低层次的复杂性,不可混淆不同层次的复杂性。纯粹物理系统的复杂性后于最低层次的复杂性,人的意识和人类社会具有的复杂性应属最高层次的复杂性。中间尚有各种层次的复杂性。不同层次的复杂性须有不同的定义,使用不同的研究方法。
复杂性研究的另一条思路,是先不考虑给复杂性概念下定义,针对具体的复杂系统类型分别进行研究。如钱学森划分出一类对象叫做开放的复杂巨系统,先研究一个个具体的开放复杂巨系统,如人脑系统、人体系统、社会系统、生物圈系统、地理环境系统等,再根据这些成果概括出开放的复杂巨系统理论。美国圣塔菲学者提出一类称为规则支配的复杂适应系统,如人体免疫系统、神经系统、经济系统、人工生命、可持续发展等,着重寻找解决若干实际复杂适应系统问题的理论和方法,再建立复杂适应系统的一元化理论。
需要指出,我们既要承认简单性与复杂性有定性性质或本体论的区别,又应
4复杂系统的分析与建模
承认它们都是模糊概念,在各自的核心部分明确肯定(代表各自的本质规定性),在远离核心处又相互交叠、渗透,从典型的简单性到典型的复杂性是逐步过渡的,没有截然分明的界线。所以,无论圣塔菲的复杂适应系统,还是钱学森的开放复杂巨系统,都是模糊概念,不能苛求给它们划出明确的边界,一些系统能否应用他们的方法,需要灵活处理。
2.何为复杂性
钱学森认为“:所谓‘复杂性’实际是开放的复杂巨系统的动力学”。即构成元素不仅数量巨大,而且种类极多,彼此差异很大,它们按照等级层次方式整合起来,不同层次之间往往界限不清,甚至包含哪些层次有时并不清楚。这种系统的动力学特性就是复杂性。
描述符合科学规范的复杂性统一定义较难。为了探讨复杂性同简单性之间的定性区别,苗东升在其《论复杂性》中对复杂性的根源做了以下考察:
源于系统规模的复杂性。系统组分的数目代表系统的规模,在一定范围内,规模增大不足以造成现有方法无法处理的复杂性。复杂性的形成需要足够的系统规模,规模巨大就会带来描述和处理的困难,小系统或大系统的方法无济于事。简单系统不存在源于规模的复杂性,具有足够规模(圣塔菲要求系统有中等规模,钱学森要求达到巨系统规模)是产生复杂性的必要条件,但不是充分条件,即使巨系统也不一定是复杂系统。
源于系统结构的复杂性。组分的多样性和差异性造成组分之间相互关系的多样性和差异性,是系统复杂性的根本源泉。对于产生复杂性,结构效应比规模效应要紧得多。因为组分的差异越大,把它们整合起来的难度就越大。特别地,等级层次结构是复杂性的主要根源之一,复杂性研究者几乎都强调这一点。只有元素和整体两个层次的系统必定是简单的,被当作非等级层次结构;在元素层次上不能完成全部整合任务,需要经过不同层次逐级整合才能最终形成系统整体,因而在元素与系统整体之间还有中间层次的系统,才是等级层次结构。复杂性只可能出现于等级层次结构的系统中。层次越多,越容易产生复杂性。把多样性或多个层次束缚在一起就是系统,它的词义隐含了复杂性来源于层次结构的观念。
源于开放性即环境的复杂性。封闭系统没有复杂性,复杂性必定出现于开放系统。家务机器人被当作复杂系统,其复杂性并非来自系统规模或结构,而是来自环境———家务劳动的多样性和极不规则性。但对外部环境开放也不是产生复杂性的充分条件。即使外部环境对系统的影响不能忽略,只要可以近似地当作对系统的干扰、摄动因素看待,或者系统行为可以归结为输出对输入的响应关系,就还是简单系统,用传统的封闭系统模型加摄动的方法,或者黑箱方法,足以有效地处理。只有当外部环境对系统的作用不再允许当作干扰、摄动,而是系统
第1章 复杂系统的基本分析5
自身特性的有机构成成分,封闭系统加摄动方法或者黑箱方法都失效,这种系统必然呈现某种复杂性。开放性也是复杂性的重要根源,系统与环境相互关系的复杂性是系统复杂性的重要表现。
源于动力学特性的复杂性。动力学因素可以忽略不计的系统,或者动力学因素可以作为静态模型的干扰因素来对待的系统,一定是简单系统。动力学过程可能产生无穷的多样性、差异性、丰富性、奇异性(包括分叉、突变、混沌等)、创新性,是产生复杂性的重要机制,复杂性只能出现于动力学系统,复杂性一定是某种动力学特性。动力学因素是产生复杂性最重要的物理学根源。但动力学因素也不是产生复杂性的充分条件,许多动力学系统(如经典控制论和运筹学处理的系统)还是简单系统。
源于非平衡态的复杂性。平衡态不可能产生复杂性,处于平衡态的系统都是简单的。非平衡态也不一定产生复杂性,所谓**衡态的系统特性原则上可以使用平衡态的处理方法,或加以小的修正。复杂性只能出现于远离平衡态,在这种条件下系统通过自组织形成耗散结构,即自组织地产生出复杂性。复杂系统必定是处于平衡态的系统、耗散结构才具有最小的复杂性。物理化学层次的耗散结构还不可能具有生物复杂性,但只有具备了这种最小复杂性,才可能进化出更高级的生物复杂性。
源于不可积性的复杂性。保守的可积系统没有复杂性,复杂性只能出现于不可积系统。但弱不可积系统,即近可积系统,与可积系统没有定性区别,用可积系统加不可积性扰动的办法即可处理,这里也不可能出现复杂性。远不可积系统才是复杂性的来源,如果不可积性扰动达到使KAM环面基本破坏时,系统轨道就复杂得难以预测了。
源于不可逆过程的复杂性。可逆过程没有复杂性,还原论方法足以解决问题。复杂性只能出现于不可逆过程。但不可逆性也有差别,须加以区分。逻辑上说,应当存在近可逆过程,它的不可逆性微弱,可以作为扰动因素。即以可逆过程为模型,加上不可逆扰动,就能够获得真实过程的近似描述。真正的复杂性只能来源于远不可逆过程(物理学似乎尚未提出这种概念),是系统在不可逆过程中的动力学行为。
源于非线性的复杂性。哲学家早已指出,事物发展变化的终极原因是相互作用,但相互作用有线性和非线性之分。线性意味着单一、均匀、不变,不具备产生复杂性的根源,线性系统都是简单系统,线性相互作用产生的是简单性,无法造就复杂性。非线性意味着无穷的多样性、差异性、可变性、非均匀性、奇异性、创新性。元素之间、子系统之间的非线性相互作用是系统产生复杂性的根本内在机制,复杂性只能出现于非线性系统。但非线性自身包含极大的差异性。弱非线性,或非本质非线性,仍然不可能产生复杂性,可以作为扰动因素处理,特别
6复杂系统的分析与建模
是系统的局部性质,用线性模型加微扰的方法往往可以有效描述。只有强非线性,特别是本质非线性,才可能产生复杂性。
源于不确定性的复杂性。确定性连通简单性不确定性连通复杂性。首先是源于随机性的复杂性。但随机性也不是产生复杂性的充分条件,平稳随机过程属于简单系统,非平稳过程才可能出现复杂性。简单地宣布随机性是最大的复杂性,并无事实依据。物理系统随机性的规律一般只服从大数定律,仍属于简单性范围,可以用统计方法处理。生命系统、社会系统、意识系统的组分具有智能,组分之间有复杂的相互作用,只靠大数定律不能揭示其本质特征,宏观整体特性不能仅仅看作大量微观组分相互碰撞的结果,现在的概率统计方法不足以处理这类系统中的随机过程。例如,不可能从细胞特性出发通过统计综合获得人体系统的整体运动特性,不可能从个人特性出发通过统计综合获得社会系统的整体特性。另一种重要的不确定性为模糊性,它既是复杂性的来源,又是复杂性的表现或结果。札德的模糊集理论就是为处理复杂性而提出来的,他的不相容性原理认为,系统的复杂性超过一定阈值,描述的精确同描述的有意义互不相容,二者不可兼得。但目前的复杂性科学尚未涉足模糊性问题。
源于主动性、能动性的复杂性。作用者与被作用者、原因与结果界限分明的是简单系统。不同组分之间、系统与环境之间互为因果,互动互应(所有组分都既是被作用者,又是主动作用者),一连串的、相互交叉的、网络式的因果联系,才能产生复杂性。特别是当组分有一定的自适应能力时,在不断适应环境的行为过程中必然产生出整体的复杂性。圣塔菲的一个基本信念是适应性产生复杂性,所谓复杂适应系统就是在不断适应环境的过程中产生出复杂性的系统。
源于系统组分智能的复杂性。由非智能组分构成的系统(如耗散结构论和协同学研究的贝纳德流、固体激光器等),即使通过自组织这种主动过程产生出复杂性,一般也是较为初步的、低级的,总有办法对付,属于初级复杂性。由具有智能的组分构成的系统(如圣塔菲研究的CAS)能够辨识环境,预测未来,在经验中学习,以形成好的行为规则,使自身发生适应性变化,因而必定是复杂的。组分的智能愈高级,系统的复杂性也愈高级。组分智能是复杂性的重要根源之一。如地缘政治系统一般包含为数不多的组分,属于小系统,至多算作大系统,但由于组分是具有高级智能的主体,使得系统整体行为异常复杂多变,往往难以预测,一般属于开放的复杂巨系统。
源于人类理性的复杂性。以人作为构成要素的系统,其行为必须考虑人的理性因素的作用。尤其在竞争性系统中,博弈者的理性(智慧、谋略等)是产生复杂性的重要来源。但在完全理性(无限理性)假设下,复杂性的根源被抛弃了,博弈方都采取最大-最小策略,这种系统仍然是简单的,可按照运筹学处理。不完全理性即有限理性才可能产生复杂性。
第1章 复杂系统的基本分析7
源于人类非理性的复杂性。非理性,如人的感情、意志、偏好等,必然带来至少现在的科学还无法描述的行为特征,这也是复杂性的重要根源。目前的科学发展还极少涉及这类复杂性来源。
苗东升并指出,上述考察虽不完备,至少可以表明的确存在本质上属于复杂性的对象领域,简单性与复杂性有本质上的区别。
1.1.2.2 复杂性程度的表达
科学要研究各种客观事物。哲学家对它的描述偏于定性,科学家对它的描述偏于定量。
一种观点认为,度量复杂性的标度有:系统状态空间维数(原指系统内部运动的要素、关系、层次个数);系统随参量变化的阶数(原指阶数反映处理问题的难度)多少;演化中相互关系的次数多少。根据近年来研究的发展,系统空间状态维数此时不仅是系统内部运动的要素多少,而且标志系统占领状态空间的能力大小。分数维数的出现,标志着复杂性的度量有了新的尺度。复杂性标度的另一个重要发展是,在不同标度变换下的不变性,这是认识复杂性的重要尺度,自相似性和分维都是这种尺度的反映,也是复杂性的层次穿越性
[2]
。
另一种观点认为,对复杂程度的定量理解需要认识分布函数(例如概率分布为其特例),要理解分布函数,从广义集合概念的理解较为简单。广义集合是描述很多客观事物的定量方法。分布函数是广义集合的必然伴生物。复杂性程度(熵)是对分布函数的一种计算(泛函数。熵原理是高概率事件容易出现的翻版,也是解释很多分布函数的理论武器)。
1.广义集合
集合概念可以描述彼此不同的客观事物,但是它不过问相同的事物的数量有多少。为了同时可以描述不同的事物有哪些及相同的事物有多少,我们引入了广义集合概念(暂定名称)。后面会看到广义集合比集合概念更容易进入物质科学(自然和社会科学)。
例如,我们已经明确了血液血型有A,B,O,AB四种。用集合语言就说这个集合内有四个元素A,B,O,AB。把此类问题抽象为一个模型,它可以回答“不同的某某各有多少?”的问题,而对这个问题的每个具体的答案就是一个具体的广义集合。
我们给广义集合的定义是:由多个(地位相同的)个体组成的一个总体,而这些个体的某种特征(标志)可能不尽相同。其中每个个体的具体特征称为标志值。定义强调把总体(系统)看成是由多个地位相同的个体组成的。还隐含了每个个体必须对论及的标志有确定的标志值的含义。
广义集合除了有并、交等运算外还有个重要的特性:它必然伴有一个分布函
8复杂系统的分析与建模
数。
2.分布函数
经过对10000人的调查,A,B,O,AB血型的人数分别是3000人,4000人,2500人和500人。这回答了不同血型的人各有多少。而血型(x)与人数(y)的关系是函数的关系。我们把“描述一个广义集合内标志值(x)与它对应的个体的数量(y)的关系称为该广义集合的分布函数”。
只要把确定的一个总体(系统)分成若干个个体,而且知道每个个体的某种特征的标志值就可以统计出不同某个体各有多少。明确了一个广义集合也就知道了一个分布函数。
在社会和自然学科领域中,通过大量的观测数据,有了分布函数这个统一的概念,便于从这些数据中归纳出具体的分布函数。在科学上从数据中找到一个分布函数相当于找到了一个经验公式,这本身也是研究成果。从理论上找出分布函数是包括熵原理在内的各种理论的任务。
3.复杂程度———熵
对分布函数的一种计算可以得到一个数,它就是该广义集合的内部状态的复杂程度。例如,对10000人的血型的复杂程度C可以用下式计算:
ni
C=
∑(-i=1
xilogpi)
式中:xi表示集合元素(血型)的个体数;pi表示该种个体占的比例(=xi/N,N是广义集合内的个体总数)。
这是计算各种广义集合的复杂程度的基本公式。把这个公式与信息论中计算信息熵的公式对比不难发现,信息论中的信息熵H与复杂程度C1(比例系数)是正比例的关系:
ni
C=C1H=C1∑-xilogxi
i=1
可见,复杂程度的公式与信息熵的公式有很多类似之处。所以信息熵的很多性质都有复杂程度。这样复杂程度就与信息熵联系了起来。
我们从客观事物(广义集合)的角度直接引入一个客观的物理量———复杂程度。与信息熵相比,它免去了后者在定义时对随机变量、概率甚至信号的通信模型等概念的依赖。复杂程度是从客观事物的内在状态的差异性入手定义的。把它用于分子、原子、电子等微观尺度,就成了宏观的热力学熵。把它用于信号的传输领域就成为信息论中的以概率为纽带的信息熵。
科学已经揭示物质是有质量和(或)能量的。当我们承认任何物质内部都存在状态的差异时也就承认了它的复杂程度大于零。质量、能量和复杂程度是物质的最基本的三个物理量。我们已经知道了质量和能量的变化规律。复杂程度
第1章 复杂系统的基本分析9
的客观性决定了关于它的客观规律必然存在。我们曾经把它称为复杂度定律。下节介绍的最复杂原理就是这个定律的重要组成部分。
1.2 工业管理过程的复杂性
1.2.1 从工业经济看工业管理的复杂性
在200多年前,发生了工业。此后,以电力、石油为代表的能源工业和以钢铁为代表的材料工业得以飞速发展。同时,交通运输与通信等基础设施也发展起来。在此基础上,制造工业获得突飞猛进的发展,劳动力大批地从农业转向工业,人口集中,建筑工业飞快发展,大城市开始形成。商业开始与生产分离,健全的市场经济与完善的金融体系逐步形成。庞大的现代工业体系和工业经济得以确立。
与数千年漫长的农业经济时代相比较,历时仅200余年的工业经济发挥出了远为巨大的开发与利用自然资源的能力,创造出了惊人的社会财富和高度的现代物质文明。可是,隐藏在这些辉煌成就背后的代价却是对于自然资源的穷尽式的消耗和对于生态环境的严重破坏。
人类本来是自然进化的产物,可是,当人类进化到工业经济时代以后,却以一个人造的“文明”将自己包围起来,使自己与大自然隔离,远离自然,甚至到与自然为敌的地步。人类大规模的制造活动对于其自身的生存环境造成了不可逆转的影响,使物质与能量的品质降低,而低品质的物质和能量是无法再加以利用的。
工业经济的行为模式是对于自然过程的人为的、强制性的干预。这种模式的典型代表是制造业中的“福特模式”,其特点可以归纳为:标准化产品的大量生产、互换性原理的应用、流水作业和精细分工、刚性生产设备、专业分化和顺序决策、集中领导与分级管理。福特模式是一种“机械的模式”,它把整个企业组织得像一架机器,而每个工作人员,无论是技术人员或操作工人,都像一台机器中的零件,齿轮或螺丝钉,在那里机械地运转。这种模式将制造系统及其组成单元视为“死的”、没有任何主动性的东西,强调从制造系统外部来对之加以设计、组织和控制。这种模式适应了当时的技术水平和经济发展的需要,可是却泯灭个性,以牺牲个体的自主性来成全整体的协调一致性。这种工业经济的行为模式与个体间的矛盾决定了工业管理过程的复杂性。
1.2.2 从制造过程看工业管理的复杂性
众所周知,现代制造系统和制造过程日趋复杂。导致今天的制造系统复杂
10复杂系统的分析与建模
化的因素主要有三:
(1)现代产品的结构愈来愈复杂、功能越来越多样,而制造工艺也要求越来越精细。复杂的产品、精细的工艺极大地提高了制造系统和制造过程的复杂程度。
(2)消费日趋个性化、多样化。大批大量制造的标准化的、规格划一的产品不再为顾客所青睐。制造企业不得不转向多品种小批量的生产模式,而且必须加快产品更新换代的速度。“以产品为中心”的生产正在转变为“以顾客为中心”的生产。这些要求都极大地增加了制造系统和制造过程的组织、运行与调度的复杂程度。
(3)在全球经济一体化的形势下,跨行业、跨地区,乃至于的制造企业和制造资源正在集结成一个庞大的、复杂的制造网络。这个网络每时每刻都在遭受动态的扰动,经历着动态的调整。这么一个庞大、复杂的系统,其组织和运行的复杂性是可想而知的。
以上是就制造业内部来说的。从外部环境来看,世界正在进入知识经济时代。在知识经济成长的过程中,制造业面临着严峻的挑战,经历着十分深刻的变化。其中最突出的变化是知识化、服务化及网络化。同时,我国的制造业正在经历着从计划经济向市场经济转变和从粗放型经营向集约经营转变。所有这些变化都促进了制造系统复杂化的进程。
现代制造系统的复杂性首先表现在它的固有的非线性上;其次,表现在多自律单元的协同及其突现行为上;第三,表现在它的开放性上;第四,是它的非平衡性;最后,制造系统是生存在一个随机变化、难以预测的环境中,它必须具备“随机应变”的能力。对于如此复杂的系统,以任何传统的运行模式与控制方法都是绝对无法驾驭的,而必须更新思想方法与行为模式,寻求新的途径与手段。
1.2.3 工业管理的发展趋势———自组织化
许多天然的或人造的复杂系统都是由大量的单元构成的,如生命系统、生物群落、生态系统、人类社会、消费市场以及制造系统等。在如何组织、运行和优化这类由大量单元所构成的系统上,自然造化与人工经营之间存在明显的分野:前述从外部来对系统加以设计、组织和控制的模式可称为是“他组织”的模式,迄今包括人类的制造系统在内的几乎所有的人造系统都是采用“他组织”的模式;而以生命现象为代表的自然系统则采取了完全不同的路线———自组织化的路线。
1.工业管理的复杂过程
二战后西方国家企业管理进入战略时代,大量曾经在军事中得到广泛应用的战略思想被用于企业管理。到20世纪80年代,SWOT分析、经验曲线、战略组合、竞争优势等战略概念已得到广泛运用。战略分析植根于均衡的产业结构,
第1章 复杂系统的基本分析11
却对20世纪70年代末期以来涌现的新兴产业和迅速发展的新兴市场为力。面对来自迅速成长的新兴产业和新兴市场的挑战与机遇,许多公司将管理重点转向提高绩效。20世纪80年代中后期以来,全面质量管理、准时生产、公司再造等管理理论和方法得到推广。但如今企业界的忧虑并未消除,在不确定性日益增强的高度动态性的环境里,单纯降低成本、提高质量或改进战略已不能应付敏捷的竞争,许多企业被快速的变革拖垮,它们仓促的创新也因缺乏远见而归于失败。
复杂理论的研究给工业管理学界带来了新的研究思路。20世纪80年代中期,一群具有生物、物理、计算机、经济学背景的杰出科学家聚集在桑塔费开始了对复杂现象的研究,他们在冯・诺曼、费舍尔等前人工作的基础上,深入研究了在凝聚态物理学、微生物学、古生物学、考古学、经济学等学科中普遍出现的具有共性(如自学习、自适应、共生演进等)的现象,并将成果提炼为一门科学,即复杂性科学。
同自然界许许多多复杂自适应系统一样,人类社会经济生活中也存在各种各样的复杂系统,研究认识这些系统的特性、运行规律是科学家的职责;但如何应付、控制和管理这些复杂系统,则是工程技术人员、管理学家和管理实践者所必须关心和面对的问题。管理的目的在于通过对系统的干预达到预期的效果,而要做好复杂系统的控制管理或干预,就必须首先认识复杂的特性和运行机理。目前研究者们从系统的复杂性和复杂系统干预控制等方面已做了大量工作。有学者将复杂理论运用于组织转型方面的研究,把组织学习与耗散结构的研究成果结合起来,对学习型组织的概念作了进一步的拓展,将隐藏在传统组织内的学习和共同演进的动因发掘出来,并将成果用于业务流程再造。帕斯格尔等人在研究战略规划时将组织视为一个自适应的系统,一项复杂的任务可能会将组织推向混沌,处于混沌边缘的系统内各元素之间的联系得到加强,系统旧的平衡被打破,系统内各元素的相互作用使系统整体表现出多种多样的行为,在环境的作用下自适应系统有向结构更为复杂、功能更加完善的方向发展的趋势,这也正是引进新战略的目的所在。在信息管理领域,开发大型信息系统的过程中必须将复杂性作为系统的内在特性来对待,而不能将其视为需要克服的对象。林达在人力资源的研究中发现在知识资本成为保持企业竞争优势的核心资源的今天,要将个人的知识和灵感与组织长期目标和战略连接起来,也必须将公司视为一个复杂系统,不仅要重视公司和个人之间的纵向联系,更要重视员工之间活跃的横向联系所传递的信息和这些信息所反应出的系统动向。
2.工业自组织管理的概念、特征、机制
社会层次的复杂系统因为具有思维能力的人的介入而变得更为复杂。典型的如社会经济系统、金融系统、企业组织管理系统等,在这类系统中,因人的参与
12复杂系统的分析与建模
所产生的不确定性、投机性及主客体易位等特征赋予了额外的复杂性。如何将描述复杂系统的动力学理论引入管理科学,探讨工业自组织管理概念、特征、机制是管理科学的重要问题。
1)自组织的概念
“自组织”是现代非线性科学和非平衡态热力学中最令人惊异的发现之一。基于对物种起源、生物进化和社会发展等过程的深入观察和研究,一些新兴的横断学科从不同的角度对“自组织”的概念给予了解说:
从系统论的观点来说“,自组织”是指一个系统在内在机制的驱动下,自行从简单向复杂、从粗糙向细致方向发展,不断地提高自身的复杂度和精细度的过程;
从热力学的观点来说“,自组织”是指一个系统通过与外界交换物质、能量和信息,而不断地降低自身的熵含量,提高其有序度的过程;
从统计力学的观点来说“,自组织”是指一个系统自发地从最可几状态向几率较低的方向迁移的过程;
从进化论的观点来说“,自组织”是指一个系统在“遗传”“变异”、和“优胜劣汰”机制的作用下,其组织结构和运行模式不断地自我完善,从而不断提高其对于环境的适应能力的过程。达尔文(C.R.Darwin)的生物进化论的最大功绩就是排除了外因的主宰作用,首次从内在机制上、从一个自组织的发展过程中来解释物种的起源和生物的进化。
2)自组织的特征
自组织现象是包括生命系统在内的许多天然系统中,最引人入胜而又发人深思的一种行为。与“他组织”相比较,自组织系统的行为模式具有以下突出的特征:
(1)信息共享。系统中每一个单元都掌握全套的“游戏规则”和行为准则,这一部分信息相当于生物DNA中的遗传信息,为所有的细胞所共享。
(2)单元自律。自组织系统中的组成单元具有决策的能力,在“游戏规则”的约束下,每一个单元有权决定它自己的对策与下一步的行动。
(3)短程通信。每个单元在决定自己的对策和行为时,除了根据它自身的状态以外,往往还要了解与它临近的单元的状态,单元之间通信的距离比起系统的宏观特征尺度来,要小得多,而所得到的信息往往也是不完整的。
(4)微观决策。每个单元所作出的决策只涉及它自己的行为,而与系统中其他单元的行为无关;所有单元各自的行为的总和,决定整个系统的宏观行为;自组织系统一般并不需要涉及整个系统的宏观决策。
(5)并行操作。系统中各个单元的决策与行动是并行的,并不需要按什么标准来排队,以决定其决策与行动顺序。
第1章 复杂系统的基本分析13
(6)整体协调。在诸单元并行决策与行动的情况下,系统结构和“游戏规则”保证了整个系统的协调一致性和稳定性。
(7)迭代趋优。自组织系统的宏观调整和演化并非一蹴而就,而是在反复迭代中不断趋于优化;事实上,这类系统一般无法达到平衡态,而往往处在远离平衡态的区域进行永无休止的调整和演化;一旦静止下来,就表示这类系统的“死亡”。
3)自组织的机制
物种起源、生物进化和社会发展等自组织过程的发展方向是从混乱走向有序,可是热力学第二定律却断言一个孤立系统必然从有序走向混乱。这曾经是一个长期使人困惑的问题,在学术界引发过激烈的争论。宗教界人士甚至据以“证明”上帝这一角色的必要性。20世纪最后30年对关于自组织机制的研究从不同的角度对于这一使人困惑的问题给出了理论上的解释:
(1)耗散结构理论认为一个远离平衡态的非线性、开放系统通过与外界交换物质和能量,可以提高自身的有序度,降低熵含量。这一理论认为“非平衡”是有序之源。
(2)协同学认为由大量微小单元组成的系统,在一定的外部条件下,通过各单元的相互作用,可以自发地协调各个单元的行为,从而产生宏观的空间结构、时间结构与功能结构。这一理论认为在临界状态(分叉点)上,偶然的涨落经过放大,将起到推进有序化的作用。
(3)元胞自动机以计算机建模和仿真的方法,研究由类似于生物细胞的大量并行个体所组成的系统的宏观行为与规律。在研究方法上多采用离散的空间布局和时间间隔。一个典型的元胞自动机是所谓“生命游戏”,它形象地表明,随机的初始布局是如何经过单元之间的短程通信、微观决策、并行协调和反复迭代,最后演化成为稳定、有序的空间结构。
(4)人工生命以计算机建模和仿真的方法研究生命或生态系统的组织结构、功能及其主要的行为特征,包括遗传、个体复制、发育和自组织等。人工生命的研究认为生命的真谛在于其组织结构和行为特征,而不必拘泥于这些结构与特征所依托的物质材料。人工生命的研究表明,在秩序与混沌的边沿存在一片孕育生命的神奇的绿洲,自组织现象就在此发生。
4)自组织过程
自组织现象是一种降低系统的熵含量、提高其有序度的过程,是系统的状态由高几率向低几率迁移的过程。众所周知,热力学第二定律和统计力学认为这样的变化是不会自发地产生的。可是,它确实是发生了,其中的奥妙在于系统的开放性———一个开放系统的熵变化由两项组成:DS=DSi+DSe,其中DS是过程总的熵变化。对于自组织过程来说,有DS<0;DSi表示自组织系统内部的熵
14复杂系统的分析与建模
产生,按照热力学第二定律,必有DSi>0;因此,反映系统与外部熵交换的那一项DSe必然为负,即DSe<0。这就是说,自组织系统有赖于外界给它输送负熵,以提高其有序度。因此,与自组织过程相伴的必然有另一个“伴随过程”,后者向前者输送负熵,也就是输送有序度或信息。
人类的制造过程虽然是“他组织”的,但也是一个提高产品有序度、降低其熵含量的过程,因此,自组织过程对于工业管理过程也同样适合。
1.3 复杂系统的控制与决策
1.3.1 复杂系统管理方法
国外在复杂系统应用方面已做了一些尝试。总的来说,在复杂系统的干预或管理方面,可以利用系统复杂性方面的研究成果,研究具体干预和管理的手段、方式、时机和可能产生的影响。下面主要从管理的角度对复杂系统的管理、控制、决策及相关的问题进行探讨。
1.一般系统与复杂系统:复杂系统管理的特殊性
总的来讲管理是对管理对象施加一种影响,使之达到希望出现的效果。一般系统所包含的子系统通常数量少,相互关系简单,运动规律相对清楚,可以使用比较精确的手段予以控制:受一般系统管理思想的影响,传统的管理往往把人和组织视为完全可控的对象,把事件之间的关系割裂开来,强调对症下药却忽视了药方对系统整体的长期影响。然而对复杂系统管理而言,却出现了以下三个方面的困难:
(1)随着经济和信息等技术的发展,人们的生活水平不断提高,视野日益开阔,倾向于思考、自主选择和追求个人成功。由谋生转为谋事的个人活跃在组织内部,其掌握着知识和技能,追求成功,使组织变得不稳固和难以控制。
(2)全球信息化、经济一体化和文化的碰撞、融合,使管理的环境变得异常复杂多变,系统的边界变得模糊。
(3)达成目标的路径不再惟一,过程管理难以奏效,而目标管理又难以兼顾多目标的任务。管理者施加干预的后果和影响往往难以度量,对局部施加的干预可能会对系统整体产生长远的影响。
面对这些困难,在实践中如何既保持组织各部分的活力和创造力,使组织对快速多变的外部环境及时合理地做出反应,又能够发挥1+1>2的聚集效应,保证组织整体的稳定与优化?在吸收、融合了西方的“竞争”思想和东方文化传统中“和”“、谐”的内涵之后,我们构造和发展了用于复杂系统管理的和谐理论。
第1章 复杂系统的基本分析15
2.复杂系统的管理:和谐管理理论(磁化与环境控制)
复杂系统是比较简单的系统经过长期适应和反作用于环境而逐步发展形成的。企业形态的演变就是很好的例证。从最初的手工场、家庭作坊到组织严密的工厂,再到股份制公司以至正在涌现的虚拟公司,企业系统进化得愈来愈精巧和完善,对环境变化的反应愈灵敏。具有良好机制的复杂系统在适应环境的过程中不断调整自身的结构,因此它不但与环境和谐相处而且系统内部也更加和谐。和谐管理理论就是基于对这种现象的认识而提出的,其核心是充分调动和利用各子系统成员的积极性和能动性,系统整体重在提供机会、条件和创造一个促进各子系统能量释放和协同发展的环境,通过子系统的发展和协同作用来实现系统整体目标。这类似于一根铁棒的磁化过程,铁棒开始没有磁性,原因是铁棒中每个分子都在按自身的目标旋转,各自的磁性相互抵消,铁棒整体不显磁性,如同一群乌合之众没有组织力量一样。如果将铁棒置入一个磁场中,每个分子在磁场的作用下向同一方向旋转,铁棒整体显示出很强的磁性。虽然人不会像分子那样总以一种简单的方式对周围环境做出反应,但也是根据其对环境的观察和预期来调整自身的行为。复杂系统的复杂性来源之一就是个体的非线性聚集,使得对单个个体的线性控制变得十分困难。因此,对于系统整体来说管理目标不再是控制每个子系统的行为,而是在明确整体目标的基础上创造一种类似于磁场的环境,使处于这种环境中的各子系统能够根据环境的要求改善自己的结构和行为,充分发展自己,并通过相互协同实现系统整体目标。只有各子系统充满活力和能动性,系统整体才有活力和竞争力,才能实现整体的目标。这其中在管理思想上有三个非常重要的变化:从复杂的个体控制转向环境引导和协同;使组织成为个人在整体环境协调下实现自身发展的工具;从只关注组织整体发展目标到同时关注组织和个人的发展目标。
3.复杂系统的控制:一种新的控制思路
复杂系统具有自适应、自学习的特点,要将一个控制的框架强加于它并赋予一组输入,从而得到理想的输出往往是很困难的,针对复杂系统的特点,可以借鉴类似于上述的磁化思路,采用一种引导与驾驭相结合的控制方法。在对系统目标和各子系统动力机制了解的基础上,针对各子系统成员行为特点和系统目标设立引导机制,根据系统目标和整体行为需要设立惩罚机制进行驾驭;引导是通过创造有吸引力的内部环境来影响系统的运转,从而达到控制系统的目的。驾驭是一种短期手段,用来对一些可能会引起系统向不良方向发展的坏变量采取果断措施予以纠正。当然,这种控制方法是建立在对系统的认识、预测、优化和决策基础之上的。组织管理中使用的“胡萝卜加大棒”、社会系统运转中采用的“宣传引导加法制”等做法有类似的道理。
16复杂系统的分析与建模
4.复杂系统的决策:分散决策与决策组合
复杂系统是由许多平行发生作用的子系统组成的网络,其内部控制力是相当分散的。网络社会便是如此,每个成员作为系统网络中的一个主体,各司其职,通过网络(IT技术)进行协调。许多企业决策权正在分散、组织结构趋于扁平化就是一个很好的例证。尽管复杂系统内决策的分散化是不可阻挡的趋势,但整体决策的集成效果也是必须考虑的。在决策机制的设计过程中既要体现系统中决策的分散性,调动各子系统的积极性和主动性,对快速多变的外部变化及时做出反应;又要利用现有的系统决策和集成技术,如不确定条件下的决策技术、综合集成技术、整体优化技术和仿真技术等,达到分散决策的总体效果最优。
5.组织的新形态:各种手段的对立统一体(和谐体)
光的波粒二象性使人们开始放弃“非黑即白”的观念,接受两个相互矛盾的现象可以同时并存的观点。当人们用这种态度审视人类社会无处不在的组织时,也会发现组织,特别是网络型组织将是一个多种矛盾现象的对立统一体。矩阵型组织就是设想实现作业系统的分权化,决策与财务控制的集权化,以权力平衡取代层级组织的序列化指挥系统。日益盛行的计算机风格则不仅打破了层级组织的序列,而且克服了空间约束。现代技术的发展拓宽了人们传统的时间观念和空间观念,人类甚至有必要重新定义时间和空间,并在新的时空观下审视组织。时间和空间将可能从过去的约束变成资源,新的组织形态不再是网络组织和层级组织简单的相互替代或互补,而是多种相互矛盾,甚至相互对立的组织形式共生于同一和谐体中。
1.3.2 复杂管理信息的集成化和智能化
目前,管理信息系统的发展趋势,正在朝着两大方向迈进:集成方向和智能方向。集成方向的一个突出代表就是计算机集成制造系统(CIMS)。智能方向的一个突出代表就是决策支持系统与专家系统的结合———IDSS。下面分别说明这两大趋势
[4]
。
1.3.2.1 管理信息系统的发展趋势1.计算机集成制造系统(CIMS)
目前,企业的管理信息系统(MIS)正在向集成方向发展,其中一个最突出的代表就是CIMS(ComputerIntegratedManufactureSystem),它是一种在某种环境下为提高企业总体效益的全局性的观念和方法,包括设计、制造到销售和售后服务,要利用各种方法和技术工具(计算机和自动化技术),目的在于提高生产率、降低成本、提高质量、确保生产的全局和局部的柔性等,以提高企业竞争能力。CIMS主要包括计算机辅助设计(CAD)、计算机辅助制造(CAM)、柔性制
第1章 复杂系统的基本分析17
造系统(FMS)、数控机(NC)、管理信息系统(MIS)、办公自动化(OA)和机器人等。其中的核心是MIS,主要包括MRPⅡ。MRPⅡ是从MRP的基础上发展起来的,它将CIMS的各个系统有机地结合起来,达到互通信息、共享数据资源的目的。其支撑技术是数据库和计算机网络。
(1)MRP(MaterialRequirePlanning:材料需求计划)。其基本观点是:由产品来决定零部件,即成本的需求;最终成品的需求确定了主生产计划,通过计算机可迅速完成对零部件需求的计算。
(2)MRPⅡ(ManufacturingResourcePlanning:制造资源计划)。主要由主生产计划、材料需求计划、能力需求计划、财务及成本管理子系统等组成,它是在闭环MRP完成对生产的计划与控制基础上,进一步将经营、生产、财务和人力资源等系统相结合,形成制造资源计划。它是一种推动式的生产管理方式。其发展方向是ERP。
(3)JIT(Just-In-Time:准时生产)。它源于日本,其含义是:在需要的时间和地点,生产必要的数量和完美质量的产品和零部件,以杜绝超量生产,消除无效劳动和浪费,实现零库存,达到用最少的投入实现最大的产出的目的。它是一种拉动式的生产管理方式,其发展方向是LP。
2.CIMS的其他发展
(1)LP(LeanProduction:精益生产)。其基本思想是:减少一切不必要的活动,杜绝浪费,力求精益求精,不断降低成本,做到无废品、零库存、无设备故障等。它应用JIT、并行工程、全面质量控制和订单装配技术,最大限度地提高产品质量,缩短产品开发和生产周期,满足用户迅速变化的需求,降低在制品库存,实现精良生产。
(2)AM(AgileManufacturing:敏捷制造)。敏捷即聪敏、快捷的意思,也就是说不仅要响应快,还要灵活善变,以便快速地适应市场的需求。敏捷制造将组织、人和技术三者有机地集成在一起,以达到合作和创新来回答用户的需求。其基本特征是:实施并行工程,对员工继续教育,迅速响应用户需求,进行制造商的动态组合,灵活的组织机构,灵活的信息储存和利用,实现产品设计生产周期短、质量高、技术领先、技术敏感等。
(3)VM(VirtualManufacturing:虚拟制造)。即提供一种在计算机上进行,而不是直接消耗物质资源的能力。其实质是以计算机支持的仿真技术为前提,对设计、制造等生产过程进行统一建模,在产品设计阶段实时地、并行地模拟出产品未来制造全过程及其对产品设计的影响,预测产品性能、技术等,从而更有效、更经济、柔性灵活地组织生产,使工厂和车间的设计与布局更合理有效,以达到产品开发周期和成本最小、质量最优、效率最高的目的。
(4)ERP(EnterpriseResourcePlanning:企业资源计划)。它是企业全方位
18复杂系统的分析与建模
的管理解决方案,支持企业混合制造环境,可移植到各种硬件平台,采用DBMS、CASE、4GL等,具有C/S结构、GUI、开放式系统结构特征。
3.决策支持系统(DSS)1)决策支持系统概念
广义地说,DSS是以管理科学、计算机科学、行为科学和控制论为基础,以计算机技术、人工智能技术、经济数学方法和信息技术为手段,主要面对半结构化的决策问题,支持中高级决策者的决策活动的一种人机交互系统。它能为决策者迅速而准确地提供决策需要的数据、信息和背景材料,帮助决策者明确目标,建立和修改模型,提供备选方案,评价和优选各种方案,通过人机对话进行分析、比较和判断,为正确决策提供有力支持。狭义地说,是帮助决策者利用数据、模型、方法、知识推理等去解决非结构化决策问题的人机交互系统。它主要由会话系统(即人机接口)、数据库、模型库、方法库、知识库及其管理系统组成。这里的支持是指:这个系统意在辅助决策者进行决策,而不是代替他的工作。处理半结构化决策问题,就意味着决策过程不能完全用一种算法、程序、模型概括说明,不能完全依靠计算机系统,而是需要人机的相互作用。
2)决策支持系统的发展
DSS现正向智能化、群体和行为导向等方面发展。
(1)IDSS。20世纪80年代知识工程(KE)、人工智能(AI)和专家系统(ES)兴起,为处理不确定性领域的问题提供了技术保证,使DSS朝着智能化方向前进了一步。
(2)GDSS(GroupDSS)。群体决策比个体决策更合理、更科学。但是由于群体成员之间存在价值观念等方面的差异,也带来了一些新的问题。从技术上讲,个体DSS是GDSS的基础,但要增加一个接口操作环境,支持群体成员更好地相互作用。
(3)BDSS。所谓行为导向(BehaviorOriented)的DSS是从一个全新角度即行为科学角度来研究对决策过程的支持,其主要研究对象是人,而不是以计算机为基础的信息处理系统;主要是利用对决策行为的引导来支持决策,而不仅仅用信息支持决策。这将为最终解决决策问题开辟一条道路,但其研究范围和技术手段已超出今天的信息系统范围。
4.专家系统(ExpertSystems)
专家系统是利用知识和推理过程来解决那些需要特殊的、重要的人类专家才能解决的复杂问题的计算机智能程序,专家系统的知识由事实和启发性知识组成。
专家系统一般由以下部件组成:知识获取设备,知识库(规则库和数据库),知识库管理系统(KBMS),推理机构,用户接口。近年来,人们开始将DSS与
第1章 复杂系统的基本分析19
ES结合起来,形成IDSS,但IDSS绝不是ES和DSS的简单结合,而是在综合基础上的进一步提高。
1.3.2.2 管理信息系统的新动态管理信息系统新动态有如下几个方面。1.神经网络
专家系统一个最大的缺点是要求专家而非普通人来建立知识,因此了专家系统的使用。但神经网络就能克服这个弱点,它具有自组织、自学习等特点,可以被大众所接受和使用。
1)神经网络方法的基本原理
神经网络是一种按照人脑的组织和活动原理而构造的一种数据驱动型非线性模型。它由神经元结构模型、网络连接模型、网络学习算法等几个要素组成。一个典型的神经元网络连接模型由输入层、中间层(称为隐含层)和输出层三层神经元组成。每相邻两层的神经元之间都有一条带权值的线连接。要使神经网络产生所希望的行为,必须对其进行训练,即通常所说的网络学习。学习时,每一条连接线都不断地调整自己的权值,以使神经网络的实际输出和期望输出之间的方差达到最小,学习的效果直接影响网络的预测精度。
2)神经元结构模型
神经元是神经网络的基本计算单元,一般是多个输入和一个输出的非线性单元。一个完整的神经元结构中包括Si(反馈信息),ti(阀值),F(特性函数),ωi(权值)。这样,神经元的输出Yi与各个输入之间的关系可以用公式表示为:Xi=WjXi+Si;Yi=F(Xi)。根据输入输出的特性不同,可选择不同的特性函数,常用的特性函数有线性函数、Sigmoid函数、双曲正切函数等。
3)神经网络的连接模型
神经网络是以将许多神经元连成一个网络而得名的。网络的连接有单层连接、多层连接、循环连接等几种模式。单层连接只有一个输入层和一个输出层,多层连接则包含了一个或者多个隐含层,而循环连接是指包含反馈的连接方式。
4)学习算法
神经网络学习的目的是用一组输入向量产生一组希望的输出向量,学习的过程是通过按预先确定的算法(称为学习规则)慢慢调整网络的权值来实现的。由于神经网络是一种非线性映射关系,各变量之间的相互关系隐含于网络之中,因而当训练中涉及一对无关数据时,网络不会收敛,所以我们可以通过网络学习来剔除非相关变量。
5)神经网络反向传播算法(B-P算法)
(1)对全部连接线的数据进行初始化,一般设置成较小的随机数,以保证网
20复杂系统的分析与建模
络饱和或反常的情况。
(2)取一组训练数据输入网络,并计算出网络的输出值。
(3)计算该输出值与期望值之间的偏差,然后从输出层反向计算到第一隐含层,向着减少该偏差的方向调整各条线的权值。
(4)对训练集中的每一组训练数据都重复上面的两个步骤,直到整个训练的偏差达到能被接受的程度为止。
2.遗传算法
神经网络方法存在着局部极小的问题,为了解决神经网络算法经常陷入局部极小的问题,通常使用全局最优化算法如遗传算法来解决这个问题。
遗传算法(GeneticAlgorithm,GA)是一类借鉴生物界自然选择和自然遗传机制的随机化搜索算法,由美国J.Holland教授提出,其主要特点是群体搜索策略和群体中个体之间的信息交换,搜索不依赖于梯度信息。它尤其适用于处理传统搜索方法难以解决的复杂和非线性问题,可广泛用于组合优化、自适应控制、规划设计和人工生命领域,是21世纪智能计算的关键技术之一,遗传算法作为一种新的全局优化搜索方法,具有简单通用、鲁棒性强、适应于处理和应用范围广泛等优点。
在执行遗传算法时,必须包含两个数据转换操作,一个是表现型到基因型的转换,另一个是基因型到表现型的转换。前者是把搜索空间中的参数或解转换成遗传空间的染色体或个体,此过程叫做编码操作;后者是前者的一个相反操作,叫做译码操作。遗传算法是具有“生成加检测”(generate-and-test)的迭代过程的搜索算法。它的基本流程:编码和初始群体生成→群体中个体适应度的检测评估→选择→交叉→变异。由此可见,遗传算法是一种群体型操作,该操作以群体中的所有个体为对象。选择(selection)、交叉(crossover)、变异(mutation)是遗传算法的三个主要操作算子,它们构成了所谓的遗传操作(geneticopera-tions),使遗传算法具有了其他传统方法所没有的特性。遗传算法中包含了如下五个基本要素:参数编码,初始群体的设定,适应度函数的设计,遗传操作设计,控制参数设计(主要指群体大小和使用遗传操作的概率等)。这五个要素构成了遗传算法的核心内容。
3.数据仓库
数据仓库是20世纪90年代以来决策支持系统的一个重要发展。近年来得到了理论界和信息产业界的高度重视。
1)数据仓库的定义和特征
数据仓库(Datawarehouse)是指一个对历史数据进行处理的集成化的数据收集和信息处理机构,在一般情况下,数据仓库的数据输入部分来自一个操作性的环境,该部分的作用是将这个环境中的数据送到另一个在物理上相分离的数
第1章 复杂系统的基本分析21
据存储机构中去。而数据仓库则不断地对信息系统中的数据进行整理,从而辅助决策者有效地发现问题。数据仓库具有四个主要特征:面向主题,集成化,时变性和非活性。
操作性的数据是灵活的,它们可以被插入、更新、修改、删除等,但在通常情况下,数据仓库中没有更新修改等操作。对数据仓库中的数据操作比较简单,只有两种操作对它们有效:一是数据的初始输入,二是数据的存取。
2)数据仓库的结构
数据仓库将其中的数据分为以下五个层次:当前详细数据,历史详细数据,轻度概略数据,高度概略数据和超数据。
3)数据的流程
数据仓库中数据的流程一般是可以预计的。数据是从操作性环境进入到数据仓库中的。当数据进入数据仓库中时,必然经由一个预定的转换过程。数据首先进入到当前详细层,然后,数据将暂时保留在该层,直到该数据被删除,或被概略化,或被取走。
数据仓库中的时变过程(Agingprocess)是指它有一个机制,根据数据的时间性质(Age),逐渐将当前详细数据层中的过时数据移到历史详细数据层保存。而数据仓库的概略化过程(Summarizationsprocess)则使用当前详细数据来计算轻度概略数据和高度概略数据。
4)数据仓库的使用
根据数据在数据仓库中的层次,它们被使用的情况是不同的。一般地讲,越是在概略化的高层,其数据被使用的频率越高,而历史性的数据详细数据却很少被使用。通过数据仓库中的数据挖掘工具,我们能够发现有用的知识。
4.企业流程改造(BPR)
信息技术的高速发展,对传统企业职能组织结构提出了新的挑战。因此,企业改造(BusinessProcessReengineering,BPR)是近年来管理信息系统研究界非常热门的一个课题。
最早提出BPR的是美国的两位企业管理专家MichaelHammer和JamesChampy。他们在合作的名著《改造企业———商业再生的蓝图》一书中提出了企业流程改造的一些基本观点。首先他们认为传统的企业生产方式已经不适应现在的社会和企业。分工工作方式、金字塔型的职能组织结构、以提高企业的产品生产量为中心等传统的方法曾经是使美国经济迅速发展的法宝,但是随着信息产业的发展和技术手段的引进,这些传统的法宝却变成了阻碍经济发展的绊脚石。他们认为:在今天的市场中,不容忽视的三种力量是3C:顾客(Customer)、竞争(Completion)、变化(Change)。为了适应这三种力量,企业要想发展,最重要的就是以工作流程为中心重新组织工作。所谓“改造企业”,就是“彻底地抛弃
22复杂系统的分析与建模
原有的作业流程,针对顾客的需要,重新规划工作,提供最好的产品和一流的服务”。
在一个改造企业的过程中,信息技术所起到的作用是十分重要的,它甚至会“重写游戏规则”。例如,在人们的传统意识中,信息一次只出现在企业中的一个地方,但引进信息系统后,信息可以不受,同时出现在所有必要的地方。再如,按传统观念,详细的数据和信息一定是放在办公室中的,销售人员外出时,不带着一大包资料就无法给客户以详细的说明。但现在他们可以带着手提电话和便携式计算机,通过传输得到任意详细的信息。这样,信息技术就迫使企业不得不重新考虑他们已经习惯的工作方式是否合理。
Hammer和Champy用了许多例子来证明他们的这样一个观点:进行企业改造不是修修补补,而是一项彻底的工程,需要建立一支有力的改造队伍,抓住企业中的某些通病开刀,重新设计企业的工作流程,进行新的工作集成化。这样,才有可能使企业适应时代的潮流健康地成长。Hammer和Champy的这本著作引起了管理界强烈的共鸣,使得BPR成为当今管理信息系统一个新的研究方向。
5.电子商务(ElectronicCommerce)
近年来,Internet已经广泛应用在商业界和企业界,使得信息技术越来越紧密地与经济和社会发展结合在一起。目前,在此潮流中的一个重要趋势是在发达国家迅速普及的电子商务(ElectronicCommerce,EC),这已经引起了管理和经济学者的高度重视。
Internet技术不但广泛应用于教育科研领域,也开始被应用到企业管理。用这种技术构筑起来的企业内部互联网(Intranet)的最大特点是具有多媒体和丰富交互功能、界面统一、简单易学,从而使许多害怕信息系统的人转变了观念。而当Internet技术应用于企业之间的业务活动上时,将对企业管理和经营运作等会产生什么样的影响?这个问题已经引起管理信息研究人员和学者们的重视。
近年来,管理信息系统界所注目的一个重点是外部联网(Extranet)的概念。Internet技术在企业管理上的应用已经不仅仅局限于企业内部的信息系统建设,它更广泛地应用在企业与企业的联系、企业与顾客的联系以及企业和其他有关部门、单位的联系方面。在此方面,近年来最具代表性的技术就是电子商务,美国、日本等发达国家的许多研究机构投入了大量的财力物力和人力从事有关电子商务的研究,并取得了实质性的成果。电子商务的交易额正在以惊人的速度扩大。
电子商务可以定义为“在开放的网络环境中进行的整个商务过程中发生的电子数字化信息交换”。例如,现在已经实用化的Internet家庭银行,使用电子现金(E-Cash)的电子结算,店铺储值卡(零钱卡)等面向家庭、个人消费的应用,
第1章 复杂系统的基本分析23
都可以划归到电子商务的范围。随着计算机在家庭的普及,这一类电子商务市场正在迅速扩大。
但随着电子商务应用范围的不断扩大,现在新的商业交易方式不单单为个人用户使用,而且可以被企业的流通系统所应用。例如在Internet上进行的市场调查、广告,以及对交易对象或者商品的寻找和选择、签订契约,甚至包括在契约基础上的订货、发货、交货、支付、费用计算等,都属于这类活动。这些活动不是个人之间的交易活动,也不仅仅是两个节点之间的信息交换,而是牵涉到订货者、发货者、金融机构、中间商、物流管理者等多主体的信息交换。将这种信息交换用计算机网络连接起来,整个交易过程都用电子方式来提高运作效率,就是电子商务的核心。
可以将电子商务流通系统分为两大类,即商对商系统或B-B系统(BusinesstoBusiness)和商对客系统或B-C系统(BusinesstoCustomer)。现在大多数电子商务都是面向B-C的系统,而将来可能引起流通系统产生变化的主要是B-B系统。
目前,B-B系统的代表方式是使用电子数据交换(ElectronicDataEx-change,EDI)来进行贸易单位之间的数据转换。将来则会向打破目前行业的界限和业务的界限,用通信网络将这些商业机构和企业连接成更为通用的网络系统。B-B系统的成熟和发展一般会经历三个阶段。在初始阶段,主要是在某些特定的企业或者部门之间进行交易,这时企业的网络一般是封闭的或者私有的。在发展阶段,通过使用EDI和数据库,可以在超过本行业的范围中进行企业间数据共享,如在Internet上提供广告、宣传企业形象、进行电子出版等。在高度发展阶段,在Internet上进行决算的安全问题基本得到解决,EC将成为产业的基础信息化设施。
电子商务技术给企业所带来的最大利益是使得企业可能从传统的时间和空间的制约条件中解脱出来,进行更有效、更迅速的商业活动。现在,EDI技术已经应用在企业间恒定的合作过程中。从EDI的实践中我们已经看出:通过新的信息技术的应用,企业间的关系可能发生变化。电子商务使用之后也是如此,例如,在资产上有关的企业或者一个产业集团的各个企业,可以通过使用电子商务使得彼此之间的关联更为紧密,从而使得运作的效率得以提高。对一些以往没有关系或者在资产上没有关系但在业务活动中有关的企业来说,采用电子商务可以实现紧密的合作,如同一个企业一样,在这一点上可以被看作是虚拟公司。
1.3.2.3 复杂系统管理方法在企业中的应用
随着社会经济的发展和技术进步,系统信息反馈加快,过分的正反馈会使系统崩溃,过分负反馈则使系统摇摆不定。很多在传统管理理念看来非常简单的
24复杂系统的分析与建模
系统也会被环境推到混沌的边缘而呈现出不确定性等复杂特性。以下从五个方面阐述未来企业可能面临的复杂系统现象和相应的解决思路
1.消防队的启示:实力与应变机制
面对产能扩大和消费个性化、竞争激烈化之间的矛盾,企业要想生存和发展,不仅要采用更为灵捷的生产方式,还要建立新的应变机制,这种机制与消防队的运作方式比较类似。
未来的企业发展会像消防队一样,没法知道将会发生什么,但又要能够在突发事件出现时应付自如。要做到这一点,一方面可以依赖自身的强壮,即拥有应付各种各样情况的能力,无论何种情况出现,均可应付自如,当然这并非易事;另一方面是自身并不十分强壮,但却拥有十分敏锐的适应和应变机制。复杂系统的管理理论指出,通过运用新的管理与控制思想,企业可以同时做到实力雄厚和灵活应变,关键在于如何处理集权与分权以及分权后不同子系统之间的关系。处于第一线的经营子系统掌握着环境的最新动态和随时更新的经营知识,传统的企业决策层应当充分授权给它们并鼓励这些子系统之间进行横向沟通和知识共享。这样一线的经营子系统就有可能通过相互作用达成对形势的判断,在市场产生新的需求或竞争对手突然出现时能够迅速决策,快速集中系统资源,完成共同面对的任务。而传统的企业中心在放弃了集中决策与直接控制之后,仍然可以起到企业文化中心、知识与信息中心、协调中心的作用,间接地增进系统整体的经营绩效和实力。
2.重新审视价值链:事业定位
一般来说,从要素资源到最终产品和服务,有一条很长的价值链,其中每一环节的附加价值是不同的。从创意的出现,到策划、准备资源、生产、销售,直到最终消费,每个环节上,都需要相应的服务或生产经营活动。因经营性质、特点不同,这个链上的不同环节不仅随形势而变化的速度是不同的(有的会快速多变,有的则相对稳定),而且附加价值也不同。一般来说,附加价值大的环节风险也大,所以对于企业发展来讲,就有一个重要的事业定位问题,即在哪个环节上发展自己的事业。这也是一个根据自身实力、应变机制、环境状况进行优化匹配和决策的难题。企业要提高自身的动态核心竞争力,就要根据自身情况决定哪些环节由自己来控制,哪些环节“外包”出去。不同的企业在规划事业发展时到底选择哪个环节很有讲究。能力强、有实力者可在多变的地方出击,这些地方尽管风险大,但往往回报也高。而能力差、实力弱者可在变化较小的地方选择,这些地方虽然回报低,但风险也相对小。
3.资源的配置:管理资源观念的转换
传统管理注重物质资源,而在现代时空观念下,时间和空间将从过去的约束转为资源,管理资源将扩展为时间、空间和物质、精神资源。要充分利用这些资
[6]
。
第1章 复杂系统的基本分析25
源进行现代管理,从内部看组织必须在观念上有一系列的变革。由于技术的进步,任何时间、任何地点的合作和交易都成为可能,消费者的即时需求决定厂商如何即时供给。这就要求将实时响应纳入组织设计之中,使组织工作在并行、分布式、实时状态下。从外部看,组织资源配置的难度随着环境多变和社会进步而越来越大,复杂性与日俱增。传统组织在内外部因素的推动下越来越表现出复杂系统的诸多特性。将管理资源配置与组织设计结合起来,探讨组织可持续性发展、动态结构和动态竞争力,将是复杂系统管理的重要应用领域。
4.生产方式面临的挑战:大量定做
如上所述,未来社会发展的一个明显趋势是需求的个性化和即时化,市场的这种特点要求企业要生存和有竞争力,就必须设法满足消费者的需求并能保证即时供给。这自然对企业生产和发展带来了很大的难题。企业能否做到通过大规模、小批量生产,满足客户多样化的、随时产生的需求?如果能,怎样做到?这也是一个值得认真研究的话题。实际上,全息摄影、并行处理、芯片定做、生物科技与基因工程、定做触媒剂等技术的发展已为大量定做提供了可能,只是要将管理和技术更加紧密地融为一体。探讨计算机集成智能化管理CIMS已成为现代管理另一亟待研究的复杂系统问题。
5.人力资本管理:时代的挑战
通观以上四点,未来企业竞争将是智力和知识的竞争,谁拥有人才,谁就拥有未来已成为一个不争的事实。要将个体的智力和知识有效转化为组织的智力和知识,就不能再使用传统的管理方法,而必须运用复杂系统观管理思想。在网络组织里,每一个成员将成为发展的主体,组织网络(包括信息技术网络)将发挥重要的协调作用,管理将从传统的偏重于“控制”转向偏重于“协调”。于是,在网络中如何充分调动每个成员的积极性和能动性,就成为重要的问题。社会发展到一定程度后,人们已不需要过多关注温饱问题,而将广泛地关注自己的事业发展和人生成功。当绝大多数人将人生成功作为自己的目标,也就是说人生观从谋生转向谋事时,就要求管理观念有一个质的转变。从过去的将员工作为组织或老板事业成功的工具,变为老板或组织成为帮助员工发展自己事业的工具。可以想象,如果每一个员工都在组织的大环境下,在组织目标的引导下,积极主动争取自己事业的成功,自然会有很强的动力和很大的主动性,这必然会给组织带来活力和动力。大部分员工事业的成功必然会带来组织的更大成功,如果组织能处在这样一种和谐发展的状态下,它将具有长期的发展潜力。
复杂系统思想以其深邃的哲学内涵和贴近现实的研究视角正在吸引越来越多的人的关注。随着企业经营环境和经营任务的日益复杂化,在管理中借鉴复杂系统思想乃至参照复杂系统的运行特点设计企业经营系统,将会成为提高管理效能、改进经营绩效的一个热点。
26复杂系统的分析与建模
参考文献
[1] 克劳斯・迈因策尔.复杂性中的思维.曾国屏译.编译出版社和施普林格出版
社,1996
[2] 吴彤“复杂性”.研究的若干哲学问题.自然辩证法研究,2000,(1):6~10
[3] 张学文.我对复杂性的认识———改造后的熵.http://kahn.xj.cninfo.net/zhan-gxw/index.htm
[4] 朱顺泉.管理信息系统的发展趋势与新动态.科技导报,2000.59~62[5] 张本祥,孙博文著.社会科学非线性方.哈尔滨:哈尔滨出版社,1997[6] 王洪涛.复杂系统管理方法初探.华东经济管理,2001,15(6):31~33[7] 师汉民.从他组织走向自组织———关于制造哲理的沉思.2001
[8] 师汉民.知识经济条件下的制造产业———兼论我国制造企业的改革之路.我国先
进制造技术发展战略学术研讨会论文集,1998.86~96,上海,转载:模具技术,No.2(98),1999.90~95
[9] PrigogineI,StengersI.Orderoutofchaos,BantamBooks,Inc.1984.中译本:
从混沌到有序.曾庆宏,沈小峰译.上海:上海译文出版社,1987.174~258
[10] HakenH.Informationandself-organization,Spriger,1987.中译本:信息与自组
织,宁存政等译.成都:四川教育出版社,1988.1~70
[11] 魏一鸣.复杂性科学.http://www.kepu.gov.cn/kjqy/file/
第2章 复杂系统的分形自相似
分析与建模
分形方法自1967年问世以来,虽然只有短短几十年的历史,然而已在一些领域获得成功应用,它被用来揭示复杂现象中深藏的有组织结构。许多科学家预言,在21世纪之中,无论是自然科学领域还是社会科学领域,应用分形方法都将取得重大成果。复杂性的根源是非线性,存在于工程、管理、经济领域的复杂的难解问题大多数属于非线性问题。研究复杂性的问题离不开非线性科学。多数非线性问题有其外在的几何表现或内在的几何表示:这里的几何学在理想情况下是具有非整数维数的分形几何学。因此,本章以分形理论为主要方法,介绍复杂系统的自相似过程,复杂系统的分形建模技术,分形在工程系统中的自相似分析与建模。
2.1 复杂系统的自相似过程
2.1.1 什么是自相似
当一个物体的一部分放大后看起来仍与整个物体一样,那这个物体就是自相似。某一图形的每个特征都按同一比例缩小或放大,任何一个到相片洗印店放大过相片的人都很熟悉。描述部分和整体之间这种相似性的一个更具体的专门术语是“自类同”(self-affinity)。自然界中存在着许多具有自相似特征的现象。
自然界中许多植物具有自相似特性。例如,图2-1-1是一枝厥类植物,仔细观察,你会发现,它的每个枝杈都在外形上和整体相同,仅仅在尺寸上小了一些。而枝杈的枝杈也和整体相同,只是变得更加小了。用分形理论得到的图2-1-2所示的分形植物,其枝杈是整个植物的小版本,而枝杈的枝杈则是更小的版本。许多著名的分形图形都能展现这种自相似性。又如图2-1-3所示的Sierpinski三角形。在Sierpinski三角形中每个小三角形都是大三角形的更小版本。这种特性可以无限地持续下去。另一个著名的分形图形是图2-1-4所示的Kohn雪花,它像Sierpinski一样,表现出完全的自相似的特性。但是,这里的自相似体现在每一个边都是由它的更小版本组成,而整个图形并没有重复。也就是说,这时的自相似的实质应该是某一个部分在其他地方的重复出现。
28复杂系统的分析与建模
图2-1-1 真实的植物图2-1-2 分形植物
图2-1-3 Sierpinski三角形图2-1-4 Kohn雪花
人体的循环系统,也是自然界中自相似的好例子。从最大的动脉和静脉分支直到最小的微血管,整个过程都显现相同的分支模式。如果你不知道正确使用显微镜,将无法分辨微血管和大动脉。
自然界中,有许多景物都在某种程度上存在这种自相似特性,即它们中的一个部分和它的整体或者其他部分都十分形似。例如,地形属于自相似范畴。手掌上的碎岩锯齿状边缘与远处地平线边的山脊有相同的不规则形状。这使我们可以用分形来生成地形,不管显示时怎么放大,它看起来仍然像地面。其实,远远不止这些。从心脏的跳动、变幻莫测的天气到股票的起落等许多现象都具有自相似特征。例如,在道・琼斯指数中,某一个阶段的曲线图总和另外一个更长的阶段的曲线图极为相似。客观事物有它自己的特征长度,要用恰当的尺度去测量。用尺来测量万里长城,嫌太短;用尺来测量大肠杆菌,又嫌太长,从而产生
第2章 复杂系统的分形自相似分析与建模29
了特征长度。还有的事物没有特征尺度,就必须同时考虑从小到大的许许多多尺度(或者叫标度),这叫做“无标度性”的问题。
为此,1967年法国数学家B.B.Mandelbrot提出了“英国的海岸线有多长?”的问题。利用自相似原理解决复杂形态海岸线的测量问题。因为,海岸线的测量问题,其长度依赖于测量单位。若以1km为单位测量海岸线,得到的近似长度将短于1km的迂回曲折都忽略掉了;若以1m为单位测量,则能测出被忽略掉的迂回曲折,长度将变大,测量单位进一步变小,测得的长度将愈来愈大,这些愈来愈大的长度将趋近于一个确定值,这个极限值就是海岸线的长度。但曼德勃罗(B.B.Mandelbrot)发现:由于海岸线的极不规则和极不光滑,当测量单位变小时,所得的长度是无限增大的。因此,海岸线的长度是不确定的。
我们知道,经典几何研究规则图形,平面解析几何研究一次和二次曲线,微分几何研究光滑的曲线和曲面,传统上将自然界大量存在的不规则形体规则化再进行处理,我们将海岸线折线化,得出一个有意义的长度。曼德勃罗(B.B.Mandelbrot)突破了这一点,长度也许已不能正确概括海岸线这类不规则图形的特征。海岸线虽然很复杂,却有一个重要的性质———自相似性。从不同比例尺的地形图上,我们可以看出海岸线的形状大体相同,其曲折、复杂程度是相似的。换言之,海岸线的任一小部分都包含与整体相同的相似的细节。
在物理学中,湍流是自然界中普遍现象,小至静室中缭绕的轻烟,巨至木星大气中的涡流,都是十分紊乱的流体运动。流体宏观运动的能量,经过大、中、小、微等许许多多尺度上的漩涡,最后转化成分子尺度上的热运动,同时涉及大量不同尺度上的运动状态,就要借助“无标度性”分形几何,解决湍流中高漩涡区域问题。
从以上简单的例子,我们说自相似性就是局部与整体相似,局部中又有相似的局部,每一小局部中包含的细节并不比整体所包含的少,不断重复的无穷嵌套,形成了奇妙的分形图案,它不但包括严格的几何相似性,而且包括通过大量的统计而呈现出的自相似性。
2.1.2 自相似的模拟
在欧氏空间中,人们习惯把空间看成三维的,平面或球面看成二维,而把直线或曲线看成一维。也可以稍加推广,认为点是零维的,还可以引入高维空间,但通常人们习惯于整数的维数。分形理论把维数视为分数,这类维数是物理学家在研究混沌吸引子等理论时需要引入的重要概念。为了定量地描述客观事物的“非规则”程度,1919年,数学家从测度的角度引入了维数概念,将维数从整数扩大到分数,从而突破了一般拓扑集维数为整数的界限。
分维的概念我们可以从两方面建立起来:一方面,我们首先画一个线段、正
30复杂系统的分析与建模
方形和立方体,它们的边长都是1。将它们的边长二等分,此时,原图的线度缩小为原来的1/2,而将原图等分为若干个相似的图形。其线段、正方形、立方体分别被等分为21、22和23个相似的子图形,其中的指数1,2,3,正好等于与图形相应的经验维数。一般说来,如果某图形是由把原图缩小为1/a的相似的b个图形所组成,有下式的关系成立:
a=bD=logb/loga
则指数D称为相似性维数,D可以是整数,也可以是分数。
另一方面,当我们画一根直线,如果我们用0维的点来量它,其结果为无穷大,因为直线中包含无穷多个点;如果我们用一块平面来量它,其结果是0,因为直线中不包含平面。那么,用怎样的尺度来量它才会得到有限值呢?看来只有用与其同维数的小线段来量它才会得到有限值,而这里直线的维数为1(大于0、小于2)。与此类似,如果我们画一个Koch曲线,其整体是一条无限长的线折叠而成,显然,用小直线段度量,其结果是无穷大,而用平面量,其结果是0(此曲线中不包含平面),那么只有找一个与Koch曲线维数相同的尺子度量它才会得到有限值,而这个维数显然大于1、小于2,那么只能是小数(即分数)了,所以存在分维。其实,Koch曲线的维数是1.2618……。
D
2.1.3 分形几何的特征
分形几何学的基本思想是:客观事物具有自相似的层次结构,局部与整体在形态、功能、信息、时间、空间等方面具有统计意义上的相似性,称为自相似性。例如,一块磁铁中的每一部分都像整体一样具有南北两极,不断分割下去,每一部分都具有和整体一样的特性。客观自然界中许多事物,具有自相似的“层次”结构,在理想情况下,甚至具有无穷层次。适当地放大或缩小几何尺寸,整个结构并不改变。不少复杂的物理现象,背后就是反映着这类层次结构的分形几何学。经典维数都是整数:点是零维、线是一维、面是二维、体是三维。而分形维数可以取分数,简称分维。例如,海岸线的分维数D值可以取为1.02,1.25等。曼德勃罗是想用此词来描述自然界中传统欧几里德几何学所不能描述的一大类复杂无规则的几何对象。例如,弯弯曲曲的海岸线、起伏不平的山脉,粗糙不堪的断面,变幻无常的浮云,九曲回肠的河流,纵横交错的血管,令人眼花缭乱的满天繁星等。它们的特点是,极不规则或极不光滑。直观而粗略地说,这些对象都是分形。分形几何与传统几何相比有以下特点:
(1)从整体上看,分形几何图形是处处不规则的。例如,海岸线和山川形状,从远距离观察,其形状是极不规则的。
(2)在不同尺度上,图形的规则性又是相同的。上述的海岸线和山川形状,
第2章 复杂系统的分形自相似分析与建模31
从近距离观察,其局部形状又和整体形态相似,它们从整体到局部,都是自相似的。当然,也有一些分形几何图形,它们并不完全是自相似的。其中一些是用来描述一般随机现象的,还有一些是用来描述混沌和非线性系统的。
许多分形是由一些与整体以某种方式相似的部分组成的,比如三分康托集是与它自身相似的两部分的并:而VonKoch曲线则由四个与之相似的部分组成的。这些自相似性不仅是这类分形的性质,实际上可以用来作为它们的定义。
Kohn雪花和Sierpinski三角形也是比较典型的分形图形,它们都具有严格的自相似特性。这些自然现象,特别是物理现象和分形有着密切的关系,银河系中的若断若续的星体分布,就具有分维的吸引子。多孔介质中的流体运动和它产生的渗流模型,都是分形的研究对象。这些促使数学家进一步的研究,从而产生了分形几何学。电子计算机图形显示协助了人们推开分形几何的大门。这座具有无穷层次结构的宏伟建筑,每一个角落里都存在无限嵌套的迷宫和回廊,促使数学家和科学家深入研究。
法国数学家曼德尔勃罗特这位计算机和数学兼通的人物,对分形几何产生了重大的推动作用。他在1975年、1977年和1982年先后用法文和英文出版了三本书,特别是《分形———形、机遇和维数》以及《自然界中的分形几何学》,开创了新的数学分支———分形几何学。
严格地而且正式地去定义分形是一件非常复杂而且困难的事情。最为流行的一个定义是:分形是一种具有自相似特性的现象、图像或者物理过程。即分形中,每一组成部分都在特征上和整体相似。
1.自相似性
分形最明显的特征是自相似性。例如,图2-1-2所示的分形植物、图2-1-3所示的Sierpinski三角形、图2-1-4所示的Kohn雪花都是比较典型的分形图形,它们都具有严格的自相似特性。
在自然界中,有许多景物都在某种程度上存在这种自相似特性,即它们中的一个部分和它的整体或者其他部分都十分形似。其实,远远不止这些。从心脏的跳动、变幻莫测的天气到股票的起落等许多现象都具有分形特性。这正是研究分形的意义所在。例如,在道・琼斯指数中,某一个阶段的曲线图总和另外一个更长的阶段的曲线图极为相似。
2.无限精细和无限复杂性
图2-1-5所示的这张月球表面的照片也是用分形技术生成的。如果你把照片放大观看,也可以看到更加细致的东西。因为分形能够保持自然物体无限细致的特性,所以,无论你怎么放大,最终,还是可以看见清晰的细节。另外,分形的正式定义是依据分维(分数维)来判断的。因为分维的概念复杂性以及其构成结果的复杂性(见图2-1-6)决定了其无限复杂性的特征。
32复杂系统的分析与建模
图2-1-5 月球模型图2-1-6 分形风景
2.2 复杂系统的分形建模技术
分形(Fractal)源于拉丁文形容词fractus,本意是不规则的、破碎的、分数的。分形理论的创始人曼德布罗特认为“:分形是非线性变换下的不变性”。非线性科学家郝柏林教授也认为,复杂性的根源是非线性。研究复杂性的问题离不开非线性科学。多数非线性问题有其外在的几何表现或内在的几何表示,这里的几何学在理想情况下是具有非整数维数的分形几何学。
2.2.1 分形几何的产生和意义
1973年,曼德勃罗在法兰西学院讲课时,首次提出了分维和分形几何的设想。分形(Fractal)一词是曼德勃罗创造出来的,其原意具有不规则、支离破碎等意义,分形几何学是一门以非规则几何形态为研究对象的几何学。由于不规则现象在自然界是普遍存在的,因此分形几何又称为描述大自然的几何学。分形几何建立以后,很快就引起了许多学科的关注,这是由于它不仅在理论上,而且在实用上都具有重要价值。客观事物有它自己的特征长度,要用恰当的尺度去测量。用尺来测量万里长城,嫌太短;用尺来测量大肠杆菌,又嫌太长。从而产生了特征长度。还有的事物没有特征尺度,就必须同时考虑从小到大的许许多多尺度(或者叫标度),这叫做“无标度性”的问题。
自然现象,特别是物理现象和分形有着密切的关系,银河系中的若断若续的星体分布,就具有分维的吸引子。多孔介质中的流体运动和它产生的渗流模型,都是分形的研究对象。例如物理学中的湍流,湍流是自然界中普遍现象,小至静室中缭绕的轻烟,大至木星大气中的涡流,都是十分紊乱的流体运动。流体宏观运动的能量,经过大、中、小、微等许多尺度上的漩涡,最后转化成分子尺度上的热运动,同时涉及大量不同尺度上。在20世纪70年代,法国数学家曼德尔勃罗
第2章 复杂系统的分形自相似分析与建模33
特在他的著作中探讨了英国的海岸线有多长?这个问题依赖于测量时所使用的尺度。如果用公里作测量单位,从几米到几十米的一些曲折会被忽略;改用米来做单位,测得的总长度会增加,但是一些厘米量级以下的就不能反映出来。由于涨潮落潮使海岸线的水陆分界线具有各种层次的不规则性。数学家寇赫从一个正方形的“岛”出发,始终保持面积不变,把它的“海岸线”变成无限曲线,其长度也不断增加,并趋向于无穷大。以后可以看到,分维才是“寇赫岛”海岸线的确切特征量,即海岸线的分维均介于1~2之间。
回顾即将过去的一个世纪数学的发展历程,我们可以欣喜地看到,一个世纪以来,数学家们在追求数学理论的完美性和数学应用的广泛性上所做出的孜孜不懈的努力和所取得的丰硕成果:孤子、混沌、分形、小波(Wavelet)……。而分形是当代科学中最有影响和感召力的基本概念之一,分形几何学是探索复杂性的有效工具,对各门自然科学均产生了并将继续产生深远的影响。一方面,分形几何中的主要角色都是由传统数学中的“病态”结构或数学“怪物”所扮演的:三分康托(G.Cantor)集、维尔斯特拉斯(K.Weierstrass)函数、科契(VonKoch)雪花曲线、皮亚诺(G.Peano)填充空间的曲线等等。曼德尔布罗特把它们放在分形几何中统一处理,使人们看到了过去那些被认为是“病态”的“怪物”展现出新的规则和奇妙无比的美。另一方面,使科学家们惊讶并欢迎的是,分形几何为研究自然界中形形色色的复杂形状和结构提供了十分简洁的工具,因而在天文、地学、物理、化学、生物、医学、材料乃至语言学、经济学等领域得到了十分广泛的应用。
为适应各种突变环境,混沌和非线性系统的内部结构是具有无限层次的精密结构。分形理论是描述这种非线性结构的一种科学方法。它研究一类不规则、支离破碎、分数维的物体,如海岸线、岩石表面、云彩等形成机制及其数学模型。它揭示了隐藏在这些复杂物体背后的内部精密结构及其自相似性的规律。这些自然物是在长期的严酷环境中进化而成的,它具有复杂的结构以适应环境的变化。先进制造系统中顾客化产品的设计、制造系统重构与经营过程重组其逻辑过程同上述是完全一致的,它们是非线性相似而不是传统的线性相似。为此要研制好基本单元,设计好体系结构式中的系统动态方程,研究好交互迭代的方法,分形理论是进行这方面研制的基础。
2.2.2 分形的定义
1.曼德勃罗的分形定义
曼德勃罗曾经为分形下过两个定义:【定义1】满足下式条件
Dim(A)>dim(A)
34复杂系统的分析与建模
的集合A,称为分形集。其中,Dim(A)为集合A的Hausdoff维数(或分维数),dim(A)为其拓扑维数。一般说来,Dim(A)不是整数,而是分数。
【定义2】部分与整体以某种形式相似的形称为分形。
然而,经过理论和应用的检验,人们发现这两个定义很难包括分形如此丰富的内容。实际上,对于什么是分形,到目前为止还不能给出一个确切的定义,正如生物学中对“生命”也没有严格明确的定义一样,人们通常是列出生命体的一系列特性来加以说明。对分形的定义也可进行同样的处理。
(1)分形集都具有任意小尺度下的比例细节,或者说它具有精细的结构。(2)分形集不能用传统的几何语言来描述,它既不是满足某些条件的点的轨迹,也不是某些简单方程的集。
(3)分形集具有某种自相似形式,可能是近似的自相似或者统计的自相似。(4)一般,分形集的“分形维数”,严格大于它相应的拓扑维数。
(5)在大多数令人感兴趣的情形下,分形集由非常简单的方法定义,可能以变换的迭代产生。
在被使用的多种多样的分形维数中,豪斯道夫定义是最古老的也是最重要的一种。豪斯道夫维数具有对任何集都有定义的优点,由于它是建立在相对比较容易的测度概念的基础上,因此在数学上也是比较方便的。
2.盒维数(BoxDimension)的测度方法
盒维数又称计盒维数(Box-counting),是应用最广泛的维数之一,它的普遍应用主要是由于这种维数的数学计算及其经验估计相对容易一些。对这种维数的研究可以追溯到20世纪30年代,并且对它赋予各种不同的名称,如Kolmog-orov熵、熵维数、度量维数、对数密度等。
设F是Rn上任意非空的有界子集,Nδ(F)是直径最大为δ,可以覆盖F的集的最少个数,则F的下、上盒维数分别定义为:
DimBF=δlim
→0DimBF=δlim
→0
logNδ(F)-logδlogNδ(F)-logδlogNδ(F)-logδ
n
(2-2-1)(2-2-2)
如果这两个值相等,则称这共同的值为F的盒维数,记为:
DimBF=δlim
→0
(2-2-3)
盒维数有一些等价的定义,有时这些定义更适合应用。考虑R中δ-坐标网立方体,即下列形式的立方体:
m1δm1+1δ…mnδmn+1δm1δ,m1+1δ…mnδ,
mn+1δ第2章 复杂系统的分形自相似分析与建模35
其中,m1,…,mn都是整数(显而易见,在R1中“,立方体”即表示为区间,而在R2中表示为正方形)。设N′δ(F)是δ-坐标网立方体与F相交的个数,显然这是
δ(F)个直径为δn的覆盖。F的集类,因此有:N′
Nδn(F)≤N′δ(F)
如果δn<1,则
logNδn(F)logNδ(F)≤
-logδn-logn-logδ
令δ→0,取下、上极限:
DimBF≤δlim
→0DimBF≤δlim
→0
logN′δ(F)-logδlogN′δ(F)-logδ
n
(2-2-4)(2-2-5)
另一方面,任何直径最大为δ的集合包含在3个边长为δ的网立方体内(由包含这个集的一些点、一个立方体以及与立方体相邻的全部立方体组成),由此
δ(F)≤3Nδ(F)N′
n
取对数并取极限可以得到与式(2-2-4)及式(2-2-5)反向的不等式。因此,为求出式(2-2-1)~式(2-2-3)定义的盒维数,可以等价地取Nδ(F)为与F相交的边长为δ的网立方体的个数。
盒维数的这个形式的定义在实际中有广泛的应用。为计算一个平面集F的盒维数,可以构造一些边长为δ的正方形或称为盒子,然后计算不同δ值的“盒子”和F相交的个数Nδ(F)———盒维数由此而得名,这个维数是当δ→0时,Nδ(F)增加的对数速率,或者可以由函数logNδ(F)相对于logδ图的斜率值来估计。
2.2.3 分维的计算
我们生活在一个具有长度、宽度和深度的三维世界里。你可能知道:一个平面是二维的,一条直线是一维的,而一个点呢?零维的!我们能够想象具有类似维数的任何物体。但是,你能想象一个具有分数维(分维)的物体吗?
假如你把一条直线分为N段,那么,你就有了原始直线的N个更小的版本,每一个都按照一个比例系数r减小,在这里Nr=1。对一个正方形来说,也分成几个小的正方形,也让每一正方形的每边的缩放比例为r。注意,这个时候N和r的关系是Nr=1。总之,假设你把一个d维物体分为N等份,每一份的缩放比例是r,二者的关系是Nr=1。经过数学计算,可以得到其分维为:
d=logN/log(1/r)
(2-2-6)
d
2
36复杂系统的分析与建模
图2-2-1所演示的为Kohn雪花,先画一个等边三角形,把边长为原来三角形边长的1/3的小等边三角形选放在原来三角形的三条边上,由此得到一个六角星;再将这个六角星的每个角上的小等边三角形按上述同样方法变成一个小六角星……如此一直进行下去,就得到了雪花的形状。对于Kohn雪花来说,按照式(2-2-6)计算有N=4和r=1/3。运用上面的等式,可以计算d=log4/log3≈1.261859507143。
图2-2-1 Kohn雪花的演变
在Sierpinski三角形中,首先作一个如图2-2-2所示的完全填充的三角形(二维),然后,从中间移去一个三角形,再在剩下的三角形中分别移去一个三角形,最终它的面积等于零了,于是,它的位数自然小于2,但是却永远达不到1。因为,无论何处它都不接近一条线。所以,它的维数也在2与1之间。Sierpin-ski三角形中,我们把三角形分成了三个相等的部分。而每一部分的边长和高只是原先三角形的1/2,所以N=3,并且r=1/2,根据式(2-2-6)计算的结果则是d=log3/log2,结果大约等于1.584962500721。
图2-2-2 Sierpinski三角形的演变
第2章 复杂系统的分形自相似分析与建模37
2.2.4 分形时间
由以上可以看出,分形是以函数图像形式出现的。确实,当许多现象被绘制成时间的函数时,就显示了分形的特性。相应的例子包括大气压强、容器中液体的水平高度、股票市场的价格等,至少当记录的数据跨越较长的时间间隔便如此。
我们常常会想,无生命的东西是固定不动的,然而像风、海浪、河流甚至于玻璃、岩石、塑胶等等都会有一定的运动。事实上,任何物质都在动,只是有些运动是发生在分子级的水平上,我们看不见或无法直接测量到而已。此外,物体的合成也将引起运动(它们的分子自身的运动或再结合),尤其当它们处于外部的强制之下时(例如压力、温度、电场或磁场等)。今天在工业上研究这类变化非常重要,因为生产出的物品,如塑胶、玻璃、橡皮、生丝等等,有关变化对物品的有效期举足轻重。
在晶体物质中,变化以指数的比率进行。类似地,对于放射性物质,在某一定的时间间隔里以一半的速度衰减。非晶体物质(无定形物质)的分子的变化或移动,则贯穿整个的变化时间,有些是以秒计,而另一些则以年计。这些非晶体物质的重组现象,能够用术语“分形时间”加以描述。“分形时间”是基于与分形同样的思想。一个几何分形细微部分的放大,即为其大形状的复制。观察这种形式复制的时间,一个物质分子从重组到出现差异的时间间隔,类似于分形复制过程的步骤,从而时间也类似地依赖于该物质在上述步骤中存在的景象。这样,分形的数学在研究物质变化的过程中便担负了重要的角色,而有关的发现和成果,也将用于工业上,以改进产品的有效期。
2.2.5 分形几何学的应用
分形几何学已在自然界与物理学中得到了应用。如在显微镜下观察落入溶液中的一粒花粉,会看见它不间断地做无规则运动(布朗运动),这是花粉在大量液体分子的无规则碰撞(每秒钟多达十亿次)下表现的平均行为。布朗粒子的轨迹,由各种尺寸的折线连成。只要有足够的分辨率,就可以发现原以为是直线段的部分,其实由大量更小尺度的折线连成。这是一种处处连续,但又处处无导数的曲线。这种布朗粒子轨迹的分维是2,大大高于它的拓扑维数1。
在某些电化学反应中,电极附近成绩的固态物质,以不规则的树枝形状向外增长。受到污染的一些流水中,粘在藻类植物上的颗粒和胶状物,不断因新的沉积而生长,成为带有许多须须毛毛的枝条状,就可以用分维。
自然界中更大的尺度上也存在分形对象。一枝粗干可以分出不规则的枝杈,每个枝杈继续分为细杈……,至少有十几次分支的层次,可以用分形几何学
38复杂系统的分析与建模
去测量。
有人研究了某些云彩边界的几何性质,发现存在从1km~1000km的无标度区。小于1km的云朵,更受地形概貌影响,大于1000km时,地球曲率开始起作用。大小两端都受到一定特征尺度的,中间有三个数量级的无标度区,这已经足够了。分形存在于这中间区域。
近几年在流体力学不稳定性、光学双稳定器件、化学震荡反应等试验中,都实际测得了混沌吸引子,并从实验数据中计算出它们的分维。学会从实验数据测算分维是最近的一大进展。分形几何学在物理学、生物学上的应用也正在成为有充实内容的研究领域。
2.3 分形在工程系统中的自相似分析与建模
2.3.1 股票价格的预测模型[6]
个体投资者与专业股票和货币炒家比任何时候都更清楚地知道,任何金融市场上的股票牌价变化之快常常令人心跳骤停。当市场的变化似乎突然加速、行情越来越反复无常时,投机者转瞬之间就可以赚到大笔钱或亏掉大笔钱。近来,由于伊拉克战争,股市尤其是汇市发生激烈的震荡。美元对欧元的汇率在一个月内的变动高达8%~10%。利用数学分形几何方法对股票价格进行预测,对我们回避股市风险将会有很大的帮助。分形方法的特点是引入了分维数的概念。在传统的几何学中,维数为整数,例如点为零维,直线为一维,平面为二维等。而在分形方法中,分维数D突破了整数的,例如海岸线的分维数D值可以取为1.02、1.25等。但是,在原有的分形方法中,分维数为常量,而自然界中根本不存在严格满足这种分形关系的现象。因此大量的复杂现象无法用原有的分形(可称为常维分形)模型来描述。这里介绍一种变维分形的概念,亦即分维数是可变的量。应用变维分形及原有的常维分形方法预测股票指数,已经取得了初步成果。
证券理论提出的防范风险的措施依靠的是一些要求很严的、而且终究没有什么根据的假设。首先,它认为价格的变动统计上是彼此的,例如,今天的价格对于现行价格和明天的价格之间的变化毫无影响。因而,预测未来的市场动向就成了不可能的事情。第二个假设是,所有的价格变化的分布服从标准钟形曲线这一模式。钟形的宽度(用它的σ值即所谓标准差来量度)描述了价格变化偏离平均值有多远。极端情况的事件被认为是极其罕见的。事实上这一理论规定台风是不存在的。
金融资料是否与这些假设完全相符?当然从来不是如此。股票或货币随着
第2章 复杂系统的分形自相似分析与建模39
时间变动的走势图的确显示了一个价格小幅上下波动的恒定背景———但这些变化并不像人们根据价格变动符合钟形曲线这一假设所预期的那样均匀。不过,这些变化趋势仅是走势图的一个方面。还有相当多的突然的剧烈变化———在走势图上呈现为急升急降的尖峰,如像某公司的股票那样———在较为平缓的变化的背景上显得十分突出。而且,价格变动的幅度(无论大小)可能在一年的时间里保持大致恒定,然后在一段很长的时间里其变化程度又突然加剧。在市场的混乱加剧时,价格的急升急降就变得越来越常见,在走势图上呈现为密集分布的形态。
首先对分形分布的定义和有关计算公式作一说明。分形分布可用如下幂指数分布定义:
N=
CrD
(2-3-1)
式中:r为特征线度,如时间,长度等;N为与r有关的物体数目,如价格、指数等;C为待定常数;D为分维数。
在本节中r取为时间的编号,例如规定某一天为第一天,则有r1=1,第二天的r2=2等。N为股票指数,例如可以将N1取为第一天的收市指数,N2取为第二天的收市指数等。
在目前一般应用的分形方法中,D为常数,这种分形可称为常维分形。它在双对数坐标上是一条直线。根据该直线上的任意两个数据点(Ni,ri)和(Nj,rj),可以确定该段直线的分形参数,亦即分维数D和常数C。将两个数据点的坐标代入式(2-3-1)后可以解出:
ln(Ni/Nj)D=
ln(rj/ri)C=NirD
(2-3-2)(2-3-3)
由于负数不能进行对数计算,所以当Ni中有负数时,必须将全部N值加一个常数以消除负数,亦即将全部数据点先进行一下平移处理。有时为了使分析和预测的结果更好,也可以先将全部数据点进行一下平移处理。
但是对于双对数坐标上非直线的函数关系,原有的分形方法就无法处理。为克服这一困难,这里采用了变维分形的概念,亦即分维数D是可变的量。
现在我们说明,对于N与R之间的任一函数关系N=f(R),均可转化为分形分布N=C/r的形式。为此只需令
f(R)=
解出r可得:
r=
Cf(R)
1/D
D
CDr
(2-3-4)
(2-3-5)
40复杂系统的分析与建模
也就是将R经过上式的变换而得到分形分布的形式。
前面已经说明,对于任一函数关系,均可转化为分形分布的形式。然而在实际应用中,往往只给出一些数据点,而函数关系则是未知的,因此变换的具体形式也就无法求出。在这种情况下,只能用尝试的方法来寻找恰当的变换方法。既然是尝试的方法,就可以变换R,也可以变换N。经过选择,发现了一种施行累计和的系列变换,可以将数据进行一系列变换,从中选出一种变换,使变换后的数据能与分形分布模型符合良好,也就是使变换后的数据能用分形分布来处理。该法可简介如下:
(1)将原始数据点(Ni,ri)(i=1,…,n)绘于双对数坐标上,一般情况下它们不能与分形分布模型符合良好,于是可将Ni排成一个基本序列,即有:
{Ni}={N1,N2,N3,…} (i=1,2,…,n)
(2-3-6)
其他的序列均可以根据基本序列构造。例如构造一阶累计和序列S1,其中S11=N1,S12=N1+N2,S13=N1+N2+N3等等,依此类推可构造二阶、三阶累计和等等,即有:
{S1i}={N1,N1+N2,N1+N2+N3,…} (i=1,2,…,n){S2i}={S11,S11+S12,S11+S12+S13,…} (i=1,2,…,n){S3i}={S21,S21+S22,S21+S22+S23,…} (i=1,2,…,n){S4i}={S31,S31+S32,S31+S32+S33,…} (i=1,2,…,n)
(2-3-7)(2-3-8)(2-3-9)(2-3-10)
(2)建立各阶累计和的分形模型。以一阶累计和为例。将数据点(S1i,ri)(i=1~n)绘于双对数坐标上,即得离散的分形模型。例如根据n个数据点,可以得到由n-1条直线组成的分段常维分形模型(这也是最简单的变维分形模型),各条直线的分形参数可根据式(2-3-2)和(2-3-3)计算(其中的N值用S1值代替)。
(3)选择效果最好的变换并确定其相应的分形参数。将各阶累计和构成的数据点分别绘于双对数坐标上之后与某一分形分布模型进行对比,即可选择效果最好的变换并确定其相应的分形参数。
分形分布模型确定之后,即可用外插计算的方法进行预测。
由于股票波动曲线具有统计自相似的特性,所以对它的分析可以与标准统计学中的分析有所不同。在标准统计学中,数据点越多越好,因为观测被假定是的。而从分形技术的角度看,我们需要的是更多的时间,而不是更多的数据,隔点采集数据不会影响股票的基本走势,几乎没有丢掉多少信息。这是因为股票波动是一个非线性动力学系统,而非线性动力学系统的特点是长期相关的。认识到这一点,我们在实际的数据分析中就可以减小采集的数据量从而增加分析运算的速度。当然,具体数据量应该小到多少还需要进一步的摸索。另外,对一支股票的不同时段,或不同股票的同一时段的盒维数的测定,有助于我们把握
第2章 复杂系统的分形自相似分析与建模41
股市的相对复杂性,有助于我们在实际操盘中避免不必要的风险。
再者,考虑到股市波动所具有分形结构,可以利用股市的历史资料总结出分形元来,从而构造相应的分形模型对具体走势进行模拟和预测。当然,从现在的研究看来,根据这种方法,还无法预测某一天的股价的升与降,但是,可以分析出股市波动的动向或趋势,以便我们能够对必将发生的重大变化作好准备。
2.3.2 企业需求的预测[20]
分形企业(fractalenterprise)是借用分形几何中的自相似性概念描述的一种新的生产方式。
用数学的语言来说,分形几何是研究自然界中没有特征长度而又具有自相似性的形状和现象。大量事实说明分数维态(即分数维构造)是介于无序-有序之间的状态,是自然界最广泛分布的状态。这种状态是不稳定的或是准稳定的,这正是自然界运动、发展、演化的根本原因。
分形企业的特点可以用图2-3-1表示。
图2-3-1 分形企业的特点
分形企业的自相似性包括:
(1)企业组织结构的自相似,即以过程为中心建立企业的组织。
(2)目标自相似,即单元的目标与企业的目标一致。分形企业的优化目标是:时间、柔性、质量、成本、生态和社会性。组织结构的自相似性强调自主,目标的自相似性强调自律。分形企业通过自律和自主的统一,提高企业的效率和柔性的统一。
分形企业在自相似的基础上具有自组织性的特点,表现为:(1)自监控:产品质量、总数、效率和性能等方面的自监控。(2)自:企业能力利用、资源配置分配和评价的自。
42复杂系统的分析与建模
(3)自确定:工作时间、生产方式等的自确定。(4)自治性:生产安排和控制的自主自治。
(5)不是各人行为的协调和控制,而是分形的面向结果的评价。在分形企业中,各个子系统在企业的总体目标下,自主寻求局部最优解,相互通过消息进行磋商和协调,得到企业的满意解。
在20世纪80年代,日本制造业的迅速崛起,特别是汽车制造业的后来居上给欧美发达国家带来很大的振动。1990年美国麻省理工学院(MIT)在其一个调查项目“国际汽车计划(IMVP)项目研究”的一份研究报告中系统地分析了造成日本与美国汽车制造业差距的主要原因,归纳出了一种新的生产系统模式———精益生产(LeanProduction)。精益生产方式综合了单件生产与大量生产的优点,既避免了前者的高成本,又避免了后者的僵硬化。精益生产系统的各个层次上都雇用了多面手,并采用了通用性好、自动化程度高的机器来制造品种多样的产品。精益生产方式的特点可归纳为:以“人”为中心,以“简化”为手段,以“尽善尽美”为最终目标。日本丰田汽车公司在第二次世界大战后首创了精益生产方式。当其他的日本汽车公司和制造企业引用了这一卓越的生产方式后,日本制造业很快达到了世界领先的地位。
德国的工程师学会(VDI)瓦耐克(Warnecke)教授在1993年提出了“分形企业”的概念和理论。他将分形企业作为欧洲对日本的精益生产方式的响应。瓦耐克教授领导的研究所将分形企业的理论应用于实践,取得显著的效果。
先进制造系统的层次结构与传统的观念不同,传统的观念只看到现实世界中的宏观层与微观层,事实上复杂世界存在着宏观、中观与微观等三个层次。这里定义的中观层就是传统常用的微观层,它是现实世界中看得见摸得着的,如具体的产品等;宏观层是抽象世界,它是看不见摸不着的但又是现实存在的东西,如产品的体系结构等;微观层也是抽象世界,它外表也是看不见摸不着的但又是现实存在的东西,如产品中的零件及信息产品中的基本信息、原始数据等。中观层是不断改变与不可预测的非平稳过程。但是宏观与微观层则是相对稳定可以预测的。
分形是一个自激励的企业单元。分形能够通过自组织和自优化,使其目标与企业目标一致。分形企业是一个开放系统,通过自激励形成与其目标自相似的单元———分形,通过其动态组织结构,形成类似生命体的活系统。分形以非线性的方式发展,按概率准则进行跳跃式发展与转变,不能事先进行控制。在分形企业中,网络结构是一种理想的组织形式。分形企业的所有业务联系(内部和外部一样)是暂时的,是一种利益联盟。分形企业中的部门(分形)间的以及分形企业与供应商和用户间的边界是模糊的,相互间的信息交换和过程的结合很容易。
分形企业将制造系统看作是具有自相似的过程和结构的集成系统,非线性
第2章 复杂系统的分形自相似分析与建模43
发展的系统,不能精确预测的、其内部和外部的边界是模糊的系统。传统企业为自己确定了一个有限的目标,可以容忍一定的废品率、最低限度的库存、系列范围很窄的标准产品等。分形企业则把目标确定为不断完善,追求尽量低的成本、无废品、零库存、“一个流”生产、产品品种无穷多样。从而可以促使人们去不断探索、不断奋斗,创造出难以想象的奇迹。
2.3.3 符合分形原理的企业供应链的管理[19]
我国企业的管理现状是,地区分布广泛,行业企业间和行业企业内的技术装备和人员素质差异性大。各个行业间的管理模式多种多样。企业的经营特点相当复杂,企业的所有制形式多种多样。企业的管理决策者,对于盛行的管理技术和方法的认识也不完全一致,特别是各种管理理念产生了不同的阐释,大家的理解不是完全相同。因此,运用一种管理技术去适应多变的企业需求,是很不现实的。特别是,管理信息化的日益普及,出现了对于业务流程重组(BPR)的猛烈抨击和大力表扬并存的现象,也有对于ERP的恐惧和狂热并存,同样,对供应链管理(SCM)也有人将其吹乎得玄乎其神。实际上,以上的观点都没有问题,问题在于大家在谈论同一个管理技术时,是基于不同的管理应用背景(Context),因此得出了截然相反的结论。反过来仔细思考一下,这些管理技术也是从某一些企业的优秀实践中总结出来的,因此它的适用效果和范围要因地制宜。
供应与需求链管理,突出了需求的内容,是因为需求链所包含的与供应逆向的内容和功能越来越多。比如i2公司,就明确提出了需求链,还有国内的著名学者、软件厂商也一致在强调需求与供应的对应。供应与需求链管理基于的前提是:企业是市场供需的平衡机体,其经济目的是实现开源节流,并要保持源流的有机平衡。那么供应与需求链,则是一个双向的信息、资金、物流的回路。根据企业在行业中的地位,不同企业的作用域(也就是控制力)是不同的。因此,引出的问题是,企业的供应与需求链的长度是有的,企业的供应、需求链有轻重之分。供应和需求所关注的要点也不相同,供应强调的是在既定或预定的需求下,如何更好地满足需求。而需求链侧重的是客户需求的分析和需求信息的有效传递,它与CRM的区分点是,在接近客户的接触点上,需求链侧重了需求信息的回馈。
在文化层,从企业的价值和思考模式考察企业。企业文化的变化是一个长期的渐进的过程。在企业的文化环境内,会发现企业文化具有分形的特征,在分形企业中,将采取一种新的模式,如自组织模式。同一企业内部的部门、团队的文化会表现出企业文化的基本特征,同时,每一个子组织会具有本身的文化特点。这些潜含于个体员工身上的细微的文化因素,在组织的改革、工作的调整、企业的发展等涉及企业组织动向的活动中会产生外部人员难以理解的力量。这
44复杂系统的分析与建模
种力量可能是阻力,也可能是润滑剂。因此供应与需求链的管理,如果超出了企业本身的控制范围,其难度可想而知。由于供应与需求链必然存在与不同文化环境的组织进行交往,因此其供应与需求链管理的文化依赖性比之于企业内部会更复杂。
在战略层,从企业的市场、产品、知识、组织、用户和业务流程多方面考察企业。为了在企业内部的不同业务组织间、不同的职能部门之间形成顺畅的业务流通秩序,企业内部形成了各种各样的制度、规章等行为规范,还有各种场合、各种层次的审批、交流机制。因此企业的文化和企业的运作机制形成了复杂的相互作用的情形。所以,经常可以看到媒体上介绍,一类企业是内部各部门如何相互支持形成了极具战斗力的,一类企业是内部的职能部门之间互相推诿,延误了市场战机。一些企业的高层决策者,也在不断地自我解剖在管理上的失误及招数。
在信息层,从企业的信息流考察企业。在分形企业中,采用分布式结构和高度自治的单元,对企业信息系统的要求也就大大提高。如:任意信息点间的信息交流;大范围地进行问题讨论;各种不同应用软件的集成以迅速解决问题。各种媒体上关于企业管理信息化应用的文章,大都总结了企业管理信息化中的流程的规范,同时在每一片文章的结尾关于应用效益的分析中,几乎都提到了关于管理控制的问题,比如成本通过控制降低得效果、人员在操作上的规范、与企业本身的适应等等。
在经济-资金层,从创造价值的角度考察企业。分形企业的组织形式有利于资金、成本等的管理。在社会信息层,从企业中的人的相互关系和作用考察企业。其方法来自社会学和心理学。在分形企业中,企业职工将是复杂人。在分形企业中,把职工看作是共同决策者、共同管理者、共同设计者等。最终目标是发挥人的创造性。高的创造性意味着职工自己对工作系统进行优化,对各种变化作出适应性反应。
可以得出,供应与需求链的管理,除了流程和运行指标以外,还需要增加关于流程、职能、人员之间的控制体系,还需要增加流程因素、控制体系因素所能适应的企业文化环境。
分形企业利用分形几何理论,对复杂的制造系统采用自相似原理进行分析和重组。从而使制造系统得到简化和优化,使制造系统具有自组织的结构和功能,使制造系统具有很大的灵活性和很高的效率。分形企业的理论和实践告诉我们,制造系统的重组和优化是一个系统工程。它需要企业文化、人的价值观的转变,由此营造一种相互信任、协作和目标一致的氛围;它需要引入先进的计算机信息技术,使信息传递准确、快捷,使企业的业务过程变得透明;它需要对传统的组织结构进行重组,使其更加面向职工、面向用户和面向过程,以充分发挥人
第2章 复杂系统的分形自相似分析与建模45
的积极性和创造性,简化系统结构,使企业更为灵活;它需要对产品结构进行合理化,这不仅提高产品设计质量和效果,也将给整个制造和生产管理过程带来极大的好处;它需要对业务过程进行重组,使物流和信息流更为合理。分形企业的理论和实践对中国企业的转型有重要的参考价值。无论是德国的分形企业,还是日美的精益生产,都特别突出强调企业中人的重要性,强调组织和过程重组的重要性,而不是一味地追求高自动化。通过提高企业中的人的自觉性、积极性和创造性,显著提高企业市场竞争能力。
2.3.4 其他预测问题的应用
1.分形方法预测未来国际原油价格
[21]
国际原油价格是石油经济分析研究中的一项非常重要的数据,历来受到与陆上或海洋石油有关的国家和部门的高度重视。在最近十几年间,分形方法已在一些领域获得成功应用,它被用来揭示复杂现象中深藏的有组织结构。
反映有组织结构特征的量称为分维数,用D值来表示。在目前一般应用的分形方法中,分维数D为常数,例如不同地段海岸线的分维数D值可以取为1.02、1.25等。用分形方法预测国际原油价格数据。
分形分布可用如式(2-3-1)幂指数分布。2.分形理论在彩票预测中的作用
这里简单介绍一下分形理论在彩票预测中的应用。社会生活中从事传统型即6+1型彩票的预测的人,曾经试用过多种方法,都有一定的准确度。相比而言,分形方法的应用较好地解决了彩票数据非线性发展的难题,再配合易经与现代数理方法,我们已经寻找出一套不同于一般商业彩票软件的预测方法。这一切的基础都离不开分形理论的应用。
大多数人都知道,现在没有一个准确的公式可以描述彩票数值的发展趋势,无论是线性的还是非线性的公式。但是在现有的彩票预测方法中多是用二项式钟形分布法,或线性回归法等方法,以及用粗略统计的方法,比如:上下连号,上下左右相同码,位置重复,冷热号,或算出每期彩票数值相加大于某个数或小于某个数的概率是多少,相同数值出现的频率是多少,或画出类似于股票图形的彩票走势图来进行分析。这些方法偶尔能碰上一两个数,但是从根本上说是没有太大用处的。经过认真分析,这些方法之所以没有什么准确度,是因为它们只能解决分形基本理论中极端的特例。因为这些条件是不相关的,如果把它们都应用到某期的预测中实际上是把它们看作了线性相关的因素,要想全部符合这些条件是不太可能的,而且需要等待的时间会很长。就好比现代的欧济里几何学只能用来研究正方形,圆形,三角形等非常规则的图形,而对于看似无规则的图形则束手无策。彩票数值的发展规律从整体来看完全符合分形的一般规律,而
46复杂系统的分析与建模
不是特殊规律(在个别短期时间内也可呈现非常规则的情况),这样就导致了用特殊规则无法解决一般规则的问题。
分形理论到底是如何体现在彩票数据中的呢?表面上是看不出来的,但是经过变换一下形式就一目了然了。比如有一种较简单的但不是很准确的方法是:把数据中凡是大于5的数都减去5,然后替换到原数据列中,再把生成的数据列分项生成1~3列新数据列。之后通过用分形基本项代入的方法生成最简单的两步分形列,再迭代计算成分形基本列。当然也可以把凡是小于5的数都加上5生成较大的一列数,再进行计算。或者可以同时进行这两种变换,这样会得到更准确的数据。说到这里,你可能会问,得到分形基本列有什么作用?其实答案已经很简单,看到了基本列也就找到了数据的发展规律,我们就能在更大的层次上看到基本的元素组合。同时我们在这里要额外请彩民注意:彩票数据的变形非常有用处。所谓变形,就是数据的重新排列,比如某期开奖数据是30271418020932特号07,经过我们的变形,可以得到0207091418273032,或得到02091418273030特号07,当然这些变形是要考虑预测的目的。
第2章 复杂系统的分形自相似分析与建模47
参考文献
[1] Thefractalgeometryofnature,bbnoitB.Mandelbrot.W.H.Freemanandcompa-ny,1982
[2] Fractalsandscalinginfinance:discontinuity,concetration,risk.BenoitB.Man-delbrot.springcr-verlag,1997
[3] Themultiractalmodelofassetreturns.Dicussionpapersofthecowlsfoundation
foreconomics,nos.11~1166.Lanuerntcalvet,adlaifisherandbenoitB.Man-delbrot.Cowlsfoundation,YaleUniversity,1997
[4] Multifractalsctalsand1/fnoisewildself-Affinityinphysics.benoitB.Mandelbrot,
springer-verlag,1999
[5] Turcotte,D.L..Fractalsandchaosingeologyandgeophysics.CambridgeUni-versityPress,1992
[6] 付昱华,付安捷.用分形方法预测股票指数.中国海洋石油报,2002-4-17(3)[7] [美]D・琼斯等.改变世界的机器.万国学术出版社,1991
[8] 顾新建,祁国宁,谭建荣,陈芨熙.机械制造系统工程学.杭州:浙江大学出版社,
1996.9
[9] WarneckeHJ.DieFraktaleFabrik:RevoltionderUnternehmenskutur,Springer-Verlag,Berlin,Germany,1993
[10] WarneckeHJ.AufbruchzumFractalenUnternehmen,Springer-Verlag,Berlin,
Germany,1995.Zahn,1994,33
[11] ZannE.,DillerupR.,Fabrikstrategienund-strukturenimWandel,In:Zch,G.
(HRSG.):VereinfachenundVerkleinern-dieNeuenStrategieninderProduk-tion,SchafferPoeschel,1994
[12] SihnW.,Re-engineeringthroughfractalstructures,in:Browne,J/.Oullivan,
D.(Edit),Re-engineeringtheEnterprise,Chapman&Hall,1995,10~19
[13] 任守榘,JurgenBode,罗邵武等.信息时代的制造业及信息的价值.中国机械工
程,1995,16(2):3~6
[14] RogerNagel.RickDove,21stCenturyManufacturingEnterpriseStrategy:[Re-port]LacoccaInstitute,LehighUniversity,Bethehem,PA,USA,1991
[15] KennethFalconer.FractalGeometry,MathematicalFoundationsandApplica-tions.Newyork:JohnWiley&SonsLtd,1990
[16] PierreMassotte.Self-Organization:ANewApproachtoImproveTheReactivity
ofTheProductionSystems.In:IEEEIndustrialElectronicsSocietyeds.Proceed-ingsofIEEESymposiumonEmergingTechnologiesandFactoryAutomation,Vol.ETFA’s95,Paris.IEEEComputerSocietyPress,1995
[17] HakenH.AdvancedSnergestics.SpringerVerlag,1983
48复杂系统的分析与建模
[18] 曾文曲,刘世耀,戴连贵.分形几何-数学基础及其应用.长春:东北大学出版社,
1991
[19] 顾元勋.供应和需求链的结构化管理.2001.11[20] 顾新建.分形企业的理论和实践.浙江大学
[21] 付昱华.分形方法预测2010前国际原油价格.国际石油经济,2002.2
第3章 复杂系统的元胞自动机自
组织分析与建模
元胞自动机(CellularAutomata,CA)的方法已经成为研究自组织过程和非平衡相变的有效工具之一。元胞自动机系统就是一种多个元素在简单规则作用下,形成各种各样复杂系统的模型。其由多个子系统构成的有较大时空范围的非线性非平衡系统,具有很多可能的局部规则,其中某些是稳定的,另一些是不稳定的,绝大多数是亚稳定的,这种可以从一个随机初始条件出发而发展成的包含大量拟序结构的复杂构形,在时间和空间两个方面都具有复杂的动力学行为。可以说,它代表了非线性科学面临的最严峻挑战,湍流和元胞自动机是研究较多的具有复杂构形的非线性系统。
本章主要概括地介绍元胞自动机的自组织原理、元胞自动机的发展情况,及其在元胞自动机在工程系统中的自组织化分析与建模。
3.1 元胞自动机与自组织过程
克劳斯・迈因策尔在其《复杂性中的思维》一书中指出“:元胞自动机不仅仅是优美的计算机游戏。它们还是描述了其动力学演化的非线性偏微分方程复杂系统的离散化和量子化模型”。“当非线性系统的复杂性增加,以及由求解微分方程或甚至由计算数值近似来确定其行为变得越来越无望时,元胞自动机是非常灵活有效的建模工具。”
3.1.1 什么是自组织过程
布鲁塞尔学派的物理学家和化学家普里戈金(I.Prigogine)和联邦德国斯图加特大学的物理学家哈肯(H.Haken)于20世纪70年代提出关于自组织过程与协同现象的理论。那末,什么是自组织过程?先看几个典型例子。
动物体内需要供给能量才能进行各种活动。动物体内有一种糖的无氧代谢反应链,叫做糖酵解。这是一种含有多种中间产物并涉及到许多酶的生化反应。所有中间产物的浓度都会随时间作周期的振荡。这振荡是依靠动物体与外界交换物质能量,即不断吸收营养和排出废物以及反应链内的自催化和酶的交构机制来维持的。这是一种典型的自组织过程。
1900年发现的贝纳(Benard)效应也是一个例子。用圆形容器盛液体,在下
50复杂系统的分析与建模
方加热,当上下底温度差达到一定程度时,液体内将出现规则的对流,俯视时,能见到六角形花纹。若温度再高到一定程度,液体内的流动随时间振荡,并发育为非周期的混沌行为。这是流体动力学系统内的自组织过程。
20世纪50~60年代发现的贝洛索夫・扎鲍廷斯基(Belousov-Zhabotinski)反应也是一个典型的例证。它是在铈离子催化下丙二睃被溴氧化的反应。在不同条件下,能显示多种多样的时空结构。例如,在搅拌均匀的条件下,能表现出粉红色变淡蓝色又从淡蓝色变粉红色的时间周期结构。人们称之为化学钟。此外,该反应还能表现为波的传播,诸如相位波、梯度波、靶环波、螺旋波和旋滚波等时空有序结构。在一定条件下,也能过渡为混沌行为。还有许多其他的例子,不再一一枚举。
总之,所谓自组织过程是指非线性的多体的开系在远离平衡到一定程度时形成的时间、空间以至功能的结构或表现出“混沌”行为。这两种可能:结构与混沌,也并非互不相干,而是往往交替出现,无论是时空规则的结构还是混沌行为都是系统状态随时间演化的终极目标或吸引子,普里戈金学派用时间箭头描述演化,孤立系中系统发展到无序的熵取极大值的平衡态,称演化具有第一类时间箭头;若为开系处于远离平衡并出现自组织过程,称演化具有第二类时间箭头。
大多数自组织过程与相变有相似的特点,例如对称破缺,临界漫化、涨落放大,甚至能与平衡热力学研究的一级或二级相变相类比。故称做非平衡相变。上面谈到的自组织过程的例子实际上在自组织过程理论建立之初就已经发现了,并且分别被人研究过,但一经纳入到自组织过程非平衡相变的框架,就可以统一地运用相变的理论去研究和对比,从而得出新的有意义的成果。
在自组织过程或非平衡相变的研究中有几种基本方法,即热力学的方法,确定性描述的方法以及随机描述的方法。确定性描述是采用若干宏观变量刻划系统的状态,用这些变量的演化方程,例如非线性的常微分方程组。流体力学方程、描述化学反应及扩散的反应扩散方程,描述系统的时空演化;在所谓随机描述中,则视上述诸宏观变量为随机变量,用随机微分方程,福克—昔朗克方程或主方程给出系统的发展,研究涨落以及在外噪声环境下的非平衡相变问题。当系统的复杂性达到一定程度时,在确定性描述的框架中,由于系统的演化对初值敏感,相轨迹不再具有周期性的特征,形成“奇怪吸引子”,即所谓混沌行为。这时,不再可能对系统的长期行为做出预报。在研究混沌行为时,又有庞加莱截面的方法、功率谱的方法和分频采样法等。
以元胞自动机为基础的模型提供了完全不同的另外一种方法。在这个方法中,时间空间变量以至描述系统状态的变量都是分立的,它们所展示的自组织过程的复杂行为完全可以和微分方程或迭代映射所提供的相媲美。另一方面,由于元胞自动机所固有的特点,可用于描述更为复杂的现象。
第3章 复杂系统的元胞自动机自组织分析与建模51
3.1.2 元胞自动机的自组织
元胞自动机最早是由冯・诺依曼(VonNeumann)和乌拉姆(Ulam)于20世纪60年代提出的。当时的名字叫元胞空间(cellularspaces),用于模拟生物学中的自复制。后来被用于研究许多其他现象,随之又出现了各种各样的名称,例如元胞结构(cellularstructures)、镶嵌自动机(tessellationautomata)以及元胞自动机(cellularautomata)等等。
所谓元胞自动机,是一种时间离散、空间离散的数学模型。它的优点在于能够描写具有局域相互作用的多体系统所表现的集体行为及其时间演化。这种方法是首先将空间分割成由相同的格点或元胞组成的规则的点阵,就像围棋组成蜂窝那样。其中每一格点或元胞对应着有限组数值,以描写该格点或元胞的状态。这些数值与一定的时刻相对应。这些数值同步地随着分立的时间步骤(t=0,1,2,…)按照一定时规则演化,所谓“规则”主要反映近距离内格点间或元胞间的相互作用即局域作用。按照这种规则,某格点在某瞬时的取值决定于该格点和几个相邻格点在前一时刻的取值。
实际上,对于那些可以看作包含许多分立的单元且单元间存在近距相互作用的系统,差不多都可以用元胞自动机来描写系统的行为,在物理学中,元胞自动机最直接的应用要算是晶体点阵了。这时,元胞自动机的各元胞分布于位形空间。根据问题的需要赋予各元胞以一定的物理意义,例如格点或元胞的状态可以用数值“0”或“1”说明,以描述两种不同方向的自旋。这样就可以用元胞自动机描述关于相变的伊辛(Ising)模型了。它还可以用于研究流体力学,每个元胞对应于空间一点的速度,而元胞自动机的点阵则是速度场的近似描写。此外,天文学家还用元胞自动机模拟旋转着的银河系等。
若元胞或格点等间距地分布在一条直线上,叫做一维元胞自动机;若规则地分布在平面上,则称为二维元胞自动机,目前只对一维元胞自动机的行为有比较详尽和系统化的认识。对二维元胞自动机虽有进行系统研究的工作,但得出的结论尚不如一维情况充分。由于还没有适当的离散数学对元胞自动机的原理做出严格的理论分析,故所谓对元胞自动机的行为的认识基本上是根据计算机实验结果分析概括出来的。在一维或二维元胞自动机的基础研究方面做出贡献的人当中,应首推沃尔弗拉姆(S.Wolfram)。在这方面的两篇经典性文章,是1998年3月由他,1985年由他和帕卡德(N.H.Packard)发表的。
一维元胞自动机又有不同情况,例如一个元胞或格点可取两种或多种可能的数值:既可考虑左右各一个紧邻与中间格点间的相互作用,也可考虑更多的相邻格点对中间格点的作用。下面介绍一种最简单的情况。即每一格点只能取0和1这两个数值中的一个,且仅考虑最紧邻两个格点对中间终点的作用。这通
52复杂系统的分析与建模
常被称为初等元胞自动机,通过解剖这个麻雀,一方面使我们对元胞自动机如何工作有具体的认识。另一方面我们将看到它确能用于研究自组织过程。
在初等元胞自动机中,每一格点可能状态为0或1,又由t-1时刻每三个格点的状态决定t时刻中间一格点的状态,这包括有2=8种情况。用两个数字构成8个数字的数组共有28=256种可能性。因此初等元胞自动机有256种运算法则。然而,为了得到有意义的结果,必须对运算法则有所。首先,若初始时刻各格点的状态都是零,则以后各格点的状态智能是零。否则,就是“无中生有”,没有播种,就能开花结果。这当然是不合法的。这叫做元胞自动机的“静息条件”。第二,运算法则必须是反射对称的,即100和001应得出相同的结果:110和011也是这样。这条保证了元胞自动机演化的各向同性和均匀性。此外,格点在直线上的分布总是有限的。因此还需要一定的边界条件。可以在t-1时刻点阵左右边界以外分别置零。按事先确定的运算法则找出t时刻的边值,也可以使两端衔接,形成周期边界条件,等等。
按照上述沃尔弗拉姆的运算法则可以作许多计算机实验。开始时,对初等元胞自动机一维点阵上的每个格点或元胞完全随机地赋值,即每个格点分别地以概率1/2获得0或1值。以此作为演化的初始条件,并从上面所说32种合法运算法则中任意选定运算方法。通过对大量计算机实验结果进行分析,人们发现,虽然初始条件不同,运算方法多种多样,得出的结果也千差万别,但这些结果总是可以归纳成下面四大类:
(1)元胞自动机的演化达到均匀的,不随时间变化的定态。显然,有两种均匀定态:要末所有格点被零值占据,要末所有格点都取1值。
(2)形成一组取值不同但不随时间改变的稳定的结构或是周期结构。(3)元胞自动机的发展导致“混沌”行为的出现。(4)发展成为复杂的局域结构。
上面四种发展前景属于初等元胞自动机在无规则初始条件下演化的“吸引子”。前面三种大致可与连续动力系统的普通吸引子“极限点”“,极限环”以及“混沌”奇怪吸引子相类比。四种结局虽然不同,但都属于有序结构。每一类结构的形式和特点要由它们各自对应的吸引子的性质来决定。
从无序的初始状态发展成有序结构,表明演化过程具有第二类时间箭头。这意味着元胞自动机的演化完全可以用于描述自组织过程。
物理学是一门定量的科学。我们不能满足于上述的定性分类,还需要定量描述上述结构的统计性质,以便对这些结构做出定量的区分。常用到的两类量,一类是“熵”,另一类是“维数”。在“熵”的方面,所引用的是信息论中的两种熵。一个是“集合熵”。从统计随机的初始状态出发,若后面的运算序列是随机的,则各种可能的运算序列只有相同的概率,但元胞自动机的演化表明,它是不可逆
3
第3章 复杂系统的元胞自动机自组织分析与建模53
的,从完全随机的无序态变成有序态,这意味着运算序列间具有不同的概率。“集合熵”就是为说明这方面问题引入的。另一个是“测度熵”,它描述考虑到格点间的相关时每计算一格点的平均信息量。此外,还有两种维数,即“集合维数”和“测度维数”,它们分别与“集合熵”与“测度熵”有着密切的关系。除去一些特殊情况,集合维数和豪斯道夫维数为一致的。集合维数用于刻画作为吸引子的结构的特征,测度维数则描述结构的概率测度,它等于在格点取值系列中每个符号包含的平均信息。
每个格点可取两个以上可能数值之一的元胞自动机也被研究过。计算法则要多得多。计算机实验表明,从无序的初始状态出发,经过长时间的演化,也能发展为上面几类结构,即从无序发展为有序。
如果格点或元胞是规则地分布在平面上,这就变成一个二维元胞自动机的点阵;最为常见的当属方形点阵。另外,可以有不同的邻居结构,例如五邻居结构或九邻居结构等。可能的运算法则也要比一维元胞自动机多得多。在一维情况就曾考虑对称性对运算法则的。对于二维系统。对称性的类型就更多了,例如除反射对称外,还有旋转对称等等。根据所考虑的对称性的不同,将产生不同的运算法则。二维元胞自动机也开始被系统地研究,但不如一维情况充分,尚有许多工作可做。研究表明,从整体性质看,二维元胞自动机和一维元胞自动机是很相似的。如前所述,一维元胞自动机的演化结局可概括为四类结构。在二维元胞自动机演化前景中也能找到与它们相对应的结构。但是,许多演化涉及元胞形状和极为复杂的边界条件,这就难于与一维情况作类比了。
3.1.3 模拟自组织过程
冯・诺依曼的细胞自动机概念,把活的有机体设想为细胞的自繁殖网络从而首次提出了为其建立数学模型的线索。这种思想由约翰・康韦发展了他的元胞自动机,可以模拟活系统群体的生长、变化和死亡。下面举几个将元胞自动机应用于自组织过程的例子。
首先是用二维元胞自动机研究贝洛索夫-扎鲍廷斯基反应。在这方面,温弗里(A.T.Winfree)、马多(S.F.Madare)和弗里德曼(W.L.Freedman)在1983~1986年期间都做了许多工作。在这反应物的混合溶液内加上一定的刺激或扰动。能引起不同形式的波动。例如用加热的探针触及一点,能引起圆形波前,又若内部某点有杂物,会引起围绕该点的靶环波。若令表面发生切变,就能形成旋转方向相反的螺旋波。两臂、三臂甚至四臂的螺旋波也能产生出来。究竟产生什么,就要看初始条件如何。产生这些波动的运算法则是首先把二维空间分成许多相等的六角形元胞。初始条件是让一个或几个元胞处于激活状态而令其他元胞处于静息状态。下一步就让已被激活的元胞去刺激紧邻的元胞,
54复杂系统的分析与建模
使它们也激活起来;在运算中,要控制激活相邻元胞的概率,并使元胞在受到刺激后还要静息一段时间才进入激活状态。在此条件下,又考虑初始条件的不同,就能产生不同的波结构。
金属离子在电解池内电极上的沉积形成树枝状的结构以及雪花的形成等这类属于集团生长的过程也可以用元胞自动机去模拟,当模拟的雪花形成时,也采用六角形元胞。元胞能处于两种状态,0代表水蒸气,1代表冰。以在点阵中心的元胞内放入一个籽冰晶而其他元胞均处于气相作为初始条件。每个元胞共有6个紧邻,计算方法是:若紧邻赋值总和为奇数,则中心元胞取1;为偶,则取0。总的说来,奇数的状况有1,3,6;偶数状况有0,2,4,6。平均说来,紧邻赋值总和为偶(除零外)的状况与为奇的状况相比,冰晶粒多,不利于中间的蒸气微团释放潜热,故不易凝结。至于周围皆零的情况,因无藉以凝聚的核,也不会凝结。至于周围之和取奇数的情况,冰晶较少,易于释放潜热故便于凝结,按此运算法则,可模拟雪花的生长。
元胞自动机还可用于模拟生命现象,例如在免疫监视下的恶性肿瘤生长。在动物体内,由于外部的物理或化学的或其他方面的刺激,或由于内部的原因,体内的某些正常元胞转变为恶性肿瘤元胞。肿瘤元胞带有它的抗原性。另一方面,动物体内存在免疫系统。免疫网络非常复杂,它包括体液免疫和元胞免疫。对恶性肿瘤的免疫监视主要涉及元胞介导免疫。免疫系统能够识别、记忆和消灭恶性肿瘤元胞。免疫T淋巴元胞达到癌元胞周围,能激活杀伤元胞或巨噬元胞。这些能杀伤癌元胞者又统称作效应元胞。它能与一个或多个癌元胞结合形成复合体,然后释放死元胞,并重新去结合其他肿瘤元胞在二维元胞自动机中,可取九邻居的方形点阵。比前面的情况复杂些,每个元胞可容纳四种组分,即正常元胞、肿瘤元胞、效应元胞与肿瘤元胞的结合体以及失去增殖能力的死亡元胞,每种元胞各有若干。开始时,可在点阵中心置几个癌元胞作为“种子”,以此作为初始条件。在各代的运算中,可考虑如下几个方面组成的运算法则:
(1)肿瘤元胞与正常元胞的增殖;元胞一分为二后,其中一个位于原处,另一元胞可随机地落于九邻居中的某个格点。
(2)效应元胞以一定的概率出现于各格点中。并按给定的概率与存在于该处的癌元胞相结合。
(3)需要考虑某些反馈机制,若效应元胞杀伤或结合癌元胞,则免疫能力将加强;同时,还会降低癌元胞的增殖率,等等。
(4)正常元胞与癌元胞的正常死亡,死亡元胞的降解。如果利用计算机计算各个分立时刻各种元胞的数目,即可用数字或曲线描述恶性肿瘤的生长。若用不同颜色的斑点表示不同类别的元胞,就可以在计算机屏幕上直观地显示出癌的长大等情况。元胞自动机模拟的结果是:根据所选参数的不同,肿瘤可以长
第3章 复杂系统的元胞自动机自组织分析与建模55
大或消失,也可能在长到一定大小后,大体保持不变。并且,待发展到一定程度后,肿瘤内将充斥大量死亡元胞,这是由于内部营养不足,免疫系统的杀伤以及循环系统受阻,死亡元胞难于移出或降解所致。这充斥死亡元胞的情况和解剖观察的结果是一致的。
近来,神经网络系统得到迅速的发展,这是一种非线性的动力系统,其理论基础是统计物理学。它的工作具有某些神经系统的特征,例如有学习能力、有自适应性和容错性等等。关于这类系统的研究是和数学、物理学、流体力学、生物学以及计算机的研究结合起来的,基于神经网络的计算机将是完全属于新一代的计算机。至于对自组织过程,特别是生命系统或社会系统,它本身就具有学习和对环境能自适应的特点。因此,在原来元胞自动机内引入神经网络的特点是很自然的,它的演化是可以根据学习法则自动进行修正的。这样,原来意义上的元胞自动机就成为具有固定的紧邻元胞相互作用的特殊的神经网络系统。例如,法默(J.D.Farmer)等人就曾利用神经网络系统中的一类,即分类系统(有些类似于“专家系统”)去研究免疫学中的特发位问题(特发位是指抗体分子可变区上能被其他抗体识别的特殊部位)。此外,考夫蔓(S.A.Kauftman)和史密斯(R.O.Smith)还就达尔文进化论的背景研究了自适应元胞自动机问题。应当指出的是,在元胞自动机内引入神经网络特征固然是重要的发展动向,但原来意义上的元胞自动机的探索仍然是有意义的。
3.2 复杂系统的元胞自动机建模技术
元胞自动机模型能十分方便地复制出复杂的现象或动态演化过程中的吸引子、自组织和混沌现象。一般来说,复杂系统由许多基本单元组成,当这些子系统或基元相互作用时,主要是邻近基元之间的相互作用,一个基元的状态演化受周围少数几个基元状态的影响。在相应的空间尺度上,基元间的相互作用往往是比较简单的确定性过程。用元胞自动机来模拟一个复杂系统时,时间被分成一系列离散的瞬间,空间被分成一种规则的格子,每个格子在简单情况下可取0或1状态,复杂一些的情况可以取多值。在每一个时间间隔,网格中的格点按照一定的规则同步地更新它的状态,这个规则由所模拟的实际系统的真实物理机制来确定。格点状态的更新由其自身和四周邻近格点在前一时刻的状态共同决定。不同的格子形状、不同的状态集和不同的操作规则将构成不同的元胞自动机。在一维模型中,是把直线分成相等的许多等分,分别代表元胞或基元;二维模型是把平面分成许多正方形或六边形网格;三维是把空间划分出许多立体网格。
以元胞自动机为基础的模型提供了完全不同的另外一种方法。在这个方法
56复杂系统的分析与建模
中,时间空间变量以至描述系统状态的变量都是分立的,它们所展示的自组织过程的复杂行为完全可以和微分方程或迭代映射所提供的相媲美。另一方面,由于元胞自动机所固有的特点,可用于描述更为复杂的现象。
3.2.1 “生命的游戏”
1943年,数学家匹特(WalterPitts)和神经心理学家马卡洛序(McCulloch)设想了一个由常规的神经元组成的系统,每个神经元相当于一个逻辑元胞,可以选择不同的逻辑值,而这些逻辑元胞可以在下一个时间一起将它们的逻辑值传递到别的逻辑元胞,那么,它们综合作用的结果就将是下一个时间系统的结果,这种可以自动演化的机器就是所谓的图灵机(Turing)或有限状态机。元胞自动机最早是由冯・诺依曼(VonNeumann)和乌拉姆(Ulam)于20世纪60年代提出的。冯・诺依曼提出构造一个不确定的生命模型系统的设想,这个系统可以智能地自我演化。后来,冯・诺依曼将这个模型发展为一个网格状的自动机网络,每个网格为一个元胞自动机,元胞状态有生和死,相当于人体组织的存活和消亡。但是,早期的元胞自动机思想,许多问题处于未知状态。当时的名字叫元胞空间(cellularspaces),用于模拟生物学中的自复制。后来被用于研究许多其他现象,随之又出现了各种各样的名称,例如元胞结构(cellularstructures)、镶嵌自动机(tessellationautomata)以及元胞自动机(cellularautomata)等等。
1970年,剑桥大学数学家Conway发明了一种叫做“生命的游戏”的游戏(见图3-2-1),这个游戏完全体现了动态元胞自动机的特征。游戏是在一张类似棋盘的平面网格上进行的,这些网格上可以放上棋子或不放,由游戏规则决定。而棋子的意思代表有一个生命存活,而没有棋子的地方代表无生命存活。开始时,在网格上随机地摆上一些棋子,然后,按照一定的规则来确定每个有棋子位置上棋子的存在;以及没有棋子位置上是否加入新的棋子。规则是:每个棋子有可能有八个邻居,而有四个是直接相邻的,如果目前的棋子有两个或三个邻居,那么它将在下一次被考虑前保留,如果它有四个或四个以上邻居时,它将被认为是因为人口过多将会死亡而被取走;如果只有一个或没有邻居,那么将会因为过于寂寞而死,所以也将被取走。同时,如果当前位置上没有棋子,而此位置周围正好有三个邻居时,那么这个位置将被放上一个新的棋子。整个游戏就按这个规则一代又一代地进行下去。下面是游戏的几个状态。
图3-2-1(a)是在游戏过程中任取的三个连续状态。特别需要说明的是,处于边界的元胞,在判断时认为网格的外围存在一圈网格,但网格默认为是空白的(至于边界的处理方法将在后续节中讨论)。
从这个游戏中我们可以发现元胞自动机系统中存在两个操作对象:元胞的状态和系统演化规则。其中元胞状态一般可以取二值变量如0和1,其实在复
第3章 复杂系统的元胞自动机自组织分析与建模57
图3-2-1 元胞自动机的棋盘游戏模型
(a)元胞自动机的棋盘游戏状态迁移例 (b)状态迁移规则例
杂的元胞自动机系统中,元胞状态还可以取一段连续的数据如取1~10之间(包括1和10)的任意值。其次,系统演化规则是一个映射关系的有限集,而这些映射关系都是一些十分简单的演化状态迁移规则如下:如果一个元胞处于活着的状态,则在八个相邻元胞中有两个或三个活着时,在下一时刻继续活着,否则就死亡。另一方面,如果一个元胞处于死亡状态,但在邻域中有三个元胞处于活着的状态,则下一时刻这个元胞的状态变成活着,否则仍保持死亡状态。
这个规则模拟生命在过分拥挤或孤单时不能生存和生命在一定条件下可以诞生的情况。可以用计算机来模拟这些规则,有趣的是,用这些简单规则定义的元胞自动机能够模拟生命活动中的生存、灭绝、竞争等复杂现象。在这个游戏中,实际上体现了一个二维的元胞自动机的运作过程。其状态迁移规则如图3-2-1(b)所示。
3.2.2 元胞自动机的基础
元胞自动机是一种模型,可以让大量的简单元胞在某些简单的本地规则作用下产生各种复杂的系统状态。通常,元胞自动机是一套格子的n维组合(n为自然数),每个格子驻留了一个有限状态自动机,每个自动机以其相邻的,具有有限状态的元胞格的状态作为输入。然后输出一个处于同一有限状态集合的状
58复杂系统的分析与建模
态,它可以作如下表示:
s1,s2,…,sn∑
s1,s2,…,sn
(3-2-1)
式中:∑表示有限状态s1,s2,…,sn组成的子集;动机的相邻元胞取舍情况一般如图3-2-2所示。
为映射操作;n为有限状态的
个数。即元胞自动机的状态是与其相邻的自动机状态交互作用的结果。元胞自
图3-2-2 元胞和邻居元胞
以上模型均将元胞作为邻居,实际上,也可以不包括元胞。元胞自动机模型是建立在一个简单状态集和一套本地交互规则基础上的,是可以自我发展,自我完善的,可以不断扩展并可以按一定规则描述复杂系统状态和预测系统未来的自动机器。将上面“生命的游戏”的例子的元胞自动机系统数学模型化后,我们就可以用这样一个公式来表示元胞自动机模型的系统状态和规则应用情况。任意时刻某元胞的取值a由下式确定:
t-1)(t-1)(t-1)(t-1)(t-1)ati,j=fa(i,tj-1),a(it--11,)j-1,a(i-t-11,)j,a(i,tj--11),a(i+1,j+1,ai+1,j,ai,j+1,ai-1,j,ai-1,j+1
(3-2-2)
事实上,这个模型是一个二维元胞自动机模型,在元胞自动机思想的应用中还可以建立一维、三维和元胞自动机模型。它们都是按照这样一个简单的方法建立起来的可以模拟和仿真大型复杂的静态、动态和混合形式的系统。从算术的关系角度来看元胞自动机模型实际上是从有限状态机(FiniteStateMa-chine)演绎而来的,但是元胞自动机模型在更高层次上处理一维、二维或复杂系统的状态演化。它主要处理元胞阵列上元胞状态的读、写和更新的过程。
1.一维简单元胞自动机
设在一维直线上均匀地分布着N个元胞,任一时刻每个元胞可取k个整数值中的一个,某个元胞i在下一时刻的取值由现在时刻在半径为r(r为整数)内的邻居的值共同确定。用公式表示为
a(it+1)=
(t)
a(i-t)r,a(i-t)r+1,…,a(it),…,a(i+t)r-1,a(i+t)r
(t+1)
(3-2-3)
式中:ai表示元胞i在t时刻取值;ai是该元胞在t+1时刻的取值;为某种函数关系。在最简单的情况下,k=2,ai可取0,1两个值,r=1,式(3-2-3)简化为
ai
(t+1)
=ai-1,ai,ai+1
(t)(t)(t)
(3-2-4)
第3章 复杂系统的元胞自动机自组织分析与建模59
式(3-2-4)即为一维二值三邻居简单元胞自动机的演化公式。
由此我们看到,一维简单元胞自动机具有两个最显著的特点:(1)元胞之间的相互作用是最邻近的局域作用。(2)元胞只取0,1两个值,任何时刻只能取其中的一个。
对于一维二值三邻居元胞自动机来说,式(3-2-4)共有256组,每组给出元胞八三邻居八种可能组态:111,110,101,100,011,010,001,000在下一时刻所决定的元胞i的取值,S.Wolfram用规则号来说明不同的演化规则,如对于90规则(90的二进制表示为01011010),其八种组态的取值方法如下:
1110
1101
1010
1001
0111
0100
0011
0000
一维空间中(有限或无限),所有的元胞都按给定的规则同步更新,给定直线上所有元胞一个初始的取值分布,在某种规则演化下,元胞取值将按一定规律进行变化,图3-2-3给出N=63,初始分布只有i=32的元胞取1,其他取0值,图3-2-3(a)经90规则演化31步,图3-2-3(b)经150规则演化31步后,将所有的分布图按时间先后从上到下排列所得到的演化图。图3-2-4的初始分布中,每个元胞取值0或1是随机的,其中取值1用黑点表示,取值0用空白表示。
图3-2-3 “1”值初始位形的元胞自动机演化
(a)90(010110101) (b)150(10010110)
图3-2-4 随机初始位形的元胞自动机演化
(a)90(010110101) (b)150(10010110)
除一维元胞自动机外,还可以研究分布在半无限直线上的元胞自动机。这时将它的一个端点记为i=0,而用所有非负整数表示元胞位置,在局部映射f中,自变量只出现ai,ai+1,…,ai+r,我们称这样的元胞自动机为单向(one-way)元胞自动机。
如果局部映射的形式为:
60复杂系统的分析与建模
ati+1=fati-r+…+ati+…+ati+r
即在邻域中每个元胞的状态都起同样的作用,则称为完全(Totalistic)元胞自动机。在用元胞自动机模拟某些物理现象时,往往会对局部映射提出某些附加,常用的有:
(1)如将符号0看做静止状态,则要求
f(0,0,…,0)=0
(2)除了f与i无关这个反映空间齐性的条件之外,还要求f是对称的,即
fai-r,…,ai+r=fai+r,…,ai,…,ai-r
它是空间各向同性的反映。
称满足这两个条件的元胞自动机为合法(Legal)元胞自动机。2.元胞自动机演化位形与形式语言描述1)元胞自动机演化位形的复杂性
图3-2-5的(a)、(b)、(c)是一维二值三邻居元胞自动机128、36、90规则在某个范围内的随机初始位形上经13步演化得到的演化图,图3-2-5(d)是由一维二值五邻居52规则演化得到。可见,一维元胞自动机演化产生的位形图可分成四类:图3-2-5(a)随时间演化消失;图3-2-5(b)到达一个固定的有限尺寸;图3-2-5(c)以一定的速率不断生长;图3-2-5(d)无规则地收缩和生长。前三类分别对应于连续动力学系统的极限点,极限环和混沌吸引子;第四类表现复杂,人们猜想能进行通用计算。
图3-2-5 元胞自动机演化时空结构的四种类型
(a)128(10000000) (b)36(00100100) (c)90(01011010) (d)52(00110100)
2)元胞自动机位形集合与形式语言
一维N元胞自动机在时刻t,位置i取值a(it)为S={0,1,…,k}中的一个,这些值组成的所有可能的序列构成元胞自动机位形的有限集合∑S,局域规则完成2r+1个S中的值到一个S中值的映射,并从整体上导致元胞自动机集之内的一个映射:
N
第3章 复杂系统的元胞自动机自组织分析与建模61
Φ:∑→∑
一般地有:
Ω
其中:
Ω
(t)
(t+1)
(3-2-5)
Ω
(t)
=ΦΩ
(t)
(3-2-6)
=Φ
(t)
∑
在此,元胞自动机演化位形集合可看作一种形式语言。S是字母集,一个元胞自动机位形等同于语言中的一个单字,演化规则中即为产生规则。
3)90规则与150规则的形式语言
考虑一维简单元胞自动机90规则,从初始位形集Ω(0)=得到Ω(1)。90的二进制展开为01011010,演化规则如下:
111→0,110→1,101→0,100→1,011→1,010→0,001→1,000→0
(3-2-7)
对于某个初始位形A
(0)
∑
经一步演化
∈Ω,进一步演化所得位形A
(0)(1)
=ΦA∈Ω,位
(0)(1)
)(0)
形A(1)中某点i的值a(i1)由位形A(0)中的三点a(i0-1,ai,a(i0+)1确定。这种确定
关系及A(1)中各点的取值可由图3-2-6表示。
图3-2-6 元胞自动机90规则的Bruijn图
图3-2-6中各节点代表A
(0)
(0)
(0)
(0)
中的ai,ai+1,用弧线连接起来的两节点代
(0)(0)
表三邻居ai-1,ai,ai+1。弧线上的表达式即为式(3-2-7),每条弧线与一个符号值相连,图中每条可能的路径都对应一个特殊的初始位形A(0),A(1)则由A(0)相应的路径各弧线上的符号序列组成;图中所有的路径构成了Ω
(1)
(0)
-Ω。图
(1)
3-2-6即是产生形式语言Ω的有限自动机的状态转移图。图中节点代表有限自动机的状态。每条弧代表有限自动机所接受的语言中的产生规则。若以u0,u1,u2,u3分别对应节点00,01,10,11,则该语言产生式为
u0→0u1,u2→0u1,
u0→1u1,u2→1u0,
u1→0u2,u3→0u3,
u1→1u3u3→1u2
(3-2-8)
由此我们得出结论:90规则对应的语言是正则语言。
对所有的第1,2类一维元胞自动机,所对应的形式语言都是正则语言,但大部分第3、4类一维元胞自动机,对应的正则语言的复杂性(用状态图中的节点数
62复杂系统的分析与建模
表示)随时间迅速地增加,可能导致非正则语言极限集。对某些第4类元胞自动机来说,要确定某特殊的位形是否产生过则是NP———完全性问题,90规则是第3类元胞自动机,但其形式语言的复杂性却具有最简单的值,可以作比较精确的讨论。
是等价的,其最小状态图如图3-2-7所示。
由图3-2-7可知,90规则产生位形的正则表达式为
Ω
式为
Ω(t)=
全相同的形式。
0*1*
*
(1)
图3-2-7 最小状态图
图3-2-6中每个节点都有两条入线0和1,两条出线0和1,因此四个节点
=0
*
1
**
(3-2-9)
图3-2-7和式(3-2-8)表明,对于任意时刻t,90规则产生位形的正则表达
(3-2-10)
150规则对应的状态转移图如图3-2-8所示,其形式语言与90规则具有完
图3-2-8 元胞自动机150规则的Bruijn图
3.90规则元胞自动机与Turing机
Turing机被证明能描述任何算法。下面我们来构造90规则元胞自动机的Turing机。设一维元胞自动机在有限元胞上演化。元胞个数为N,边界条件为恒“J”值(也可讨论其他边界条件)。设三元组基本Turing机为A=0,1,αL,αR,Q=
q0,q1,…,q7,qF,V=
L,r,h,其中A表示字母集,四个字
母中αL作为“1”值左边界条件,αR作为“1”值右边界条件,Q为状态集合,九个内部状态中,q0是起始状态,qF是终止状态。V为动作集,L表示读写头左移一格,r表示右移一格,h表示读写头不动。Turing机带上格子个数可取N+2,各格子的计算顺序从左到右,当把N个格子处理完毕后读写头重新回到左端的起始处,这一过程可写作:
↓q0
*
↓qFαLS′αR
αLSαR
(3-2-11)
第3章 复杂系统的元胞自动机自组织分析与建模
*
63
式中:S,S′分别代表原位形与新位形;指令形式取为:
代表所有的计算过程。处理完N个格
子所需要的步数为4N+3,若要继续进行下一次计算只需将qF置为q0。Turing
qi aj a′ v q′
其中a′∈A,q′∈Q,v∈V。
模拟恒“1”值左,右边界的90规则元胞自动机演化的Turing机,可取以下19条指令:q0αLαLrq1q1q1 101rq40rq2
q211Lq4q200Lq3q301rq5q311rq1q400rq5q410rq1
q5q5 10
10
rq6rq6
q5q5 0101
Lq4Lq7
q7q7 101Lq70Lq7(3-2-12)
q5αRαRLq7q5αRαRLqFq7αLαLhqF
q1αRαRrq7
上面的T程序对任何初始位形计算一次的结果等同于90规则对该初始位形演化一步。这种计算可用图3-2-9表示。
图3-2-9 模拟元胞自动机90的Turing机状态转移图
对于通用图灵机UT(UniversalTuring),不但可以输入某些待计算的初始位形S,也可以输入某个具体的T程序,若把S对应数x,T程序对应Godle数t(如90规则的编号数90),则UT的输入是数组 以上我们看到通用Turing机事实上能模拟出所有的元胞自动机演化,反过来某个元胞自动机也可模拟某个特定的Turing机,以并行的方式在一个时间步中完成Turing机在若干时步所做的运算,因而降低了运算的时间复杂性,但并不是每个元胞自动机都可模拟通用Turing机,在一维二状态三邻居基本元胞自动机里没有哪个规则能与1UT对应。ARSmithI曾构造了一个18状态三邻居一维元胞自动机,可等价于已知的最简单通用Turing机(即Minskey的七状态四符号机)。二维元胞自动机的“生命”(二状态九邻居)游戏亦被证明是计算通用的。人们推测第4类元胞自动机都能进行通用计算。绐定合适的编码,这 复杂系统的分析与建模 些元胞自动机原则上可模拟任何其他系统,从而展示任意复杂的行为。 3.2.3 元胞自动机的自组织建模方法 元胞自动机是不可判定的,换言之,不能用有限的程序步骤对元胞自动机演化图形的终态给出一般性的答案。但是元胞自动机具有强大的计算功能,它的并行运算方式为自组织建模展示了美好的前景。 1.对象的元胞自动机抽象化模型分析 元胞自动机方法是一种用来分析一个静态或动态系统的方法,它主要通过对一个系统的抽象化,模型化来定义一个系统的状态。而在此过程中,它不像一般的数学物理方法那样死板地描述或仿真一个系统。用数学物理方法分析一个较为复杂的系统时,可能是十分困难的,甚至是不可能的。而元胞自动机方法采用了一些新的思想来简化分析过程,同时可以达到较好的仿真效果,同时可能成为稳定和可靠的方法。用元胞自动机方法分析一个系统包括以下几个方面内容: 1)确定要研究的对象系统的性质 (1)此系统是否是一个自组织系统(self-organization)。对于一个系统,是否自组织系统是决定在分析系统过程中如何划分模块和简化数学模型的重要参照依据之一,因此在用元胞自动机方法分析系统时,若此系统是自组织系统,即在系统内部只有本地交互因素,而无外界相关因素(不变的,固定的连接因素)。那么,此系统将表现出一种相对稳定性(robust)。这样将有利于整个系统的综合分析,而实际上,系统因存在混沌吸引子(attractors)而呈现一种混沌状态。 (2)此系统是一个静态系统还是一个动态系统。确定系统是动态还是静态是涉及到系统模型的重要因素。因为静态系统和动态系统的建模是完全不同的,静态系统的内部结构是稳定的,而动态系统是不稳定的,但可能其系统特性是收敛的。 (3)此系统是一维,二维系统还是三维或系统。系统的状态与系统的维数关系密切,同时维数不同元胞自动机方法的应用也不同,而且还可能包括线性维和非线性维。 2)确定系统规则 系统规则的确定是整个系统元胞自动机分析的核心。元胞自动机在处理系统时,总是将系统细分为可以建模的元胞,这些元胞间关系的分析是较为简单的。一个元胞自动机模型,在外界条件的变化确定后,然后通过规则确定整个系统的各个元胞状态、以至整个系统各个元胞的状态。因此规则的确定及完善,关系到将来系统状态的演化结果。 3)系统结构的规划 第3章 复杂系统的元胞自动机自组织分析与建模65 系统在确定了状态迁移之后,就可以确定系统的逻辑结构,将这些结构进行综合和优化之后,就可以将模块化的结构投入使用。 2.对象的元胞自动机模型 A.I.Adamashii在《IdentificationfuzzyCellularAutomata》书中认为“:元胞自动机模型是可以被的具有可选整型变量值的格子,其中每个元胞可以选取一个特定的集合中的某个状态,并且这些状态均可以根据一个本地的转换功能函数做出改变,而此功能函数是由附近的其他元胞的状态作为输入的因素。”这个定义也就是说一个元胞自动机模型是由一系列的元胞所组成的格子状系统,其中,每一个元胞的值均属于某一个集合,而且,每一个元胞的值由其附近的元胞(也可以包括本身)的前一个状态决定目前状态,依次类推,整个系统就按照此功能函数作线性或非线性状态变化。 例如,在日常生活中,有些棋类就是给出一种初始状态和一系列规则,然后,由不同的对弈者选择不同的规则根据当前棋局状态做出下一个棋局状态的预测,再作决定。当然对弈的结果只有两种可能:一方胜出或和局。在上面的例子中,我们提到两个内容: 1)分析初始状态 在以上的例子中,我们给出的初始状态只是不同的棋子布局,这种布局将是影响以后布局的源头。假使我们在开始时给出另一种布局状态,那么,整个结局将是完全不同的。这说明,初始状态是影响一个系统状态的因素,但是我们又发现即使初始状态不变,每一棋子按这些规则运行下去后,整个棋局仍是极其微妙的。 2)分析规则 规则是我们事先给出的用来约束系统状态的条件集合。在分析一个较为复杂的系统时,我们一般先选取一个有代表性的较小的,不是太复杂的系统来分析,通过实验等方法来确定一系列有用的关系网(规则)。一般我们可以认为这种分析是正确的。然后将这种规则应用于那些较复杂的系统,这样分析复杂系统时就较为容易。沃尔夫勒姆(S.Wolfram)在大量的计算机实验的基础上,提出了将所有元胞自动机的动力学行为归纳为四类: (1)趋于一个空间平稳的构形,即指每一个元胞处于相同状态。(2)趋于一系列简单的稳定结构或周期结构。(3)表现出混沌的非周期行为。 (4)出现复杂的局部结构,或者说是局部性的混沌,其中有些会不规则地传播。 这种分类不是严格的数学定义。前三类行为相当于低维动力系统中常见的不动点,周期与混沌,第四类行为可以与生命系统等复杂系统中的自组织现象相 66复杂系统的分析与建模 比拟。而我们认为第四类行为其实是高维系统中的低维混沌,仍可以归入混沌类行为,它是复杂构形的典型体现。按照沃尔夫勒姆的观点,众多(也许所有)的元胞自动机的动力学行为可归纳成数量如此之少的几类,这已是非常有意义的发现。它反映出这种分类可能具有某种普适性,很可能有许多物理系统或生命系统可以按这样的分类方法来研究,尽管在细节上可以不同,但每一类中的行为在定性上是相同的。 3.对象的元胞自动机模型构造 系统分析是对一个系统进行仿真分析的第一环节,只有处理好系统分析才能有一个较好的建模。在进行系统综合分析时,首先按系统的状态受影响的复杂程度将系统分为简单系统和复杂系统。简单系统主要指系统内部较为稳定,同时所有输入只有内部本地交互响应,而无外部输入响应的系统。复杂系统一般指包括外部复合条件的响应系统,而这类系统又可以划分为多个简单系统,而这些简单系统又可以按另一种元胞自动机规划的系统,这里仅论述一下简单系统。 1)对系统进行格状分割 这个过程的关键是将整个系统看作无数个小元胞构成,而且每个小元胞应具有可选状态。当我们取定初始状态进行分析时,一定要注意每个小元胞与别的元胞发生的相互作用。即应选定本地元胞与相互作用相邻元胞数。同时此元胞数一定要远远小于整个元胞自动机系统的元胞总数。 2)初始状态的确定 初始状态指已经确定的、经过划分的各元胞的演化初始值。其状态可以是布尔值或者一段连续变量值,关键是应注意其初始状态要具有代表性和一般性、全面性。当然,对于已经简化了的元胞,对其进行全面分析并不十分困难,所以应尽量考虑到初始状态本身以及其受影响后响应的种种状态变化,否则还需要对系统进行细分,或对其状态进行分段整合。 3)规则构造 在经过以上两个步骤以后,就可以确定整个系统的规则。在确定元胞自动机规则时,要考虑以下内容: (1)系统元胞维数。维数是确定规则的基本要素。只有确定系统细分后的维数,才能考虑从什么样的基本规则入手,才能考虑某一个元胞是受线性影响,还是受非线性或复合影响。 (2)元胞响应半径。一般在用元胞自动机分析时都要确定元胞响应半径,也就是元胞对哪些相邻元胞状态的刺激进行响应,它们的范围怎样,例如一维系统半径就是影响其元胞状态的前几个和后几个元胞所在的范围,而二维可以确定圆形或方形半径范围。 第3章 复杂系统的元胞自动机自组织分析与建模67 (3)响应及属性。在一个本地响应范围内,有可能本地元胞是多重状态响应以及多重属性叠加下作出的响应,这时需要将每一种响应和属性关系进行综合。注意在进行分析时必须要全面而准确。 (4)规则的时间和空间处理。元胞自动机处理系统并做出系统状态演化时,需要考虑到时间和空间段的处理。因元胞响应与时空相关,所以最终系统演化的状态也是与时间和空间相关的。 (5)规则的构造源。规则如何得出是整个规则构造的核心。规则确定的正确与否,直接关系到系统状态演化结果。规则确定是一个总结和完善的过程,有很多手段可以用来确定规则,如进化、神经网络学习和组织、实验观察法等。 3.2.4 元胞自动机的应用领域 早先冯・诺依曼(J.vonNeumann)将元胞自动机系统看作是一个由许多元胞格所组成的可以自我演化和配置的整体,其中每个元胞格拥有五个相邻的元胞,并且每个元胞的状态可以取两种。这是元胞自动机系统最早应用的雏形。随后元胞自动机思想的理论和应用逐渐扩展到许多领域,例如:图案识别,生物建模,以及各种物理系统,计算机并行处理等。 近年,通过对元胞自动机系统的体系研究,已经较为清晰地将元胞自动机系统划分为几种类型。例如,最早由沃尔夫勒母(Wolfram)在他的经典论文里提出:应用本地元胞相邻的一维元胞自动机系统的静态机制;接着马替赖塔尔(Martinetal)应用代数多项式将一维元胞自动机系统的特点进行了表达;后来由达塞塔(Dasetal)提出了基于代数矩阵的工具的元胞自动机系统,使其行为特性更为通用。最近20年来,基于元胞自动机思想的各种应用得到了发展,其可归类如下: (1)物理系统的仿真。如对一些生长过程的模型化进行仿真、裂变反应系统的仿真、流体力学的仿真和类孤立系统的行为仿真等。 (2)生物的模型化。包括可自我复制模型、生物体系及其处理、脱氧核糖核酸(DNA)序列等。 (3)图像处理。(4)语音识别。 (5)分类计算及素数生成的计算。(6)仿真机。 (7)计算机体系结构。 (8)自测安装(BIST,Build-In-Self-Test)结构用于伪随机性,伪彻底性,确定性图案生成和信号处理。 (9)简单可测试性有限状态机(FSM)的综合。 68复杂系统的分析与建模 (10)编码校错。(11)伪相连存储器。 (12)通用及完善的哈希函数生成。(13)波段失效诊断。(14)P模式乘法器。 (15)块状和流线型密码系统。(16)断裂学和混沌学。 元胞自动机思想是一种崭新的思想,它不同于传统的处理系统的思想或方法。它从根本上开辟了一条解决各种各样不同系统,不同事物空间的状态,性质的确定,优化和预测问题。同时,它的应用将所有传统上不能处理或处理起来十分困难的问题通过一种新的方法进行稳定而又可靠的化简,从而使这些问题得以妥善的解决。 元胞自动机的应用使得很多应用传统的算法解决起来相当困难或根本无法解决的问题(如生命科学仿真难题,超大规模集成电路的测试与综合问题,大型并行计算机的运算问题以及复杂动力学系统的预测和仿真问题等等)有了一个崭新的突破口。在这些问题上应用元胞自动机思想不但可以减小系统分析的复杂程度,而且提高了解决问题的效率。元胞自动机同时具有极好的泛用性和稳定性。元胞自动机是一种新的计算机算法,它主要采纳了最新的系统分析思想即系统元胞化思想作为应用基础,同时,它又将系统演化的客观规律(即在系统模型被分割成很多极小的元胞以后,每个元胞的性质和表现总是受其相邻元胞性质和表现的影响,或者说由它们所确定)融入了算法的核心。所以元胞自动机的思想在各种工程,技术领域的应用中有着其他传统算法思想所无法比拟的特点和优势。 但是,元胞自动机还存在一个十分重要的问题仍未得到妥善的解决,那就是元胞自动机应用起来看似简单,而在实际应用过程中要想得到完善的元胞自动机规则却很困难。所以,在元胞自动机应用过程中,确定规则是关键。传统上有以下两种确定元胞自动机规则的办法: (1)根据已知的系统演化的过程,记录各个不同时空点上系统的状态;然后从这个状态集中将各个元胞状态的变化过程,用一些线性、非线性方程或微分方程来表达。这样,在系统演化过程中,通过时空表达方程(即状态迁移方程),可以直接计算出本地元胞的状态,最终可以得到整个系统的演化状态。 (2)已知系统初始状态和最后状态,列出所有可能的规则集。对初始状态使用规则集中某一规则进行作用,这样总会存在一个或多个规则组成的规则集合可以使系统演化到最终状态。那么,这个规则集合就是所要找的规则。 以上两种方法实际上都不是较好的解决方法,其理由为: 第3章 复杂系统的元胞自动机自组织分析与建模69 (1)对于第一种方法,如果系统比较简单,那么,系统规则是可以通过记录、更新和查询由状态集综合得到的系统演化状态曲线或概率点阵得到。但是,一旦系统比较复杂时,比如系统元胞状态比较多时,应用现有的计算机工具就无法满足大量的计算需求,而且目前还没有比较完善的智能化工具来综合状态集。 (2)对于第二种方法,如果系统演化时每个元胞只取较少的相邻元胞作为对其有影响的元胞,那么这种方法也是可行的。但是,同样如果想得到比较完善的规则以使将来对随机系统的预测或判断更为准确而取较多的相邻元胞,比如二维元胞自动机模型中取八个,每个元胞状态只取两个,那么规则数就将有2种,那么这种方法根本就无法实现。 256 3.3 元胞自动机在工程系统中的自组织化分析与建模 3.3.1 城市交通信号自组织控制模型[34],[38] 1.问题的提出 城市交通控制系统是一复杂系统,具有较强的随机性、突发性和不确定性等特征,为了实现城市汽车流实时响应控制,建立一个能较好地反映实际城市交通系统的模型显得尤为重要。 巴拿斯(J.S.Baras)等运用随机点过程理论建立了城市交通系统数学模型,由于考虑的因素较多,计算量大,难以实现实时控制,只能采用简化算法求其次优解,这种简化有可能舍弃城市交通控制的复杂性本质等问题。随着控制理论的发展,智能控制方法也逐步被引入到城市交通控制中。帕匹斯(Pappis)和洪伟等对城市交通系统采用模糊控制的方法;其他研究者用模糊神经方法对交通系统建模;帕塔尔(M.Patel)的IDUTC更是将人工神经网路、模糊逻辑的专家系统结合在一起实现城市交通系统的智能控制等等,但是基于人工智能模型的交通系统控制方法中,模糊变量的分档,神经网路的拓扑结构、类型和训练的数据,专家知识表达的质量等等,都直接影响到系统的运行效率、实时性和稳定性。为实现城市交通系统的自组织控制,日本学者KosukeSekiyama提出采用非线性振荡器(nonlinearcouplingoscillator)描述城市交通信号网络,但是由于非线性耦合振荡器本身的强非线性特征,计算复杂,计算量巨大;杨煜普等将遗传再励学习算法应用于城市交通信号自组织控制,但该算法的计算十分复杂,难以实现路口汽车流的实时响应控制。因此,如何抓住城市交通控制问题的空间复杂性本质中的不变性或本质特性,以合适的方法加以描述、解释,实现具有实时性特征的系统建模仍存在着极大的研究扩展空间。 这里,提出了一种基于元胞自动机方法的城市交通自组织控制模型。从建 70复杂系统的分析与建模 模方法上,根据当前路口与其相邻路口的关系,将城市交通控制转化为二维CA问题。利用分层递进的规则集驱动城市交通信号模式的演化,解决了城市交通控制存在的不确定性和大自由度等问题,满足城市交通控制系统的实时性要求。对于具有不能用传统学科理论直接还原和表达特征的城市交通信号控制问题,用CA自下而上、自组织的方法能实现其系统的建模。文中根据CA算法建立了城市交通控制系统的虚拟CA网络模型,在具有智能体性质的单路口控制模型的基础上,完成了典型多路口自组织控制CA模型以及分层递进的CA自组织演化控制规则,最后通过计算机模拟仿真,证明所提出的基于CA的城市交通自组织实时控制方法是有效的。 2.CA与城市交通信号控制问题 CA方法应用于城市交通已有几十年的时间,其主要应用是对汽车流的仿真、模拟车辆和人群等运动。城市交通控制系统本身具有关联性、动态性及路口信号的多样性等特征,表3-3-1列出了它与CA之间的对应关系。由表3-3-1的分析可知,城市交通控制系统具有自组织的基本特征,因此我们可以将CA自组织的思想应用于城市交通控制建模之中。 表3-3-1 城市交通控制与CA之间的关系 基于CA解决问题的方法确定要研究的对象系统的性质 系统是否一个自组织系统? 关联性 城市交通控制的特征 有限个路口构成整个交通系统时,它们之间就产生了相互依赖、相互作用的特定的不可分割的联系 交通流量、车辆运行速度、车辆密度等随时发生变化;各路口之间的协调、配合关系也随时进行调整 将各路口划分成单元,因此交通系统成为一个单元之间相互联系的二维系统路口之间通过路段相连接,相邻近路口的状态会对本地路口的状态产生影响交通系统中所有路口信息在一个时间步内并行处理,具有节拍同步性;以局部规则作用于整个系统,达到系统最优 交通控制系统信号模式有若干种状态,或者是东西方向绿灯,或者是南北方向绿灯,又或者是其他多相交通状态等 交通系统内车辆的到达率,车种的混入率等等都具有极大的随机特征 对于一个城市交通系统,其边界为系统的输入 系统是静态或动态系统?系统是一维,二维系统还是三维?单元响应半径 动态性 二维性相邻路口同步性局部性路口状态多样性随机性存在性 确定系统规则 规则的时间和空间处理 规则的构造源 系统结构的规划 初始条件边界条件 以下以图3-3-1为例说明城市交通信号自组织控制模型的建立。图3-3-1 第3章 复杂系统的元胞自动机自组织分析与建模71 为一个实际城市交通网络的局部,我们把其作为一个小型交通网络系统看待。将图3-3-1各路口之间的几何拓扑关系抽象化为图3-3-2,并根据不同的功能将网格属性进行分类,如实际路口、虚拟路口、连接路段和非交通空间等。 图3-3-1 14个交叉路口的道路网络图图3-3-2 实际道路网络的抽象化表达 3.基于CA的城市交通信号控制模型 城市交通控制经历了点控—线控—面控三种模型的研究过程。本章提出以城市汽车流交叉路口相互协调的点控模式,实现整个系统面控的自组织模型。在这里,单路口的点控单元作为一个智能体,赋予特定的功能。在此基础上,城市交通信号的状态即可通过相邻单路口之间的相互作用,根据CA的自组织机制实现系统的协制,满足系统的复杂性特征和控制实时性要求。 图3-3-3 单路口简化模型图3-3-4 J路口与E、S、W、N路口双向通信 1)单路口模型 传统的单路口交通控制系统中信号灯的配时无法响应本地路口以及与其相邻路口的实时交通需求。在这里,我们将现有的交通网络中的每个路口均通过以下简单改造,使其具有可以自主采集和处理简单信息的能力,其定义具有以下可实现的基本功能: (1)路口具有检测自身当前状态的能力。如图3-3-3所示,在每个路口各 72复杂系统的分析与建模 向进车处安装车辆检测传感器(如CCD车辆检测传感器),在一定的范围内检测进入路口等待车辆数以及当前车辆运行状态,阴影部分为车辆检测器的有效范围。 (2)本地路口与其相邻路口之间实行双向实时通信。如图3-3-4所示,图中J为本地路口,路口W、E、S、N与J相邻,pXY为路口X作用于路口Y的状态。本地路口与其相邻路口实行双向通信,为自组织控制决策提供实时的确定信息。 (3)每个路口具有简单的信息处理能力。2)多路口自组织模型 建立交通控制系统自组织模型的方法如下: (1)单元的划分。将交通系统中每个路口作为一个单元,如图3-3-2所示,通过路段连接的单元之间的关系用相对方位进行描述。 (2)信息的确定。单元信息分为确定和非确定两种。如路口的车道数、形状、连接路段的长度以及与之相邻的路口等视为确定信息;路口信号灯的相位、等待或运行车辆数等为非确定信息。本地路口与相邻路口通过实时双向通信,可以确定获得的实时信息之间的关系,形成以信息为基础的属性矩阵。用此矩阵表达本地路口信息以及与相邻路口之间的关系。 (3)状态的编码。单元状态的离散化是多路口自组织控制的基础。路口各方向的车流量会对本地路口形成相应的压力。如图3-3-4所示,pXO(X=E、W、S、N,O=J)表示路口X对本地路口O的平均运行压力。pXY∈0,0.1,0.2,…,1.0,0表示压力最小,1.0表示压力最大。在控制系统的自组织模型中,本地路口J以运行压力pWJ、pEJ、pSJ、pNJ(东西南北)作为其自组织状态演化的依据。 通过以上的方法将整个系统离散成以路口为单元的二维网格形式。根据本地路口与相邻路口的关系,将整个城市交通信号控制系统用一个虚拟元胞自动机模型进行表达,所有自组织演化过程都在以属性矩阵为基础的虚拟元胞自动机网络上运行。 4.城市交通信号自组织控制的实时过程与规则 本节所讨论的基于元胞自动机城市交通信号自组织控制系统,其控制框图如图3-3-5所示,表示系统信息采集、处理以及控制决策的过程。由于城市信号控制系统本身的复杂性,其控制策略采用两套规则:单路口控制和多路口自组织控制规则。单路口控制规则反映本地路口状态决策的机理,而多路口自组织控制规则反映路口间压力缓解的演化机理。 城市交通信号自组织控制系统的控制时序以及多路口状态演化如图3-3-6所示。系统具有两个时钟周期———采样周期TS和决策周期TD,且TS=TD。在时序上,决策过程滞后于采样过程τ。系统在各采样时刻获取各路口的基本 第3章 复杂系统的元胞自动机自组织分析与建模73 信息,并按图3-3-4方式进行双向通信。信号模式在各决策点处作出决策,其作用域为一个决策周期。 1)单路口控制规则 (1)如果路口红灯方向平均每车道等待的车辆数大于Nred,红灯换成绿灯。(2)如果路口绿灯方向平均每车道运行的车辆数小于Ngrn,绿灯换成红灯。(3)路口信号灯最小绿时为Tmin,最大为Tmax,黄灯时间为一个决策周期。(4)如果相邻路口存在特殊的交通需求时,绿灯信号相应的最多可延长Text。 其中Nred、Ngrn、Tmin、Tmax和Text由用户设定,不同路口其设定值可以不同。 图3-3-5 基于元胞自动机的城市交通信号自组织控制框图 2)多路口自组织控制规则 多路口自组织控制规则是城市交通信号自组织控制策略的核心。本节以分层递进的方法对对象的规则进行分类,以简化此复杂演化规则的表达,如图3-3-5所示。城市交通信号自组织控制模型分为三层:即基本信息、演化状态和信号灯组,在已有路口基本信息的基础上,通过信息规则产生路口的状态,各路口再遵循状态规则进行有限次(时间)的演化,其演化结果用来决策系统交通路口的信号模式。 (1)信息规则。对于交通系统中任意路口O,各进车路段等待或运行的车辆数与相应路段容量的比值作为路口该方向的运行压力,然后根据平均法求出路口各信号相方向的平均运行压力,并以次作为控制系统状态自组织演化的依据。 (2)状态规则。假定城市交通信号控制系统中每个路口承受来自东西和南北两个方向所受的平均车流压力,将其自组织演化规则分为东西规则和南北规则。自组织的原则是在缓解压力过大路口的同时,提高空闲路口的道路利用率。因此,用本地路口自组织演化后的虚拟状态与下一采样周期内的本地路口初始 74复杂系统的分析与建模 状态进行比较,根据状态的差值和连接路段的距离来决策交通系统的信号模式,并且,比较仅在初始状态绿灯相位空闲的路口上进行,POO,PEO,PSO,PWO,PNO分别表示本地路口O以及与之相邻的东、西、南、北路口的虚拟二维状态矢量(东西和南北方向)。系统边界处理采用虚拟单元的方法,以满足系统规则的一致性。 5.仿真结果与比较 在建立基于路口属性矩阵的城市交通信号自组织控制模型的基础上,我们用VisualC++开发了该系统的仿真软件。以车辆的平均延误作为系统控制性能的评价,主要产生两种情况:车辆遇到红灯时的等待;绿灯时由于前面的车辆反应时间引起后面车辆的等待。 这里,以图3-3-1所示的实际交通网络按图3-3-2的抽象化表达进行仿真。系统各边界路口车辆到达服从泊松分布,TS=TD=3s,τ=0.5s。Nred=10,Ngrn=3,Tmin=15s,Tmax=60s,Text=30s,且所有路口的设定值均相同。下面以东西规则为例说明系统的状态规则,如图3-3-6,此时系统的状态为路口本身及其对相邻路口东西方向的平均运行压力: 1)演化 iiii+1i (1)如果POO<0.5,PWO>0.5或PEO>0.5,则POO=POO+0.1。 i i i i i (2)如果POO>0.5,PWO<0.5且PEO<0.5,则POO=POO-0.1。(3)其他情况保持状态不变。2)比较 n如图3-3-6所示,对于本地路口O,设当前演化虚拟状态为POO,下一采样0n0 周期初始状态为P0OO,如果POO<0.5,且POO-POO>0.3,FlagDOO=1,否则 iiii+1i FlagDOO=0。 FlagDOO为本地路口O的绿灯延时标志,1表示路口绿灯继续保持或延时。并且相邻两个路口之间距离不超过一定的范围时,该决策才有效,此规则中设定为250m。南北方向规则同理,考虑其与南北相邻路口之间的关系,两类规则同时操作。 仿真从一个非空的随机初始状态开始,在相同的初始条件下,对单路口控制模型和多路口自组织控制模型进行仿真,设C路口和S路口的到达流量均设为其通行能力的0.8(拥挤),其他边界路口为0.4,仿真时间为310个时间步(采样周期),车辆平均延误时间的统计在10个时间步后开始,相应的平均延误时间变化曲线如图3-3-6、图3-3-7所示。经计算,图3-3-6所示的单路口控制时系统内车辆的平均延误时间为1.80s,并且有上升的趋势,车辆在CNJS主干道上形成交通堵塞;多路口自组织控制时,平均延误时间为1.50s,系统比较平稳,没有出现堵塞的情况,如图3-3-7所示。继续运行至1000步左右,单路 第3章 复杂系统的元胞自动机自组织分析与建模75 口控制系统亦趋于稳定,平均等待时间为2.20s,而多路口元胞自动机模型在300步已基本稳定。由此可见,元胞自动机方法在城市交通信号自组织控制中的应用是有效的。 图3-3-6 单路口控制车辆平均 延误时间 图3-3-7 多路口自组织控制车辆平均 延误时间 3.3.2 结构拓扑的自组织进化[35~37] 机械结构初始拓扑形态的创新,一直是结构自动设计的一大难题。原因是机械结构的拓扑形态在很大意义上,基本决定了结构的功能、载荷、约束、材料的配置等的适用范围。即用现有的结构、材料、力学的解析法(有限元法等)和结构优化方法,由于表达结构形态设计的自由度庞大,只能在相对结构初始形态变化较小的范围内,实现结构的拓扑形态的再设计和强度、应力分布等的校核。为此,近年来基于元胞自动机的结构拓扑形态自组织化设计的研究,在机械结构拓扑形态设计方法方面开创了一个新的方向。其基本思想是利用元胞自动机多规则组合驱动的自组织演化机制实现大自由度结构复杂拓扑形态内部机理的表达。具体地讲是将结构分割为结构元胞单元(以下简称为结构单元),在元胞自动机的局部规则(以下简称为规则)驱动下,实现相邻结构单元状态的自组织,通过元胞自动机的演化机制表达整个系统的状态。 用元胞自动机实现结构拓扑形态的自组织问题,关键在于确定元胞自动机的规则。为了寻找其规则,现在大多数学者采用了如图3-3-8所示的基于局部间接规则(以下简称为间接规则)的进化元胞自动机(EvolutionaryCellularAu-tomata,ECA)方式驱动结构的自组织演化过程。所谓间接规则,是在元胞自动机的结构拓扑形态自组织过程中,由离散单元的力学解析(FEM等)得到的相邻单元应力和相关系数等信息构成迁移函数作为自组织演化规则的表达。迁移函数中的相关系数作为设计变量由进化过程确定。但是,由于局部规则的局部性特征以及结构的形状、材料特性等复杂因素的影响,间接规则存在着缺乏一般性、计算量大、实际操作难度大等问题。 76复杂系统的分析与建模 为此,本节讨论一种不依赖于力学解析信息的局部直接规则(以下简称为直接规则),求解结构的优化拓扑初始形态的方法。即将直接规则集合作为设计变量,通过进化过程确定直接规则群,并由此决定状态演化迁移函数(以下简称为迁移函数)的形式。为了减小设计变量数,在迁移函数中,将t-1,t-2时刻中心单元的相邻单元状态作为输入,确定t时刻中心单元的状态。依此不仅解决了元胞自动机反复演化过程中FEM解析的计算量问题,而且有效地实现了元胞自动机规则的一般性表达,又大大减小了直接规则的自由度。在结构质量最小化评价目标下,实现规则集合进化的同时,完成结构拓扑形态的自组织。文中以简单的平面薄板结构拓扑优化为例,显示了提出的直接规则在结构拓扑优化问题中的作用和有效性。 图3-3-8 基于间接规则的ECA框图 1.结构拓扑优化中的ECA直接规则1)ECA的间接规则 在基于ECA间接规则的结构拓扑形态设计中,其迁移函数的确定大多是根据人们的经验或其他方法计算的结果来建立。对图3-3-9(a)所示的平面薄板质量最小化设计时,无论采用如图3-3-9(c)、(d)、(e)的元胞自动机平面模型之一,都要先设定如式(3-3-1)所示的迁移函数: n Stij=F[・]= t-1e σk,・αk,∑k=1 (3-3-1) 式中:n为如图3-3-9(c)、(d)、(e)所示的元胞自动机平面模型当前单元的相邻单元总数;k为如图3-3-9(c)、(d)、(e)所示的元胞自动机平面模型当前单元的相邻单元序号;e为如图3-3-8所示的进化世代数;Stij为t时刻当前单元(i,j)的状态;σk t-1 为t-1时刻与Sij相邻单元(k)的应力;αk为第l代进化的迁移函数加 te 权系数。 使用ECA的间接规则进行结构拓扑优化过程如图3-3-8所示,用第l代进化得到的迁移函数加权系数(设计变量),以及元胞自动机自组织演化过程中t-1时刻结构拓扑形态的应力分布解析结果,根据式(1)建立的元胞自动机的间接规则,完成t时刻结构拓扑形态的状态迁移。状态迁移如此反复进行,直至 第3章 复杂系统的元胞自动机自组织分析与建模77 图3-3-9 解析模型和元胞自动机的平面模型 (a)结构模型 (b)虚拟单元 (c)元胞自动机模型1 (d)元胞自动机模型2 (e)元胞自动机模型3 t=Tmax,(元胞自动机的最大状态迁移次数),结构拓扑形态自组织完成;再通过进化评价决定是否进入下一世代迁移函数加权系数的进化。可见基于力学解析结果的间接规则,在结构的形状、材料特性等复杂因素的影响下,对于一般性结构拓扑形态设计问题难于适用。这种确定ECA的间接规则的方法存在以下的主要问题: (1)基于应力信息的迁移函数数学表达形式,缺乏一般性的指导意义,事先设定的迁移函数数学表达形式与实际结构拓扑形态的力学机理无必然联系。 (2)迁移函数中的应力信息,需要FEM解析得到,大大增加了进化解析的时间。 (3)把迁移函数中的相关系数(加权系数等)设定为实数设计变量,在进化过程中其计算精度对局部规则的影响极大。 为此,以下将以图3-3-9(a)的平面薄板设计为例,讨论一种不依赖于力学解析信息的元胞自动机直接规则的表达和基于ECA的结构拓扑优化设计方法。其基本思想如图3-3-10所示,将直接规则集合作为设计变量,在结构质量最小化和直接规则收敛性评价目标下,实现局部规则集合进化的同时,以简单的元胞自动机自组织演化机制,实现大自由度结构拓扑形态的设计。 78复杂系统的分析与建模 图3-3-10 基于直接规则的ECA框图 2)直接规则的构造 假如以图3-3-9(c)、(d)、(e)的元胞自动机平面模型,每个单元的状态定义为2值化,可以将结构拓扑形态问题转化为求解一个在元胞自动机的自组织演化过程中与结构的力学解析无关,仅与结构质量分布相关的有限直接规则集合的问题。但是,局部规则的定义和构造决定了其集合的大小,也决定了设计变量数的多少。按照如图3-3-9(c)、(d)、(e)所示的元胞自动机常用平面模型的类型,图3-3-9(c)和(d)中心单元的相邻单元数较少,难以表达复杂的结构拓扑形态。假如以图3-3-9(e)相邻单元为八个元胞自动机平面模型进行结构拓扑形态设计,则其直接规则的所有组合为2=256。也就是说,其设计变量数为256个。这样,相对于ECA的间接规则,将大大增加其进化过程的计算压力。为了减小进化过程的计算负担,必须通过合理地构造直接规则的表达,以降低局部规则集合的自由度,减少设计变量数。为此,这里提出采用下式: FS(i-t-12,)j,S(i,t-j-21),S(i,t-j2),S(i,t-j+21),S(i+t-12,)j,S(i-t-11,)j-1, Si-1,j+1,Si,j (t-2) 1) S(i,t+j= (t-1) (t-1) 8 ,Si+1,j-1,Si+1,j+1 (t-2) (t-2) (t-1) i,j (t-1)(t-1) θ=0 (t-2) FSi-1,j-1,Si-1,j+1,Si,j SSi,j (-1) (t-1)i-1,j (t-2) ,Si+1,j-1,Si+1,j+1, (t-1)i,j+1 ,S (t-1)i,j-1 ,S,S,S (t-1)i+1,j θ=1 (3-3-2) =Si,j  (i=1,2,3;j=1,2,3) (1) t≥1 式(3-3-2)为状态迁移函数,式中θ=0和θ=1两种状态转移函数的选取条件如图3-3-11(a)所示。从图3-3-11(a)可以看出,迁移函数通过增加t-2时刻元胞自动机演化过程的状态信息,将八个相邻单元模型分解为两个四个相邻单元模型处理,使元胞自动机局部规则的组合数从256降为25+25=。t-2,t-1时刻状态所对应的图3-3-9(c)、(d)元胞自动机平面模型的顺序,由2值化设计变量θ确定。 3)直接规则的ECA染色体表达 直接规则的ECA染色体表达,就是将以上构造的元胞自动机直接规则,在 第3章 复杂系统的元胞自动机自组织分析与建模79 进化过程中予以染色体表达。在结构拓扑形态设计过程中,ECA提供了搜索元胞自动机局部规则的方法。即相对于一个确定条件的结构拓扑形态设计问题,其大自由度和复杂性的难题,通过进化机制寻求能够表达问题内部力学机理的元胞自动机直接规则集合来完成,而直接规则在进化过程以染色体予以表达。这里,状态迁移函数的规则和遗传算法染色体的关系如图3-3-11(c)所示。图中,个二进制数的基因与个直接规则相对应。同时除前述的θ外(位于基因位No.66),在基因位No.65再设定一个二进制数的基因φ。这样染色体由66个基因位来表达。其中基因φ的作用如图3-3-11(b)所示。 图3-3-11 元胞自动机的直接规则、迁移函数和遗传染色体的设定 (a)迁移函数的选取 (b)基因φ的作用局部规则例(θ=0) (c)遗传算法染色体和元胞自动机直接规则 图3-3-11(c)说明了在元胞自动机演化过程中,基因位No.1~No.32(图3-3-9(c)模型的局部规则集合)中K值,基因位No.33~No.(图3-3-9(d)模型的局部规则集合)中L值,再综合图3-3-11(b)基因φ,最终决定了t时刻中心单元的状态。 80复杂系统的分析与建模 2.ECA规则的进化表达 基于ECA直接规则的结构拓扑形态优化设计模型,用以下公式表达:设计变量:X= R1,R2,…,R,φ,θT (3-3-3)(3-3-4)(3-3-5) t=Tmax t-1ij 目标函数:f(X)=α1W(X)+α2Time→Min约束条件:g(X)=σi-σa≤0 h(X)= Time-Tmax=0  Time-t=0 t t ij (3-3-6) 式中:Ri为与直接局部规则相对应的二进制变量;W为结构的质量;σi为平面薄板内应力;σa为许用应力;Time为元胞自动机状态迁移次数;Tmax为设定的元胞自动机的最大状态迁移次数;α1,α2为多目标函数的权重系数。 以上的优化模型,要求元胞自动机的状态迁移次数Time要在Tmax以内收敛的同时,通过结构材料质量和Time的最小化目标,使系统在进化过程中保证直接规则的收敛性。通过式(3-3-3)~式(3-3-6)把基于ECA直接规则的结构拓扑形态优化设计问题转化为一般的多目标优化问题。 3.结构拓扑形态优化的算例 以图3-3-9(a)所示的问题作为算例,使用以上所提出的迁移函数和方法,讨论基于ECA的结构拓扑优化问题。系统的外部力学条件如图3-3-12(a)所示的四种情况,按照图3-3-12(b)所示分别将其外部力学条件转化为相应的虚拟单元,从初始元胞自动机(e=0)状态开始直接规则的进化,利用元胞自动机自组织演化实现结构拓扑形态的设计。图3-3-12(c)所示为各种模型从初始状态进化到收敛状态中间结果的一例。其中进化世代数用e表示,例如图3-3-12(c)模型4为进化世代数e=300时的状态;图3-3-12(d)模型4为进化的最终状态,其进化世代数e=429,元胞自动机状态迁移次数Time=210。 需要说明的是,以上ECA的进化计算以遗传算法为基础。在进化过程的e世代,由染色体所构成的直接规则集合驱动,结构拓扑形态从t=0的状态(即图3-3-12(b)的相同状态)开始迁移演化到t=Tmax,完成其结构拓扑形态。此时,通过FEM计算,在满足式(3-3-5)的应力约束和式(3-3-6)的状态迁移次数约束条件下,对染色体实现式(3-3-4)的多目标评价。从基本设计要求出发,最终得到具有收敛性特征的元胞自动机直接规则集合和结构重量最小的结构拓扑形态。 由图3-3-12(a)模型1、2的比较可以看出,在不同方向载荷作用下,图3-3-12(d)模型1、2的最终结构拓扑形态具有极其明显的最优特征;由图3-3-12(a)模型3、4的结构拓扑形态可见,从力学条件比较,两者的虚拟单元初始状态是相同的,但其水平方向上的受力方向是相反的,最后得到的图3-3-12(d)模型3、4的结果反映了其力学模型的特征。以上,用实例较直观地证明了提出的迁移函 第3章 复杂系统的元胞自动机自组织分析与建模81 数和直接规则,在基于ECA的结构拓扑优化设计问题中的有效性。 图3-3-12 ECA计算结果 3.3.3 股票市场投资行为的模拟[41] 元胞自动机可以用来模拟股票市场。股票市场投资行为是一复杂系统,具有明显的复杂性特征,即简单的局部规则能产生整体的复杂行为。股票市场中,参加交易的是作为个体的股民,他们的局部行为相对比较简单,只有三种市场行为———买入、持有和卖出。他们的交易行为除了与其本身掌握的信息外,还跟他们身边的股票买卖有紧密的关系。虽然影响投资者行为的作用机制和演化规律比较简单,但经过一定时间的演化后,整个市场会产生截然不同的整体行为,且其具体演化结果无法预期。因而股票市场投资行为问题的求解必须依赖于基于复杂性的理论与方法。而元胞自动机的基元(元胞或网络点)具有空间离散化、时间离散化、状态离散化、相互作用的局域化和动力学演化的同步性等特点,能逼真地反映大量个体相互作用的细致结构模式(pattern)。它能通过简单的单 82复杂系统的分析与建模 元和简单的规则产生复杂现象,从而具备模拟股票市场投资行为这一复杂系统的能力。 以下用元胞自动机来模拟股票市场投资行为。 在建立股票市场的投资行为模拟模型之前,先做两个假设:一是投资者资金无限;二是投资者股票持有量无限。 1.基于元胞自动机的股票市场投资行为演化模型 根据建立元胞自动机模拟模型的方法,确立和构建基于元胞自动机的股票市场投资行为二维演化模型如下: (1)元胞:股票投资者。 (2)元胞空间:元胞空间在广义上可取所有的该股票持有者和非股票持有者的总和,但在分析该股票在特定地区的持有情况时,元胞空间会小得多。在实际模拟中,应当根据具体情况选定元胞空间的大小。由于网格空间的大小越大,则计算机模拟的速度越慢;但太小又看不出明显的模拟结果,因此在我们取50×50的网格。 (3)邻居:为简化问题,这里选取典型的Moore型,如图3-3-13所示。(4)元胞状态:元胞状态是考察元胞某方面的特征时的取值,根据股票投资者的投资行为和投资偏好建立二维元胞状态空间(S)。第一维是投资行为(s1),其中包括股票的买入(s11)、持有(s12)、卖出(s13),即:S1={s11,s12,s13};第二维是投资偏好(s2),其中包括乐观(s21)、保守(s22)、悲观(s23),即S2={s21,s22,s23}。所以一个元胞的状态可表示为S={s1,s2},其中s1∈S1,s2∈S2。 在元胞的状态空间中,投资行为的意义是显而易见的, 图3-3-13 元胞自动机的Moore型邻居形式 在投资偏好中,乐观型的投资者容易受周围投资者的影响,从众心理强;保守型的投资者不容易受周围投资者的影响,有一定性;悲观型的投资者,容易与周围投资者反其道而行之。考虑单个元胞的两个方面的状态,共有3×3=9种组合,也即元胞的状态数总共有九种。其中投资行为随着元胞自动机演化会变化,而投资偏好与投资者的个性相关,一旦形成便很难再改变。 (5)演化规则:演化规则是一个从中心元胞的邻居状态到中心元胞下一时刻状态的映射。它必须考虑股民之间的相互影响、股民自身对股票买卖的分析能力、每个股民的偏好以及等主要影响因素。 一般情况,元胞下一时刻的状态受其邻居元胞状态、自身状态和控制变量的影响,用公式表示为: sr tt+1 =Fsr,srL;R sr(1),…,srL(n) t t tt srL= 第3章 复杂系统的元胞自动机自组织分析与建模83 s∈S1×S2;t=0,1,2,…(3-3-7) 式中S1、S2为元胞的两个方面的状态;srt+1表示元胞空间中的位置为r的元胞在t+1时刻的状态;srt表示元胞空间中位置为r的元胞在t时刻的状态;向量strL表示位置为r的元胞的邻居L在t时刻的状态;R是控制变量;F表示元胞自动机的演化规则;n是邻居元胞的个数。 在一般规则框架下,假定股票市场中元胞下一时刻的状态只受其邻居元胞的投资行为、自身的投资偏好和宏观因素的影响(因为投资偏好不会改变,这里的元胞状态主要指投资行为,而且邻居元胞不包括其自身)。其中,邻居元胞的投资行为表现为上一时刻何种投资行为在它们之中占多数;元胞的投资偏好则设以一定的概率影响投资者的买卖行为,当前元胞以设定的概率系数转为邻居元胞中上一时刻占多数的投资行为。在乐观、保守、悲观三种投资偏好中,因为它们的从众程度依次减小,所以它们的转换概率也是依次减小的;宏观因素则以一个利好或利空系数来增加或减少投资者的买卖概率,当宏观面利好时,投资者作出买入决策的概率增加,当宏观面利空时,投资者做出卖出决策的概率增加。具体规则如表3-3-2所示。 表3-3-2 元胞自动机演化规则 邻居元胞宏观 中占多数因素 的行为 买入 利好 持有卖出买入 利空 持有卖出 元胞下一时刻的状态(投资者下一时刻的可能行为及其对应的转换概率)以概率(s2+MF)买入、(1-s2-MF)×0.5持有、(1-s2-MF)×0.5卖出以概率s2持有、(1-s2)×(0.5+MF/2)买入、(1-s2)×(0.5-MF/2)卖出以概率s2卖出、(1-s2)×(0.5+MF/2)买入、(1-s2)×(0.5-MF/2)持有以概率s2买入、(1-s2)×(0.5+MF/2)持有、(1-s2)×(0.5-MF/2)卖出以概率s2持有、(1-s2)×(0.5+MF/2)买入、(1-s2)×(0.5-MF/2)卖出以概率(s2-MF)卖出、(1-s2+MF)×0.5买入、(1-s2+MF)×0.5持有 上表中,s2为持某种投资偏好的投资者,在没有宏观因素的影响下,受邻居元胞中上一时刻占多数投资行为影响的概率,即投资者的从众概率,在这里将其称为投资偏好系数;对应的s21、s22、s23分别为乐观系数、保守系数和悲观系数;MF为宏观因素所引起的投资行为转换概率的调整系数,当宏观面利好时,MF大于零,而当宏观面利空时,MF小于零。上表中所有的概率值都在[0,1]之中,演化过程中小于0的值按0处理,大于1的值按1处理,同时每个元胞转化为三种投资行为的概率总和应该为1,当不为1时,演化程序将自动调整当前元胞转换为邻居元胞中占少数行为的转换概率,使上述的概率总和为1。 2.模拟实验分析与讨论 模拟实验的输入参数有网格空间的大小、演化规则的类型、初始状态的形状 84复杂系统的分析与建模 和宏观影响因素的大小程度。网格空间的大小为50×50的网格;不同类型的演化规则从各投资偏好的不同取值中获得,投资偏好系数都为1所对应的演化规则为确定性规则,投资偏好系数在[0,1]之间的为随机性规则;初始状态的形状分为2种,一种是对称初始状态,另一种是随机初始状态;宏观影响程度根据情况在[0,1]之间选不同的宏观系数(MF),且在模拟实验只把MF作为初始参数输入模型,而在模拟过程中保持不变。以下分别根据不同类型的演化规则和根据不同程度的宏观影响因素对股票市场进行模拟实验。输入参数用一个五元向量来表示:{InitialState,MF,s21,s22,s23},其中InitialState是初始状态,取值为Symmetry(对称)或Random(随机),其他元素的含义如前所述。 1)不同类型演化规则下的股票市场投资行为模拟 图3-3-14 对称初始状态及三种情形的最终演化结果 (a)Steps=0 (b)Steps=330 (c)Steps=370 (d)Steps=30 不同类型的演化规则由不同的投资偏好系数来决定,为考察不同的演化规则对股票市场投资行为最终演化结果的影响,假定此时的宏观因素影响程度为0,初始状态设为对称初始状态(见图3-3-14(a)),其中深颜色区域表示买入、空白区域表示持有、淡颜色区域表示卖出。根据投资偏好系数的大小分三种情形进行模拟实验,输入参数分别为:{Symmetry,0,1,1,1},{Symmetry,0,0.97,0.95,0.93},{Symmetry,0,0.75,0.5,0.25},前者反映的是确定性演化规则,后两者反映的是随机性演化规则。情形1表示投资者完全按照周围投资者的行为进行投资活动;情形2说明投资者以一定的概率从众,即除了从众行为外,还带有自己的主见,但偏好系数取值较大,所以投资行为还是以从众为主;情形3的偏好系数取值较情形2小,投资者行为接近于。图3-3-14(b)、(c)、(d)分别是这三种情形的最终演化结果。图3-3-14(b)表明股票市场的演化趋向是全部元胞的投资行为都是卖出,而且这种状态将一直维持下去,这是由确定性规则中极强的投资者从众心理和对称规则中分布不均的投资行为数量及其分布形状所共同决定的。图3-3-14(c)与图3-3-14(b)略有不同,此时买入行为占绝大多数,其他两种行为零星地镶嵌在其中,且其出现的位置和数量在小范围内不断地在变化,这是一种远离平衡的稳定振荡现象,由此反映投资者带有主见的投资行为对促进市场稳定起到了初步的作用。图3-3-14(d)表明股票市场只需少量步数的演化,即进入稳定状态,此时三种投资行为的数量分布比较均匀,虽然它 第3章 复杂系统的元胞自动机自组织分析与建模85 们每时每刻都在变化,但振幅很小,是一种均衡的稳定市场,由此反映股票投资者的投资行为已经对股票市场的稳定起到了根本性的作用。从情形1到情形3,阐述了投资者从完全从众行为一步一步走向的过程,在这个过程中,股票市场的最终演化结果从单个投资行为占据整个空间这一极端化的形式开始,随着投资偏好系数的降低,逐渐从远离平衡的稳定市场过渡到均衡的稳定市场。由此可见,投资偏好系数越大,股票市场越不稳定;投资偏好系数越小,股票市场越稳定。 2)不同程度宏观影响因素下的股票市场投资行为模拟 为考察宏观因素对股市的影响程度,假定投资偏好为:{s21,s22,s23}={0.75,0.5,0.25},选定初始状态为对称初始状态。宏观因素分为利好因素和利空因素,由于这两者为对称关系,所以这只取宏观利好因素来考察研究。根据宏观系数的大小分两种情形进行模拟实验,输入参数分别为{Symmetry,0.1,0.75,0.5,0.25}、{Symmetry,0.9,0.75,0.5,0.25},情形1中的MF=0.1和情形2中的MF=0.9分别表示一般利好情况和极好情况,图3-3-15和图3-3-16 图3-3-15 三种投资行为的数量变化过程: {InitialState,MF,s21,s22,s23}={Symmetry,0.1,0.75,0.5,0.25} 图3-3-16 三种投资行为的数量变化过程: {InitialState,MF,s21,s22,s23}={Symmetry,0.9,0.75,0.5,0.25} 86复杂系统的分析与建模 描绘了这两种情形的投资行为数量变化过程。图3-3-15与图3-3-16表明,宏观因素利好引起了投资者买入概率的增加,而且其利好程度的大小将导致不同的股票市场演化结果,当出现一般利好消息时,投资者的买入行为虽有明显的增加(见图3-3-15),但由于投资者有一定的性,股票市场最后趋于平稳,买入行为的总量及持有和卖出行为的总量分别在较高位置和较低位置维持小幅振荡。而当出现极好消息时,投资者会不顾一切地买入,结果是投资者的买入行为占据了整个模拟空间,造成了股市大的波动(见图3-3-16)。由此说明,宏观系数越大,股票市场越不稳定;宏观系数越小,股票市场越稳定。 3.分析与讨论 由以上模拟结果分析与讨论可知: (1)元胞自动机可以较好地模拟股票市场投资行为这一复杂系统。(2)投资者的投资偏好是影响股票市场稳定的关键性的因素。投资者的偏好系数越高股票市场越不稳定,反之越稳定。当投资者的偏好系数较高时,说明投资者的从众心理较强,投资者受周围投资者的影响较大,各投资者之间形成一个相互约束的关联网,这样很容易形成群体效应或羊群效应,造成股票市场的大波动;当投资者的偏好系数较低时,投资者的从众心理较弱,投资行为受周围投资者的影响较小,其投资行为更也更活跃,有利于市场的稳定。 (3)宏观影响因素是影响股票市场稳定的另一个重要因素,宏观系数越大,股票市场越不稳定,反之越稳定。当只是出现一般的宏观面消息时,股票市场仅仅是重新分布三种投资行为的数量关系,而当出现极大的宏观面消息时,股票市场就会不断倾斜,最后的结果只能是崩溃。 (4)在投资者的投资偏好和宏观因素两个影响股市稳定的因素中,后者的出现是难以避免的,而且投资行为也无法不受其影响,但前者是可以人为调整的,股票投资者的盲目从众心理不利于取得投资收益,也不利于股票市场的稳定,因此,投资者应该多一些见解,少一些盲目从众行为。 3.3.4 交通流中多自主体人员行为的模型[30] 元胞自动机模型的局部规则简单,但现实生活中涉及到人的行为的运动往往是比较复杂的。如在交通流研究中,元胞自动机作为对复杂行为的一种有效的模拟手段,可以实现很好的模拟,但在要求考虑行人流、涉及人的行为特征的研究时,由于人的运动具有很大的主观性和随机性,单依靠元胞自动机模型来模拟人的运动存在一定的难度,而利用自主体来研究和模拟则具有较大的优势。 自主体是存在于一些复杂动态环境下的计算系统,它们可以自主地感知周围环境并做出相应的行动以完成一系列给定的任务或实现一定的目标。通常,自主体是指一个基于硬件或软件(在更多情况下)的计算机系统并且具有以下的 第3章 复杂系统的元胞自动机自组织分析与建模87 一些特性:自主性、社会能力、反应性、能动性等。在一些特定的应用中,除了以上这些特性之外,还可以赋予自主体一些人类所具有的特性,如知识、动机、义务甚至感情。 在多自主体模拟的研究中,根据各自主体之间的关系可以分成以下几类:合作型自主体系统(即一群自主体共同的为一个公共目标而工作)、非合作型自主体系统(指一群有各自利益追求的自主体在一个公共的环境中相互作用的系统)。对于行人运动的多自主体系统,可以认为是属于非对抗非合作型系统;而对于紧急情况下的人员疏散过程,可以看作是具有一定合作性的系统,但这种合作往往是较为松散的。 基于元胞自动机的多自主体人员行为模型以人员个体为研究单位,利用自主体来模拟具有基本智能的人员,通过制定简单的局部行为规则来描述人的整体复杂行为。 以下用基于元胞自动机的多自主体人员行为模型来模拟购物中心中人员的运动,借助于自主体的一些特性来模拟人的智能。在购物中心,人们的运动往往是散漫的,并容易受周围环境的影响,如遇到喜欢的东西会停下来等。而发生火灾或其他突发事件之后的人员运动则以寻找安全出口离开建筑物为主要目的,在人们运动和疏散中常常存在不清楚目的地和出口的情况,这时人们会根据记忆以及周围情况作出合理的行为选择。 1.基于元胞自动机的多自主体人员行为模型描述 模型的基本框架根据建筑物平面进行均匀的网格划分,人们的运动遵循一定的局部规则。人用自主体表示,他们的行为会因周围环境的变化作出相应的调整。他们可以有一定的兴趣,如遇到喜欢的橱窗会停下来;也可以有一定的感情,如熟人之间会聚集在一起;也可以有一定的目标,如发生火灾或其他意外会寻求逃生出口等。 模型中每个元胞对应0.40×0.40(m2)的空间,是密集人流中典型的人员空间分配。人在正常情况下行走速度为1.0m/s左右,而紧张情况下可达1.5m/s左右。如果规定每个时间步每个人员只能移动一格,则在紧急情况下每个时间步为0.40/1.5≈0.27s。行人运动和疏散模型中,需要解决的一个重要问题就是人员行动路线的选择,引入自主体将有助于使这种选择更加智能和合理。在实际的人群运动中人员具有很强的自主能力,他们会根据自身周围的环境作出相应的判断和决策。因此模型中自主体的主要行为就是根据它所感知到的周围环境对下一步的行动路线作出合理的选择。每个自主体只能感知到一定范围内的情况,即存在一定的视野。设模型中每个自主体的视野为VonNeumann型邻域,如图3-3-17所示,每个自主体当前的行为完全由其视野内的环境决定。由于人员在紧急疏散过程中总是希望以最快速度离开建筑物,因而可以认为模 88复杂系统的分析与建模 型中人员总是希望能在最短时间内到达目的地。 图3-3-17 元胞自动机邻域的定义 另外,人员在运动时总是尽量避开拥挤的地方,这通常会与选择最短路径产生矛盾,这时自主体将能够对这两者进行权衡以便做出合理的选择。模型中假定,当自主体经过初步判断认为某一格点将同时有超过两个人(包括他自己)竞争时,则会以一定的概率放弃竞争而选择其他次优格点。除此之外,还可以对自主体的行为作其他的规定,如人员在迷失位置时会以多大概率跟随人群运动或者是沿着墙壁摸索前进;自主体还可以通过交流信息将最新的情况传达给其他自主体等等。图3-3-18给出了单个自主体的结构及其在该模型中的功能图。模型的局部运动规则在每个时间步有两个基本问题需要解决,即路线的选择和当多于一人同时竞争一个空格点时产生的冲突。一般说局部的路线选择和各自主体的目的和兴趣相关。假定赋予每个自主体一张吸引力等级图,它是每个元胞的对各自主体的吸引力强度分布图。例如,在正常情况下超市中的货柜对顾客的吸引力是较大的,所以在吸引力等级图上货柜附近的等级是较高的,而在紧急疏散的情况下,出口处对人们的吸引力是最大的。在模拟过程中,假设所有自主体选择周围某一元胞作为运动方向的概率同该元胞的吸引力值成正比。每个自主体的元胞吸引力等级图随着时间的变化可以由自主体对其进行相应的修改,例如当人们发现新的感兴趣的东西时,该位置的元胞吸引力便随着增大。 图3-3-18 单个自主体结构及其功能图 此外,从人工生命的角度出发,将整个模拟过程分为熟悉阶段和疏散阶段。熟悉阶段指人们在正常情况下在建筑物内的运动过程,由于人是有记忆能力的, 第3章 复杂系统的元胞自动机自组织分析与建模 所以该过程也是人们对建筑物的熟悉过程。由于不同的人运动的路线可能不同,对建筑物的熟悉程度也会不同,这样模型就能够比较真实地反映实际过程中的情况。在熟悉结构的过程中,每个自主体根据已有的知识对所处元胞的吸引力或危险度等级进行修改。这样一般熟悉阶段的时间越长,自主体对建筑物的结构就越了解,在疏散阶段中的路线选择也会更加合理。疏散阶段是指在紧急疏散的情况下建筑物内人员的运动过程。这时候人们将根据自己对建筑物结构的熟悉程度选择他认为最优的路线进行疏散。模拟结果表示,通过这样的处理该模型可以模拟任何复杂结构建筑物内的人员运动和疏散过程。这样模拟时,在每一个时间步,所有自主体按以下规则进行同步更新: (1)所有自主体将根据其视野内的所有元胞的状态和前面给出的规则作出判断,并在其周围四个相邻的元胞中选择一个空的对它吸引力最强的元胞作为下一时间步的目标格点。 (2)由于模型假设在每一时间步一个格点最多只能由一个自主体占领。这样如果存在有多个自主体竞争同一个格点,即发生冲突时,只能有一个自主体留下,其他的将回到原来格点,并且在通常情况下每个自主体的机会是均等的;此外,如果某一格点已被障碍物占据,如桌椅或墙壁等,则自主体不能进入该格点。 (3)随机慢化,即对于要移动的自主体,以某一给定的概率留在原位,这一步主要是用来模拟现实生活中出现的一些意外情况如遇到熟人或者喜欢的东西等。 (4)处在新位置上的自主体根据已有的元胞吸引力等级图对新位置元胞的吸引力进行重新评价,并确定其吸引力值。 2.模型算例 下面利用该模型作一个简单的模拟,根据模拟的场景———一个小型超市得出示意图。模拟开始时,将所有200个人员(自主体)从超市的各个进口引入,随后这些人员将作随机运动以熟悉超市的结构。在某一时刻,假设超市发生火灾或其他意外事件必须紧急疏散,这时所有的自主体都可以按自己熟悉的路线进行疏散。模拟中假设自主体视野为r=3的VonNeumann型的邻域,由于人员在疏散过程中都将尽可能以最快的速度前进,随机慢化通常发生在亲朋之间互相帮助的情况下,随机慢化概率取0.05。 图3-3-19给出了疏散刚开始时和60个时间步之后建筑物内人员分布情况。熟悉阶段的总时间步为10000步,并且在熟悉阶段人们总是更偏向于往未走过的地方运动。模拟过程中发现:在这种情况下熟悉过程结束时,人们对房间结构的熟悉度是较高的。从图可以看出该模型能够方便地模拟复杂结构建筑物内人员的疏散情况。 可以通过对疏散过程的可视化演示来评估建筑物的设计以及内部布局结构 90复杂系统的分析与建模 图3-3-19 对超市疏散过程的模拟 的合理性。通过图可以看出人员在疏散过程的分布情况,找出影响疏散效率的瓶颈。由于人群特别拥挤的地方往往容易造成人员的伤亡,所以在设计建筑物结构时应尽量避免这种情况的出现。此外,通过对建筑物内部结构的调整可以对各个设计方案进行对比以选出最合理的方案。 3.讨论 利用基于元胞自动机的多自主体人员行为模型的可视化动态演示,可以对建筑物设计以及内部布局结构的合理性进行评估,并可以比较不同设计方案的优缺点,为建筑物的性能化设计提供有用的参考;还可评价已经存在或者设计中的建筑物对人员行为的影响以及发生火灾之后建筑物结构对人员疏散效率的影响。基于元胞自动机的多自主体人员行为模型对评估建筑物的设计方案具有很好的参考作用。 第3章 复杂系统的元胞自动机自组织分析与建模91 参考文献 [1] JohnS.Baras,WillianmS.Levine,TahsinL.Lin.Discrete-timepointprocesses inurbantrafficqueueestimation.IEEETransactionsonAutomaticControl,1979,AC-24:12~27 [2] PappisCP,MamdaniEH.Afuzzylogiccontrollerforatrafficjunction,IEEE TransactiononSystem,ManandCybernetics,1997,SMC-7(10):707~717[3] 洪伟,牟轩沁,王勇,秦中元,张利浩.交叉路网交通灯的协调模糊控制方法.系 统仿真学报,2001,13(5):551~553 [4] MinCheeChoy,DiptiSrinivasan.HybridCooperativeAgentswithOnlineRein-forcementLearningforTrafficControl,IEEE2002,1015~1020 [5] EllaBingham.ReinforcementLearninginneurofuzzytrafficsignalcontrol,Euro-peanJournalofOperationalResearch,2002,131:232~241 [6] M.Patel,N.Ranganathan.IDUTC:AnIntelligentDecision-MakingSystemfor UrbanTraffic-ControlApplications,IEEETrans.Veh.Technol.,May2001,vol.50(3):816~829 [7] KosukeSekiyama,JunNakanishi,IsaoTakagawa,ToshimitsuHigashiand ToshioFukuda.Self-OrganizingControlofUrbanTrafficSignalNetwork.IEEE2001,2481~2486 [8] 杨煜普等.基于再励学习和遗传算法的交通控制信号自组织控制.自动化学报, 2002,28(4):5~568 [9] MarianBubak,PrzemyslawCzerwinski.Trafficsimulationusingcellularautomata andcontinuousmodels,ComputerPhysicsCommunications,1999,121~122:395~398 [10] M.Schreckenberg,L.Neubert,J.Wahle.Simulationoftrafficinlargeroadnet-works,FutureGenerationComputerSystem,2001,17:9~657 [11] JyuhachiODA,WangAnlin,etal.StudyonStructuralOptimizationTechnique usingEvolutionaryCellularAutomata(LocalDirectRuleBasedonNewTransitionFunction),TransactionsofJSME,68-665A,p15~20(2002-1) [12] JVonNeumann,Thegeneralandlogicaltheoryofautomata.In:AATaub.JVon Neumann,CollectedWorks.Urbana:UniversityofIllinois,1963.288~298 [13] SWolfram.Staticalmechanicsofcellularautomata.RevModPhys,1983,55(3): 601~3 [14] NHPackard,SWolfram.TwoDimensionCellularAutomata,JStatisPhys, 1985,38(5/6):901~946 [15] EDomany.ExactResultsforTwo-andThree-DimensionIsingandPottsModels. PhysRevLctt3,1984,52(11):871~876 92复杂系统的分析与建模 [16] UFrish,BHasslachcr,YPomeau,LatticeGasAutomatafortheNavier-Stokes Equation.PhysRevLetts,1986,56:1505~1511 [17] BMadore,WFreedman.ComputersimulationoftheBelousovZhabotinskyreat-in.Science,1983,222:615~621 [18] AMSuksy.Crystalsymmetry.PhysBull,1976,27:475~480 [19] FlGerola,PSelden.Stochasticstarformationandspiralstructureofgalaxies. AstrophysicalJournal,1978,223:129~140 [20] ARosenfeld.PictureLanguages.NewYork:AcademicPress,1979.1~15[21] MMitchell,JPCrutchfieid,PTlimber.Evolvingcellularautomatatoperform computations:mechanismsandimpediments,PhysicaD,1994,75:361~391 [22] 刘慕仁,孔令江.用12bit格子气自动机模型模拟静止流和Couette流的温度分 布.物理学报,1993,42(6):874~879 [23] 吕晓阳,孔令江,陈光旨.一维几串性细胞自动机演化的临界相变现象分析.物理 学报,1990,39(1):1~9 [24] OBiham,etal.CellularAutomataModelforTrafficFlow.PhysRevA,1992, 46:6124~6132 [25] SWolfram.CellularAutomataasmodelsofComplexity.NATURE,1984,311 (4);419~424 [26] NGdeBruijn.AcombinatorialProblem.NedAkadWetcnProc,1946,49:758~ 766 [27] 张本祥,孙博文著.社会科学非线性方.黑龙江:哈尔滨出版社,1997 [28] ARSmith.Simplecomputation-universalcellularspaces.JACM,1971,18: 331~342 [29] ERBerlekamp,JHConnay,RKGuy.Winningwaysforyourmathematical plays.NewYork:AcademicPress,1973.255~300 [30] 方伟峰,杨立中,黄锐.基于元胞自动机的多自主体人员行为模型及其在性能化设 计中的应用[J].中国工程科学,2003,5(3):67~71 [31] 应尚军,魏一鸣,范英,蔡嗣经.基于元胞自动机的股票市场投资行为模拟[J].系 统工程学报,2001,16(5):382~388 [32] 刘慕仁,邓敏艺,孔令江.传播的元胞自动机模型(I)[J].广西师范大学学报 (自然科学版),2002,20(2):1~4 [33] 应尚军,魏一鸣,蔡嗣经.元胞自动机及其在经济学中的应用.中国管理科学, 2000,8:272~278 [34] 魏俊华,王安麟,陈武.城市交通信号自组织控制模型的研究.投稿论文,2003,5[35] JyuhachiODA,WangAnlin,etal.StudyonStructuralOptimizationTechnique usingEvolutionaryCellularAutomata(LocalDirectRuleBasedonNewTransitionFunction),TransactionsofJSME,68~665A,p15~20(2002,1) [36] 王安麟,王炬香,刘传国,胡宗武.基于CA的结构拓扑设计的研究———平面薄 第3章 复杂系统的元胞自动机自组织分析与建模 板加强筋拓扑形态创成的仿真.机械强度,2001,23(2):181~186 93 [37] 刘传国.上海交通大学毕业论文(指导教师:王安麟),基于CA的结构形态设计的 初步研究.1999 [38] 苏敏.上海交通大学毕业论文(指导教师:王安麟),基于CA的城市汽车流自组织 方法初探(控制模型与仿真技术的研究).2002 [39] 漆安慎.细胞自动机与自组织过程.科学(季刊),41卷8期,168~172 [40] 应尚军,魏一鸣,范英,蔡嗣经.基于元胞自动机的股票市场投资行为模拟.系统工 程学报.2001,16(5) [41] 吕晓阳,孔令江,刘慕仁.细胞自动机的演化与计算理论.华南师范大学学报,1996 (2),43~49 第4章 复杂系统的遗传进化 分析与建模 所谓进化计算(EC:EvolutionaryComputation)是一门新兴学科,它是研究仿照生物进化自然选择过程中所表现出来的优化规律和方法,对复杂的工程技术领域或其他领域提出的而传统优化理论和方法又难以解决的优化问题,进行优化计算、预测和数字寻优等方面的一种计算方法,这类算法又称进化算法(EA:EvolutionaryAlgorithm)。进化计算大体上包括遗传算法(GA:GeneticAlgorithm)、进化规划(EP:EvolutionaryProgramming)、进化策略(ES:Evolu-tionaryStrategy)三方面内容。本章主要以遗传进化为主线,概述遗传算法以及单纯型遗传算法,提示GA的有关规则的应用,遗传算法在工程系统中的进化分析与建模。 4.1 遗传算法与进化过程 克劳斯・迈因策尔在其《复杂性中的思维》中指出“:在传统的达尔文观点中,生物进化———它们的建模必须采用复杂动力系统———有两种重要的力量在起作用:突变压力和选择。在生物学群体中,个体的行为惟一受其基因支配,新型个体的放大相应于通过突变的自然选择的达尔文进化,这是系统中自发出现的。在高等动物的情形,有了行为变化‘(创新’)和通过信息来适应的可能性。在生态学进化中,新的生态生境出现了,它们为特定的物种所占据。显然,进化没有某种简单的图式,而是某种不同等级的复杂的变化和稳定化策略,它们是从前生物进化到生态学进化中形成的,最终是具有人的学习策略的文化进化。“复”杂系统探究方式显示出大量的可能的进化,其方向难以预料,由随机涨落引起。全局的优化是没有的,全局的收益函数也是没有的,全局的选择函数同样是没有的,其他简化的进化策略仍然是没有的,发生的只是一系列的接近分叉点的不稳定性。” 4.1.1 进化算法的概述 进化计算体现了生物进化中的四个要素,即繁殖、变异、竞争和自然选择,目前是泛指基于生物进化原理的各种仿真计算方法的总称。从历史上看,进化计算主要是以下面三种形式出现的:遗传算法、进化规划、进化策略。进化计算的 第4章 复杂系统的遗传进化分析与建模95 各种具体实现方法是相对提出的,相互之间有一定区别。ES是若凯伯(I.Rechenberg)和斯卡威弗(H.P.Schwefel)于20世纪60年代初在德国合作研究时创立的。ES假设不论基因发生何种变化,产生的结果(性状)总遵循零均值和某一方差的高斯分布。它与GA的主要区别是没有交叉算子,全部依靠设计各种不同的变异算子来产生后代。目前采用多母体产生多后代的方法,用(μ+λ)-ES或(μ,λ)-ES表示。前者指μ个个体产生λ个后代,然后这μ+λ个个体参与竞争,并选择最优的λ个后代遗传到下一代。后者表示仅λ个后代遗传到下一代,μ个母体全部被替换。EP是由L.J.Fogel在20世纪60年代中期建立的,它利用有限自动机的原理产生后代,其基本算法与ES类似,也仅有变异算子。群体搜索策略和群体中个体间的信息交换是进化计算的两大特点。其中的三种算法既有很多相似之处,同时又有很大的不同。进化规划和进化策略都把变异算子作为主要的搜索算子,而在遗传算法中变异只处于次要地位;另一方面,交叉在遗传算法中起着重要作用,而在进化规划中完全被省去,在进化策略中与自适应结合在一起使用,另外,遗传算法和进化规划都强调随机选择机制的重要性,而从进化策略的角度看,选择是完全确定的,没有合理的根据表明随机选择原则的重要性。进化规划和进化策略确定地把某些个体排除在被选择复制之外,而遗传算法中一般对每个个体都指定一个非零选择概率。若由性质来分,现有的进化计算方法与模型还可细分为: (1)最具代表性、最基本的遗传算法(GA)。(2)较偏数值分析的进化策略(ES)。 (3)介于数值分析和人工智能之间的进化规划(EP)。 (4)偏向进化的自组织和系统动力学特性的进化动力学(EvolutionaryDy-namics)。 (5)偏向以程式表现人工智能行为的遗传规划(GeneticProgramming)。(6)适应动态环境学习的分类元系统(ClassifierSystem)。 (7)用以观察复杂系统互动的各种生态模拟系统(EchoSystemandetc)。(8)研究人工生命(ArtificialLife)的元胞自动机(CellularAutomata)。(9)模拟蚂蚁群体行为的蚁元系统(AntSystem)。 对进化计算的研究之所以有意义,在于它是一种“鲁棒性”的方法,即它能适应不同的环境、不同的问题,并且在大多数情况下都能得到比较有效的满意解。与传统的优化算法相比,进化计算具有以下几个特点: (1)对问题的整个参数空间给出一种编码方案,而不是直接对问题的具体参数进行处理。 (2)从一组初始点开始搜索,而不是从某个单一的初始点开始搜索;搜索中用到的是目标函数值的信息,可以不必用到目标函数的导数信息或其他与具体 96复杂系统的分析与建模 问题有关的特殊知识;搜索中用到的是随机变换规则,而不是确定的规则。 (3)有关进化计算的理论研究成果目前还不是很多,尤其是进化规划和进化策略几乎没有什么理论基础,但它们的实用性及应用前景吸引了大批的学者来研究。由于Holland及其同事的长期努力,在遗传算法的数学基础方面做了许多工作,如提出了模式定理,证明了简单遗传算法的收敛性等,因此遗传算法的理论研究成果相对成熟一些。 4.1.2 遗传算法的决策机理 传统的函数优化算法局限于规则的凸函数。但现实中遇到的问题往往是多模态、不连续或不可微分的。随机取样方法已被用于这类函数的优化。传统搜索技术需要用到原问题的一些特性来确定下一个样本点,如梯度、Hessian矩阵、线性条件和连续性条件,与此相比,随机搜索技术不需要做这种假设,下一个样本点是用随机取样的决策规则得到的,而不是前面提到的确定性决策规则。正是由于这样的原因,随机搜索算法不受问题性态的,而且能够求解出优化问题的全局最优解,所以在近年来获得了广泛的应用。 随机搜索技术最早用于MonteCarlo方法,该方法能找到全局最优点,但由于缺乏搜索方向,始终处于随机找点的状态,导致很多并不理想的点重复出现数次,浪费大量的时间,所以该方法虽然有效,但其固有的缺点了它的使用。其次出现的是模拟退火法(SimulatingAnnealing-SA),该方法早在1954年提出,但直至1982年才经改进,并被引入优化计算。该法的基本思想是对固态或固液态混合物加热后再冷却的退火过程的模拟。也即以某一温度开始,对某一随机选取的系统状态进行扰动。每次随机选取一个小的扰动,并计算它对系统能量的影响。通过多次重复这样的小扰动来模拟温度T下系统的热平衡过程。当这一过程用于优化时,假设优化过程中每一中间解都是物理系统的一个微观状态,让T从一个高值T0缓缓下降,在每一瞬时,用Metropolis抽样法在计算机上模拟该系统在瞬时Ti值下的热平衡状态,并随机扰动产生一个新状态,求出两个状态间的能量差,并以e-ΔE/T接受SI′为新的当前状态。如此继续,直至T→0时当前状态就是概率为1的全局最优解。模拟退火法从某种意义上综合体现了MonteCarlo法和瞎子爬山法的思想。它在搜索过程中能在某种程度容纳过渡性的非优解,并通过扰动不断越出局部最优解,寻求全局最优解。用它得到全局最优解的概率较大。但此类方法的效果对控制系数的恰当选取十分敏感,而且搜索效率较低,因而其应用受到。 遗传算法是在其后提出并被广泛采用的一种随机优化方法。遗传算法是一类借鉴生物界自然选择和自然遗传机制的随机化搜索算法,是由密西根大学的浩兰德(J.Holland)教授于1975年提出的,Goldberg(19)又将遗传算法推进 第4章 复杂系统的遗传进化分析与建模97 了一大步。遗传算法的主要特点是群体搜索策略和群体中个体的信息交换,搜索不依赖于梯度信息。这种算法能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程,从而得到最优解或准最优解。由于遗传算法简单、通用、鲁棒性强,适用于并行分布处理,使它的应用范围很广,在组合优化问题求解、自适应控制、规划设计、机器学习和人工生命等领域都有广泛的应用价值。 4.2 复杂系统的遗传算法建模技术 4.2.1 遗传算法的概貌 1.什么是遗传算法 为了简单而通俗地说明问题,首先在图4-2-1中定义一个变量x的函数f(x),且f(x)在区间[x1,x2]内存在最大值fmax或最小值fmin。GA的功能之一就是快速求解类似这类问题的最大值fmax或最小值fmin。一般地讲,GA以模拟生物进化过程为基本原理,是适用于所有最优化搜索问题的方法。GA在计算机中设定假想生物集团,其中适应所处环境的生物个体,其生存概率也相应高。利用生物集团中个体的适者生存、劣者淘汰的仿真过程,实现基因和生物集团的进化。由生物集团的进化思想,用计算机仿真解决工程课题,需要编制GA的程序。但是,GA的编程存在以下特点: 图4-2-1 函数f(x)的最大值或最小值搜索问题 (1)程序无详细的模式。 (2)各种规则和参数设定的不确定性。 这些特点,从一个侧面来讲是GA的缺点,从另一个侧面来讲也决定了GA对解决各类问题具有柔软的适应性,可广泛地适用于各类最优化问题。追溯GA的发展历史,20多年前在美国开始对其研究,至今已在工程应用各领域产生 98复杂系统的分析与建模 了巨大的影响。今后其研究必将具有广阔的前景。 2.遗传算法的最优搜索 GA适用于无符号整数变量空间的最优化搜索问题。设图4-2-1的变量x为整数(x∈[0,255])的前提下,用简单的循环算法,可顺序求出f(0),f(1),…,f(255)的值,即进行256次计算可得到fmax的值。 可是,一般此类搜索问题的变量y的定义域是很大的。例如,变量y∈[y1,y2],则可将y的实数域[y1,y2]线性映射到无符号整数区域[0,2],其中n为1000的话,变量y的编码共2 1000 n ≈10 300 个。假如,计算机每秒计算1000个搜索 8 300 点,一天中只能计算1000×60×60×24≈10个,所以全部计算需要10÷ 108≈10292天≈102年。108年是1亿年。可以想象对此类问题,从原理上是可解的,但实际上却是不可能得到解的,通常把它叫做NP问题。从工程最优化搜索的角度来讲,并不一定要求出其真正的最优解,只要能求出其最优解附近的较优解,在实用上已可满足。GA在离散组合空间具有高效率搜索的特点,GA的方法可以高效率地搜索设定的搜索空间,得到满足实用的较优解,不失为一种最优搜索的方法。 3.遗传算法的基本思路 GA在搜索空间中的搜索并不是以单个搜索点顺序进行的,而是使用若干个搜索点(生物个体)并行进行搜索的。一个搜索点,作为一个带有遗传情报的假想生物个体,即简单作为一个生物个体来对待。若干个生物个体即构成了生物集团。首先,相对于各生物个体,计算出其生物个体对所处环境的适应度。以图4-2-1所示为例,可以把x作为个体,把f(x)作为x所处环境的适应度来处理。然后,淘汰适应度低的个体,增殖适应度高的个体。如此进行世代交替仿真,实现进化(最优化)计算。算法中相对于实际的增殖,GA以基因型的交叉以及突然变异操作来进行。最后求出非常高的个体,即max(f(x))的xmax值。 以上就是GA的基本思路,其具体的操作以图4-2-2来形象地说明。GA的内部处理过程先作为一个未知的黑盒看待。相对给其一定数位0~1字符串的输入,将会得到其评价。问题是输入怎样的0~1字符串,才能得到好的评价。假如随意地输入若干个0~1字符串,比较出其中比较高评价点所具有的字符串前提下,在考虑哪些部分会给大的评价点的同时,进行字符串的局部复制或变更,制作出新的字符串群。如此反复进行使字符串群的所具有的平均评价点升值。其过程大略如下: (1)首先随机地产生字符串。 (2)参照高评价点的字符串群,通过部分复制和部分修正产生新的字符串群。在全体评价点低的情况时,对字符串进行大幅度的修正。 (3)在全体评价点高时,对字符串进行小幅度的修正,更详尽地决定字符串 第4章 复杂系统的遗传进化分析与建模99 的细部。 GA的操作就是实现对于个体的基因型进行这样简单基本操作的反复过程。 图4-2-2 遗传算法的基本思路 4.2.2 单纯型遗传算法 单纯型遗传算法,反映了GA的基本思路和操作方法,对于理解GA是极其重要的。在本节里,概要地阐述单纯型遗传算法(SGA)的计算流程。 1.假想生物及其环境的设定 在进行假想生物集团的仿真之前,必须进行若干设定。1)设定个体的染色体和基因 首先,设定个体(individual)的染色体(chromosome),即决策矢变量的编码字符串,也就是设定假想生物在进行生殖时,上世代个体把怎样的数据内容,以怎样的形式遗传给下世代的子孙个体。染色体如图4-2-3所示,一般由若干个基因(gene)构成。矢变量中的各分量则对应于各个基因,所处的位置为各基因位(genelocus)。基因位可理解为表现染色体中各基因所在位置的一种坐标。 图4-2-3 染色体,基因和基因位 100复杂系统的分析与建模 各个体(染色体)的内部表现形式叫做基因型(genetype),即矢变量的编码结构。表现基因型的形式可以是任意的,但是一般使用0和1的排列方式。在这种方式下,每一基因位的基因用几位字符串来表示,要根据实际决策矢变量中各矢变分量的具体情况而定。例如,某矢变分量为一电路开关的闭合,其可能状态只有两种,用一位字符即可表示其基因。再例如,图4-2-1中变量x为整数(x∈[0,255]),则用八位字符串作为其基因。另外,图4-2-1的最优化问题的矢变量只有一个分量,其基因型也就是其基因本身,用八位字符串表示。有关基因型的字符串长度,一般为固定长度形式,但随着世代交替的进行,让其基因型趋于复杂化,以满足进化的需要,也可以选择可变基因型长度的GA算法。 2)表现型的设定 将基因型经过某种变换处理后的结构形式,叫做表现型(phenotype),即决策矢变量的解码结构。在许多最优化问题中,表现型源于基因型。有些情况下,随着世代交替,基因型变得复杂化和多样化,使得进化过程变得复杂和困难。为此,需要对基因型进行某种变换处理,用表现型来表示。表现型的设定方法没有固定的模式,必须根据问题的实际设定变换处理的方法。在图4-2-1中,用八位字符串表示整数决策变量x∈[0,255]的表现型,即表现型=基因型。 3)设定适应度的计算方法 基因型、表现型设定后,应该设定表示各个体对环境的适应能力———适应度(fitness)的计算方法。适应度就是把搜索空间中的各搜索点作为各个体对待,相当于用个体所持的遗传信息来表现其所在空间位置的相应目标评价。图4-2-1中的最大值搜索问题,可用各个体的基因型所表示的变量x位置的f(x)值,作为适应度来处理。 适应度的计算方法,也没有固定的格式,必须根据实际问题适当地设定。一般地讲,求解问题比较复杂,其适应度的计算方法也将会较复杂。再者,某个体的适应度,并非一定是同其他个体无关而进行简单计算得来的。有时也需要考虑同其他个体的关系而设定适当的计算方法。例如GA在人工生命(artificiallife:AL)的应用中就必须考虑。总之,为了在假想生物进化中反映自然淘汰(naturalselection)的原理,适应度从各个体生存的可能性角度,给出了评价个体,表现个体的一个定量尺度。 2.单纯型遗传算法的计算流程 在以上假想生物和环境的设定完成后,SGA将服从如图4-2-4所示的计算流程,使假想生物集团(population)进化。以下按图4-2-4的框图顺序予以简单说明。 1)产生初始生物集团 GA在搜索空间中设定若干个个体(即搜索点),由这些个体组成生物集团。 第4章 复杂系统的遗传进化分析与建模101 搜索开始时,问题的解完全是未知的,因此设定怎样的个体较好也完全是未知的。通常,初始生物集团用随机数随机发生。产生的个体总数为N,个体用Ii(i=1,2,…,N)表示。个体Ii的基因型用Gi表示。 对图4-2-1的最大值搜索问题,用下式随机地设定初始生物集团: Gi=rnd(255) n随机数的函数。 2)计算个体的适应度 计算生物集团中个体Ii与环境的适应度F(Ii)。 3)淘汰、增殖计算 SGA的生物集团淘汰(selection)和增殖(multiplication)处理,由简单的生殖(reproduc-tion)处理构成。从现世代 图4-2-4 SGA的处理流程 (4-2-1) 式中:rnd(n)(n为自然数)是产生从0~ N个个体Ii~IN中,允许重复随机地选择N个个体,决定出下世代的N个个体。某个体Ii作为下世代个体,其被选中的概率为P(Ii)用下式计算: P(Ii)= F(Ii)1F(Ii)N∑j=1 N 上式中,右边的分子是个体Ii的适应度,分母是现世代生物集团的平均适应度。此即为各个体在下世代生存的可能性与自身的适应度成比例。因此适应度高的个体,作为下世代个体被选中的概率也就越大。决定下世代个体的处理,可形象地用图4-2-5的轮盘赌(roulette)来说明。 在图4-2-5中,设定对应于各个体Ii(i=1,2,…,N)所占有的扇形角度θi(I=1,2,…,N)与f(Ii)(i=1,2,…,N)成比例。SGA中的淘汰和增殖操作,就是将轮盘赌随机地转动N 图4-2-5 与适应度成比例 的选择概率 次,每次与箭头与轮盘位置相重合(见图4-2-5),即与适应度成比例,概率地决 102复杂系统的分析与建模 定选中的个体。如此操作就等价于允许重复决定N个下世代个体的做法。 在这种选择方式中,适应度高的个体作为下世代个体被选中的可能性就大,即使相对于适应度低的个体,也存在着被选中为下世代个体的可能性。只选择适应度高的个体,固然其生物集团的收敛速度会快,但也易陷入局部最优解的误区。 如图4-2-6所示那样,假如现世代的个体有I1~I5,下世代只选择了I1~I3,适应度高的三个个体,可以直观地看出,因为下世代生物集团全部汇集在极大值P1的周围,个体不能到达最大值P2的可能性很大。相对于这样的问题,让生殖的下世代个体在适应度最低的5的附近也具有存在的可能的话,个体到达P2的可能性也会大。也正因为如此,为了防止在淘汰和增殖操作中有可能出现生物集团失去多样性的问题,还将进行基因型的交叉和突然变异操作。 4)基因型的交叉 从被产生的N个个体中随机地只选择M组两个个体的配对,对各配对进行交叉(crossover)操作。进行交叉的概率叫做交叉率。 交叉是把两个个体的基因型以随机的方式,在其对应的基因位进行部分交换的操作。SGA常用1点交叉(one-pointcrossover)来进行。图4-2-7是1点交叉的示例,基因型Ga、Gb作为一组被选中的配对个体Ia,Ib,其基因型用Ga={11001010},Gb={11100111}表示。 图4-2-6 局部最优解的示例图4-2-7 基因型的1点交叉示例 这时,将基因型在被随机选定的交叉位置切断。如果基因型为长度n的字符串,则可供选择的交叉位置有n+1个。在图4-2-7的示例中,交叉位置是由左第四和第五字符之间的位置。由交叉所生成的下一代个体Iab1、Iab2的基因型Gab1,Gab2用下式表示: Gab1={11000111}Gab2={11101010} (4-2-2)(4-2-3) 然后,个体Ia、Ib由Iab1、Iab2所取代。这就是基因型的交叉。基因型的交叉 第4章 复杂系统的遗传进化分析与建模103 是世纪生物生殖过程的模拟。 由交叉所生成的个体Iab1、Iab2是继承了上一代个体Ia、Ib遗传信息的个体。如此处理,使生物集团中的基因型具有多样性,变得丰富多彩,实现基因型的进化。在初期阶段的生物集团中,本来具有多样性的基因型个体群,由交叉又会产生各种各样的新个体,整个生物集团的个体群并没有发生倾向性变化。另一方面,随着进化的进行,生物集团中的基因型逐渐出现某种倾向,即无论哪个个体,其基因型已无大的差别,此时由交叉产生的个体基因型与上一代个体具有相当大的相似性。也就是说,GA的初期阶段是在搜索空间内进行全局性的调查;在掌握了其倾向性后,再进行更详细地搜索,求出其全局最大值。 5)突然变异 把突然变异(mutation)发生的概率叫做突然变异率(mutationrats)。突然变异有各种各样的方式,SGA的突然变异是以突然变异率的概率方式,在每个基因位上进行变更操作,即以突然变异率确定发 图4-2-8 突然变异的示例 生突然变异的基因位后的操作,所进行的方法是若其基因位是0则变为1、是1则变为0。图4-2-8则是SGA的突然变异的示例。 在图4-2-8中,即由突然变异率随机地确定发生突然变异,因此让其基因位上的字符发生相对变更。由突然变异的操作,会产生出仅由交叉而不可能产生的基因个体。从保持生物集团个体的多样性观点来解释,就是可能产生远离现有集团个体群的新个体(新搜索点),使搜索由局部最优解中脱出。应该注意的是,如果突然变异率过大,将会使基因型失去由交叉所持有的上代遗传特征。一般,突然变异率在0.1%~0.5%为好。 6)生物集团的评价 评价已生成的下世代生物集团是否满足进化仿真的评价基准,叫做生物集团的评价。评价基准一般由实际问题而定。GA的典型结束评价基准如下: (1)生物集团中的最大适应度比某一设定值大。(2)生物集团中的平均适应度比某一设定值大。 (3)相对于世代进化次数,生物集团的适应度增加率仍在某值以下,在一定时间内没有大的变化。 (4)相对于世代进化次数,达到设定的次数。 (1)和(2)是标准的评价基准。(3)表示个体进化一直处于低适应度环境下,生物集团处于搜索空间的局部最优点附近,搜索以失败而告终。(4)与(3)同样,表示其搜索也许已以失败而告终。 在满足评价基准的情况下,即可结束进化仿真。搜索成功时,仍把现生物集 104复杂系统的分析与建模 团中的个体表现型作为所求工程问题的解。在不满足评价基准的情况下,进化仿真反复进行。 3.单纯型遗传算法的特征SGA具有以下三个基本操作: (1)淘汰,增殖:以个体的适应度高低成比例地决定各个体在下世代生存的可能性。 (2)交叉:以随机性质的交叉率选择两个个体,并对其个体的基因部分进行交换。 (3)突然变异:以突然变异率随机地变更某基因位的值。 以上操作虽然很简单,但实用上对各类搜索空间的搜索却是有效的。SGA中的各计算参数,如生物集团中的个体总数、交叉率、突然变异率等,至今仍无固定的设定模式,只能根据试算,或由经验给以设定。在此方面,有必要对GA算法作进一步的考察和研究。 GA同传统的数学规划方法相比较,具有以下的特点和问题: (1)由若干个搜索点同时进行搜索,通过个体间的相互协调,具有可能避开其局部解的功能。 (2)因为不需要使用评价值的微分,所以适用于不连续评价函数的求解问题。 (3)其具体的操作方法(淘汰、增殖、交叉和突然变异等)无一般的模式,需要根据实际求解问题,凭借经验和试算进行编程。 (4)大多数参数需人为地确定。 4.2.3 模式定理(schematatheorem) 现阶段关于GA的理论解析还很不完善。由J.H.Holland提出的模式定理是GA的基本定理。这个定理为求出基因型中的基因排列,在进化仿真中具有多大的生存概率,提供了计算方法。本节简要地叙述模式定理。 简单地说,schemata(单数形式为schema)是夹杂着字符*的字符列集合。例如,schemataS字符可表示为四个文字列。 S=*0011*01={00011001,10011001,00011101,10011101}(4-2-4) 这里:字符*有两种可能性,可表示为0或1。这时,schemataS的阶数(or-der)O(S)以及构成长度(defininglength)σ(S)的定义如下: O(S)=(全长L)-(*的个数) σ(S)=(S中从最右到最左的*字符间的距离) 即式(4-2-4)中schemataS的O(S)=6,σ(S)=6。 在无交叉和无突然变异、生物集团个体总数N一定的情况下,schemataS (4-2-5)(4-2-6) 第4章 复杂系统的遗传进化分析与建模105 在世代交替中的平均增加率R由下式表示: R= 1N N f(S)Gi (4-2-7) ∑f i=1 式中:Gi为个体Ii的基因型;f(S)为相对于S所表示的所有schemata的平均适应度。 式(4-2-4)的S用下式计算:f(S)= 1{f(00011001)+f(10011001)+f(00011101)+f(10011101)}4 (4-2-8) 式(4-2-7)中的右边的分母表示集团全部个体的平均适应度。设交叉率为Pc(0≤Pc≤1),那么因交叉schemata被切断的概率Rc由下式定义: (S)Rc=PcσL-1 (4-2-9) 在时刻t,设定具有属于schemataS基因型的个体数期待值为P(S,T)。突然变异率为Pm时,schemata不发生突然变异的概率是(1-Pm)O(S)。因为交叉和突然变异是相互的,所以下式成立: P(S,t+1)≥P(S,t) ≈P(S,t) 式中:f=平均适应度=1N N f(S)1-Pcσ(S) L-1f 1-PmO(S) (4-2-10) f(S)1-Pcσ(S)-O(S)L-1ffGi ∑ i=1 ,N为个体总数。这里,因突然变异率 Pm比1充分小,把(1-Pm)O(S)用泰勒展开省略了二阶以上的项。不等号表示省略了因交叉和突然变异产生的由其他schemata混入的高阶成分。 式(4-2-10)叫做模式定理,或者叫做遗传算法的基本定理。其定性表述如下:schemataS的构成长度σ(S)愈短,阶数O(S)愈低,平均适应度f就愈高,在下世代生存的可能性就愈大。 以上的模式定理说明,在基因型中存在适应度高、构成长度短的schemata的情况下,其schemata被交叉切断的可能性低,随着世代交替其数量将增加。这样的schemata被叫做积木(buildingblock)。在进化仿真中,这样的积木有其若干种类的组合,会产生具有高适应度的优秀个体。这就是所谓的积木假说。 模式定理虽然给出了调查某种schemata生存可能性的手段,但是并不能解析在进化过程中新生成的schemata的动态。关于在进化仿真中变化着的基因型的数学解析和分析方法的研究,将是今后的重要课题。 106复杂系统的分析与建模 4.2.4 遗传算法的有关操作规则和方法 GA算法的流程同上节所述的SGA大同小异。在处理实际问题时,常常需要根据问题的特征,考虑对其淘汰、增殖、交叉和突然变异等规则以及适应度的设定和定标等予以修正。以下介绍一些规则供参考。 1.淘汰,增殖规则的扩充 在SGA中,选择下世代个体时,由与各个体的适应度成比例的概率决定其个体被选中的可能性。假如完全服从这一基本方式,那么在生物集团个体数少的情况下,可能会产生现世代中具有最大适应度的个体,作为下世代的个体偶然未被选中的情况;生物集团个体的分布偏向适应度低的个体的情况。相反,由于只选择具有高适应度的个体,生物集团将陷入局部解的境地。为了回避这样的问题,研究者提出了各种各样的扩充规则。 1)概率淘汰的方法 在进化仿真中,按照与各个体适应度成比例选择世代个体的情况下,具有高适应度个体占主导地位时,低适应度的个体作为下世代个体被选中的可能性就非常小。因此,从局部解脱出也就变得困难。由此,我们可以不是单纯地采用相对于适应度的大小成比例关系选择方法,而是把适应度按大小顺序排序,决定其作为下世代个体被选中的可能性的方法。即使这样,有时也会出现适应度的大小难以直接反映进化仿真的情况。 2)优秀个体保存战略 优秀个体保存战略即把现世代个体中适应度最大的个体强制性地在下世代中给以保存的方法,如图4-2-9所示。在这种方式下,生物集团中的最大适应度的值,随着世代交替地进行是单调增加的。但是,当生物集团取得局部解时,最大适应度的值不仅不会增加,而且随着世代交替地进行,现时刻最大适应度个体的影响将会扩大,更难以从局部解中脱出。 图4-2-9 优秀个体保存战略 第4章 复杂系统的遗传进化分析与建模107 3)比例淘汰加交叉增殖的方法 把生物集团中的个体群按适应度的大小顺序排列后,将一定比例的下位个体无条件地淘汰掉,再将上位适应度高的个体配对进行交叉,产生新的基因型,实现增殖。此方式(见图4-2-10)在进化仿真顺利时,可高速地收敛于最优解。 图4-2-10 比例淘汰加交叉增殖的方式 但是,与优秀个体保存战略相同,当生物集团陷入局部解时难以从局部解中脱出。 总之,淘汰和增殖规则的原则是,尽可能地使高适应度个体(或者基因型的一部分)的schemata具有更高的生存可能性。但是,相对于具体问题,程序的最优淘汰、增殖规则又必须根据实际经验来确定。 2.交叉操作的扩充 SGA中使用的交叉是最基本的1点交叉方式。以下,介绍几种典型的交叉操作。 1)2点交叉(two-pointcrossover) 图4-2-11所示的2点交叉方式不是把基因排列的基因型作为一列字符串, 108复杂系统的分析与建模 而是把最后的字符和首位字符连接成环状排列来处理。在环上随机地设定2点交叉位置,把环分割成两个弧,相互置换其相同的一部分,就构成了子孙基因的排列。 图4-2-11 2点交叉的示例 2)多点交叉(multi-pointcrossover) 多点交叉是2点交叉的扩充。多点交叉也与2点交叉相同,把基因的排列以环状来处理。然后,在若干个位置把环进行分割。这时,交叉位置的数目是奇数时,因为亲代A和亲代B的基因单元(弧段)相互等数置换有剩余,因此交叉位置的数目必须为偶数。即把多点交叉用2点交叉来表示时n应为偶数。n为奇数的多点交叉,在定义时需要丢弃n个交叉位置中的一个,或者需要把原来基因型的最后(尾部)再假设有第n+1个交叉位置来处理。 3)交叉(segmentedcrossover) 交叉是交叉位置总数可变的多点交叉。其设定置换概率为Rs。例如,所谓置换概率Rs=0.2表示对于长度为L字符串基因,其期望长度为LRs。 4)均匀交叉(uniformcrossover) 均匀交叉,是在由亲代A和亲代B的基因型Ga、Gb产生的子孙基因型Gab 时,Gab的各基因占有亲代A的基因概率为P、占有亲代B的基因概率为1-P的交叉。P=0.5产生的子孙基因型用下式表示: Ga={11111111} Gb={100000000}Gab={10011100} (4-2-11)(4-2-12) 由式(4-2-11)和式(4-2-12)可以看出,子孙基因型Gab继承亲代A中L个基因中的P×L个,亲代B的(1-P)×L个基因。在对于问题难以判断用怎样的交叉合适的情况下,采用均匀交叉可以得到较好的搜索结果。 第4章 复杂系统的遗传进化分析与建模109 5)混合交叉(blendedcrossover) 混合交叉是在个体的基因型表示连续值的情况下,把两亲代的中间值作为子孙的基因型的交叉值的一种交叉。例如,在式(4-2-13)所示的亲代A的基因型Ga的值为255、亲代B的基因型Gb的值为1的时候,把表示其平均值128的基因型(式4-2-14)作为亲代A和亲代B之间的子孙基因型Gab。 Ga={11111111} Gb={00000001}Gab={10000000} (4-2-13)(4-2-14) 除以上的几种交叉方式而外,研究者提出了各种各样的交叉方式,在此不一一介绍。总之,使用的交叉方式是否合适,与要解决的问题、基因型的定义、适应度设定等密切相关。根据有关资料,1点交叉和其他的交叉相比较其性能较差。关于各种交叉操作的有效性,以及交叉的数学定义和交叉对于搜索过程的影响等,还需要在计算理论和解析方面作深入的研究。 3.突然变异规则的扩充 突然变异的作用是使由交叉产生的基因型具有多样性,即由突然变异,产生仅由交叉不能产生的基因型,使搜索空间域大些。其次,在生物集团陷入局部解的情况下,具有脱出局部解的可能性。突然变异规则的扩充的典型的方式是,让突然变异率相对于进化过程的变化而变化。通常,生物集团的进化在顺利进行的状况中,突然变异率一定,抑制在低概率水平。生物集团适应度的增加率减少,能够判断生物集团陷入局部解的情况时,突然变异率比一般情况时要大,使其增加发生同现有集团基因型相异的搜索点,提高脱出局部解的可能性。 4.引入适应度的定标 引入适应度的定标,主要是为了改善进化仿真初期和收敛时的淘汰功能。在生物进化仿真的初期,生物集团还不明确其方向性,各个体处于随机分布的状态。因此,偶然出现具有比其他个体适应度大的个体时,其方向虽然可能并不是真正的收敛方向,但生物集团的分布可能会出现偏向此个体方向的倾向,使生物集团被偶然性支配处于非常不稳定的状态,结果使生物集团不能到达最优点的可能性增高。为此,我们期望在进化仿真的初期阶段,相对于适应度的大小的淘汰不要太敏感。另外,进化仿真进入收敛的最后阶段,因为各个体的基因型已具有相当高的相似性特征,同进化仿真的初期阶段相反,期望选择优秀个体进行更深入的局部搜索,提高搜索精度,即相对于适应度的大小进行严密的淘汰。为了实现这样的操作,需要随着进化仿真进行现行状况,改变对其适应度值的解释方式。这种改变对其适应度值的解释方式的操作,就是对适应度的定标。 所谓适应度的定标(见式(4-2-15)),由既定的设定方法,计算出某个体Ii 的适应度的值f(Ii),代入函数G()中,把求出的值f′(Ii)作为个体Ii的淘汰以及增殖计算的依据。 110复杂系统的分析与建模 f′(Ii)=G(f(Ii)) 2-17)线性函数的情况。 f′(Ii)=a・f(Ii)+bf(Ii)=[f(Ii)]k 式中:a、b、k是常数。这里把式(4-2-16)的线性定标用图4-2-12表示。 图4-2-12的线性定标中,f′的平均值f′同f的平均值f相等,即f′=f。这样定标后,个体Ii的适应度的平均值f′服从下式的基本淘汰规则时,其子孙在下世代生存的可能性是1。 P(Ii)= f′(Ii)f′ (4-2-18) (4-2-15) 作为函数G(),有使用式(4-2-16)所示的线性函数的情况,也有使用式(4-(4-2-16)(4-2-17) 式中:P(Ii)是个体Ii作为下世代个体被 N 图4-2-12 适应度线性定标 选中的概率;f′= (I∑f′ j=1 j )/N,N为个体总数。 图4-2-12中的f′max决定了生物集团中具有最大适应度的个体在下世代中生存的个体数。若f′max=kf′,k=2,即在下世代中生存的概率个体数为2个;k=3,即在下世代中生存的概率个体数为3个。通常k的值在[1,2]取值。k=1相当于不进行定标。 相对进化仿真进行的状况,改变式(4-2-16)中的系数a,b的值,或者k的值,让直线的斜率发生变化,调解定标的效果。总之,进化仿真开始后的初期阶段,由图4-2-12中的直线A设定,适应度的值给与各个体的生存概率的影响将会降低。另一方面,生物集团到达收敛时,以图中大斜率的直线B进行,适应度的值给与各个体的生存概率的影响将会增大。 至今,根据GA的适用问题的不同,有各种各样的扩充算法。这些算法是属于古典GA,还是属于其他,极不明确。现在,GA的定义以及GA中操作方式的严密的定义尚不存在。在理论解析尚不充分的前提下,各种各样方法的尝试无疑是必要的。例如,由于同达尔文的进化论不同的进化论学说的出现,像不同观点进化论的讨论那样,有把GA以自由想象的方式进行扩充;也有开发非GA或者反GA的遗传算法的尝试。这些研究将促进以GA为代表的遗传方法不停留在经验的水平上,而在理论上逐渐趋于成熟。 第4章 复杂系统的遗传进化分析与建模111 4.3 遗传算法在工程系统中的进化分析与建模 4.3.1 财务规划问题的解法[5] 1.用于投资项目的内含报酬率分析 在财务管理中,投资项目通常是指对生产性固定资产的投资。在对投资项目决策分析时,有一种方法是比较各种投资方案的内含报酬率。投资方案的内含报酬率(以下简称报酬率)是指能够使投资方案的未来现金流入量等于未来现金流出量(即净现值为0)的贴现率(discount)。目前,对内含报酬率的计算通常采用“逐步测试法”。在该方法下,首先估计一个贴现率(i),用它来计算方案的净现值(np)。如果np<0,提高贴现率估计值到i+Δi进一步测试;如果np>0,则降低贴现率估计值到i-Δi进一步测试,直到找到一个满足条件np→0的贴现率,即为方案的内含报酬率。这种方法的计算速度受到初始贴现率(i)及其改变步长(Δi)的影响,具有很大的盲目性。而且若Δi的取值不当,会使求得的净现值在正数和负数之间来回震荡而不趋近于0。故通常在“逐步测试法”之后,还要运用“内插法”。如通过逐步测试法求得两个贴现率i1、i2,它们对应的净现值为a、b(a≥0≥b),然后用“内插法”,则内含报酬率(r)可由分式(ab)/(i1i2)=a/(i1r)求得。 当利用GA来解决这一问题时,可先随机给出一组20个不同解ratio[20]为初始种群,满足条件:(0≤ratio[k]≤1,0≤k≤19)。对这些解进行交叉、变异操作,最好可得到最优解。 这里,以一投资项目为例进行应用分析比较:若已知投资项目第0年需要投资20000元,第1,2年分别收回11800元,13240元,求其内含报酬率。 1)“逐步测试法”求其内含报酬率 在这一应用中,假设内含报酬率估计值i=16%,求得此时对应的净现值np=-11.,若Δi=1%,则估计值i应提高到17%,求得此时对应的np=242.53,由此可知实际内含报酬率r应在16%与17%之间。用“内插值”可求得r=16.04%,对应的净现值np=0.2。 2)借助GA程序求得内含报酬率 在应用GA程序求解时,仅需要设置种群规模、迭代次数、交叉率(Pc)、突然变异率(Pm)等参数及适应度函数。种群规模等参数取值大小的确定在遗传算法研究中还是一个热点:即参数控制(parametercontrol)。目前,应用遗传算法时,种群规模等参数的选取还依赖于设计者的经验和尝试。而适应度函数的确定则需要对具体问题进行具体分析。例如,求解该问题时以np的绝对值作为 112复杂系统的分析与建模 适应度函数。确定适应度函数后,需要确定优选的方法。如前所述,种群内个体间可进行交叉,而单个个体可进行变异,这时便会产生新个体。不考虑有异常个体(可直接除掉)的情况,新个体加上旧个体,种群规模将会扩大。若想保持种群规模不变,必须除掉一些个体。该过程即为优选。优选方法与适应度函数密切相关,因为并不知道r何时是最优解进而无法选优。鉴于净现值为零时所求的内含报酬率最优,故求解该问题时以np的绝对值作为适应度函数并把优选方法定为:净现值的绝对值(而不是净现值,因为净现值为负数时表示净流出)愈小愈好。对该问题求解的参数如表4-3-1所示。 表4-3-1 求解参数 人口数(popsize) 20 交叉率(Pc) 0.8 突然变异率(Pm) 0.2 迭代次数500 采用的交叉形式为算术交叉,以实数形式表示个体,如最优染色体为0.1604673。采用的以迭代次数为运行终止的条件。运算后求得r=16.04673%,其对应的净现值由公式np=|11800/(1+r)+13240/(1+r)2-20000|计算出,可得np=0.13。显然该方法求得的净流入更接近于零,这说明此方法求得内含报酬率更接近于真正的内含报酬率。这一实例说明了GA应用于财务管理的可行性和优越性。 2.GA在证券组合选择分析中的应用 风险分散理论认为:若干种股票组成的投资组合,其收益是这些股票的加权平均数,而风险不是这些股票风险的加权平均风险。故而证券组合的选择分析很有必要。其问题的实质是:在预期收益(E)既定的条件下使风险(R)最小;或者R在既定的条件下使E最大。 若分别以gi、wi表示第i种证券的收益及其在证券组合种的比重,Cov(i,j)表示证券i和j两者收益的协方差,n表示组合中证券的种数(通常2≤n≤5)。则 n E=R= ∑gw i i=1n n i=1 j=1 i ∑∑wwCov(i,j) i j 在传统的财务管理工作中,通常只运用了n=2的情况,而当n>2时较少考虑。因为当n>2时,要由两个式子求n个Wi(1≤i≤n),目前只能通过尝试来解决,计算量非常大。而运用GA可避免大量的尝试Wi的过程,且求解此类带约束的数值优化问题恰好能发挥GA的优势,往往能得到一个理想的结果。以GA解决了下面的实例:已知三种证券a,b,c的收益分别为20%、15%、30%,相 第4章 复杂系统的遗传进化分析与建模113 关的协方差为Cov(a,b)=0.53,Cov(a,c)=0.088,Cov(b,c)=0.067,求E=25%之时a,b,c的最佳组合。由于该问题种预期收益已知,求解该问题时以风险为适应度函数,并把优选方法确定为风险越小越好。借助于GA求解此问题的参数如表4-3-2所示。 表4-3-2 求解参数 人口数(popsize) 20 交叉率(Pc) 0.8 突然变异率(Pm) 0.2 迭代次数500 对该问题的求解同样是以实数表示个体,进行算术交叉,以迭代次数为终止条件。求得Wa=0.005,Wb=0.33,Wc=0.665,此时可求得R=0.1587,是一个理想的结果。 通过以上两个实例可以看出,GA作为一种解决数值优化问题的算法,在财务管理的数值优化(特别是带约束的优化)问题中有广泛的应用前景。可以设想,把GA广泛地应用于财务管理之后,将可逐步地实现财务管理中的计算智能化,从而让财务人员摆脱目前所承担的复杂计算工作,使财务管理工作逐步转移到财务方案的设计及财务模型的建立中去。 4.3.2 非线性强制振动解的解法[6],[7] 1.问题的提出 在各种机械约束条件下,用数学规划法求解非线性问题的解已被广泛应用。但是,问题的目标函数存在多峰性时,其搜索得到的常常不是最大值(或最小值),即存在陷入局部最优解的缺点。另外,相对于非线性振动系统,在同一激振外力和激振频率下,常常存在着复数解(非线性方程的初始条件依存性问题)。因此,在数学解法以及复数解之间的关系不明确的情况下,要同时求出这复数解,给最优计算模型的构筑带来较大的困难。另外,即使作为工程问题的近似解来考虑,因为数学规划法的搜索过程不仅过分依赖于搜索初始值,而且需要目标函数和约束函数的可微性条件,使得问题变得复杂或难以解决。相对于这类问题,因为遗传算法是以复数个初始值开始,仅用集团体搜索点的目标值评价进行搜索,所以有可能求得其近似最优解。这里,以1自由度Dulling型非线性方程共振域复数解的求解为例,介绍GA适用于此类问题的解法。同时,探讨解的设定、问题的模型化、适应函数的定义和算法等问题,并用数值计算的结果检验解法的有效性。 2.Duffing非线性方程 作为解析模型,考虑在大振幅强制振动下的两端固定的梁。梁两端被固定,由梁的挠度在梁内产生张力;大振幅时,会出现三阶硬化型非线性刚度。这样的 114复杂系统的分析与建模 非线性强制振动系统难以得到其严密的数学解,只能使用数值积分的方法求出其数值解。把下式 m¨x+cx+kx+bx3 中各系数设定为: m=2.56,c=0.32,c=1.0,b=0.05,P=2.5 设定其主共振域解为: x=Acos(ωt-y) (4-3-2) 把式(4-3-2)代入式(4-3-1),略去cosωt项的影响,可得到图4-3-1的近似频响曲线。相对于共振域可η=ω/ωn(ωn为线性固有振动圆频率),存在三个解。其中b是不稳定解,用通常的时间积分难以求得,只可能得到a和c两个稳定解。在此,共振域的频率比,η=1.6,在特定的初始条件xa0,xa0 xb0,xb0 =(10.0,0.0)和 =(11.0,0.0)下,分别用RKG法积分,可得到图4-3-2的时间响应曲 =Pcosωt (4-3-1) 线a和c。可以看出,其a和c稳定解由于初始条件的不同,其在图4-3-1频响 图4-3-1 频响曲线 图4-3-2 不同初始条件下的时间响应(η=1.6) 第4章 复杂系统的遗传进化分析与建模115 曲线上的振幅和相位也不同。这样的具有三阶正刚性的Duffing系统的共振,其频响曲线向右弯曲。定性地归纳其特性如下: (1)相对于激振频率存在复数解的频率范围。 (2)大振幅振动a和小振幅振动c的周期与激振周期相同。 (3)三个解中,位于a和c的中间的解b是不稳定解。稳定解a在上侧,c在下侧。 3.最优化问题的模型 这样的非线性问题的解析不存在一般性的方法。这里,利用最优化方法进行近似解析。根据以上的分析和图4-3-1所示Duffing系统的主共振特征,使用已知的信息,探讨同时求解复数解(稳定解)的最优化模型。设定下式: xi=uicosωt+visinωt+picos3ωt+qisin3ωt  (i=1,2),(t>t0) (4-3-3) 为问题的解,其稳定主共振谐波解的振幅Ai和相位ψi用下式表示: Ai= u2i+v2i (4-3-4)(4-3-5) Ψi=arctan(vi/ui) 个解必须在满足式(4-3-1)的微分方程前提下,构筑最优化模型。 设计变量: X={u1,v1,p1,q1,u2,v2,p2,q2}T 目标函数: J=m1J1+m2J2 式中: Ji= 两个解中按振幅大小顺序,把其振幅和相位定义为Aa和ψa、Ac和ψc。两 (4-3-6)(4-3-7) ∑mxij+cxij+kxij+bxij (m-k) 3 -Fj 2 xij=uicosωt+visinωt+picos3ωt+qisin3ωtFj=Pcosωtj  tj=jΔt i=1,2  k=t0/Δt  t0=2Nπ/ωn t0为目标函数开始计算的时刻。 约束条件:服从于以上所述的复数解的振幅和相位特征,列出以下条件:(1)关于振幅的不等式关系: g11= 2 4(η-1/3)/β-Aa<0 (4-3-8)(4-3-9) g12=Ac-Aa<0 (2)关于相位的不等式关系: 116复杂系统的分析与建模 g21=ψa-(π/2)-ψc<0g22=ψa-(π/2)<0 4.GA算法的适应度和流程 (4-3-10)(4-3-11) 以上的最优化问题具有以下特点:把复数解作为最优化问题的设计变量;把不确切的信息作为不等式约束条件。 1)适应度函数 同时求解复数个Duffing型非线性强制解的问题,前面给出了其模型。为了把此最优化问题变换成适用于GA的离散化最优组合问题,最终需要变换成关于适应度函数的最优化问题,这里变换成无约束最优化问题,把外点惩罚函数作为适应度函数。 f(X)=J+gmax(gj1)+max(gj2) 2)计算流程 使用适应度函数和图4-3-3所示的流程探索最优解。以下将使用的流程作一简单的说明: (1)二值化(BirthofStrings)。把连续最优化问题的设计变量用二进制数表示成离散变量。 (2)增殖(Reproduction)。淘汰使用了盘轮赌选择+优良保存战略。一般地说,赌盘轮淘汰选择从计算效率和内存容量等方面考虑,因个体集团不可能设定太大,所以某个体基因在集团中是被选择或被淘汰完全取决于淘汰压的概率波动。总之,作为最优化计算的流程,即使好不容易地出现了高评价的染色体,其遗传信息仍存在从集团中消失的可能性。因此,在增殖处理中,用同适应度成比例的概率对各个体的子孙进行淘汰处理后,把现在集团中适应度最高的个体作为下世代个体无条件地予以保存,此即优良保存战略。 (3)交叉(Crossover)。用1点交叉法进行处理。 (4)突然变异(Mutation)。对应于所运用的战略和强非线性问题,为了维持遗传的多样性,突然变异的概率要适当地设定得大些。 (5)探索空间的缩小(Zooming)。GA法是在离散化设计空间探索。因此,它具有即使探索到解的附近,也很难得到比较精确的最优解的缺点。这里,使用在经过若干世代探索求得的最小解仍没有变化的情况下,以最小解为中心缩小探索空间再进行探索的方法,以提高探索精度。 (6)计算结果。GA的计算参数如表4-3-3所示。所求得的解用表4-3-4表示,其主谐振解用图4-3-4表示。相对于世代进化过程,GA探索的适应度函数最小值变化用图4-3-5表示。考察图4-3-4可以看出,用GA所求的解同近似频响曲线的解比较,具有相当好的精度。 (4-3-12) 第4章 复杂系统的遗传进化分析与建模117 图4-3-3 计算流程 图4-3-4 GA的计算结果 118复杂系统的分析与建模 图4-3-5 GA的搜索过程中的误差 本例题,把GA应用于同时求解Duffing型非线性振动共振谐波的复数解问题,讨论了问题的模型、GA的适应度函数和具体的算法。通过计算实例,说明了求解非线性振动解的GA解法。 表4-3-3 计算参数 个体数(N)染色体长度交叉率(Pc)突然变异率(Pm) 表4-3-4 计算结果 ηX u1v1p1q1u2v2p2q2 1.5-2.36680.7206-0.01280.01083.01185.1702-0.17350.0422 1.6-1.73240.3294-0.00190.00392.99615.96-0.2000-0.0353 1.7-1.38750.1941-0.01370.01371.42757.0513-0.1549-0.2137 100840%0.10% 4.3.3 无序加工调度[14] 1.问题的提出 随着社会的日益发展,广大用户的要求越来越广泛和多样,这就要求生产形 第4章 复杂系统的遗传进化分析与建模119 式由“少品种,大批量”转为“多品种,小批量”,由此产生了柔性制造系统(FMS)。生产调度问题是指柔性制造系统中生产路径组合优化的问题。工件调度就是决定工件的加工顺序和各工件的开始加工时间,它可以分为两类:一类是有序加工类型(Flow-Shop)问题,各工件的加工路径一致;一类是无序加工类型(Job-Shop)问题,各工件的加工路径不一致。显然,Job-Shop问题更一般,对这一问题的研究和解决更有意义。对Job—Shop问题可作如下描述:有M台机床N个工件,根据每个工件的加工工艺要求,每个工件使用M台机床的顺序及每个工序加工时间已经给定,问如何把这N个工件在每台机床上排序,使某个指标(如总的加工时间)最小。虽然这只是机械加工中的一个问题的描述,但该问题应用广泛,只是出于直观性的考虑,我们仍然沿用机械加工行业的术语。 对Job-Shop调度问题的最初研究是要寻找问题的最优解,这些研究方法的缺点就是算法的时间花费随着问题规模的增大而呈指数增长,而在实际应用中往往并非要求给出问题的最优解,一个好的次优解往往也会令人满意,并带来可观的经济效益。这导致了寻找次优解研究的深入开展。近年来,随着计算机技术的飞速发展,一些新的优化方法得到了迅速发展,如神经网络法、模拟退火法、遗传算法等。由于遗传算法不要求可微,求解过程简单,并行搜索,适用范围很广,更受到广泛关注。对于生产路径固定的Flow-Shop问题,非常适合于应用遗传算法来解决,由Falkenauer和S.Bouffouix针对排序问题提出的LOX算子很有效。然而,应用遗传算法解决生产路径不固定的调度问题将会遇到很大困难,一方面,遗传编码不易构造,另一方面,常规意义上的交叉操作无效。 下面针对遗传算法解决生产路径不固定的调度问题所产生的困难,提出了一种新的遗传编码方式,并相应采用新的遗传算子,应用于某冷轧厂的精整钢卷调度问题,进行了仿真分析。 2.困难的具体分析及解决困难的思路困难主要有两个: (1)遗传编码不易构造。在工件排序时必须对它所分配的机器和它在机器上的加工顺序同时编码。常规的遗传编码都是构造单一的串,但将Job-Shop调度问题表达为单一的串不大容易,于是有了采用多个子串的先例。 (2)常规意义上的交叉算子无效。每台机器上的加工操作数目不固定,不同基因串上同一位置标识的操作加工序列可能不一致,导致常规意义上的交叉算子无效。此困难产生的根本原因是Job-Shop问题的约束不易表达导致交叉操作生成过多坏死解。 根据以上对困难的具体分析,我们提出以下解决困难的思路: (1)设法构造单一数字串作为Job-Shop问题的遗传编码。因为多个子串的编码方式不但占用过多的内存而且相应的交叉、变异等算子过于复杂,导致求 120复杂系统的分析与建模 解时间变长。 (2)既然Job-Shop问题的约束不易表达,那么我们换一个方向,即应用一定的规则将常规的交叉算子所产生的坏死解变成可行解。 3.问题的遗传编码方式和相应算子 本文为应用常规的交叉和变异等算子的方便,仍采用单一数字串作为生产路径不固定计划调度的遗传编码。编码的长度是一定的,即工件集中的工件数目一定,但每一位数值表达两个信息,即它所分配的机器和它在该机器上的加工顺序。 例如,一个工件集有10个工件,一个加工机器集有4台机器,那么{1.01,1.02,1.03,2.01,2.02,2.03,2.04,2.01,3.02,3.03}就构成了一个染色体,每一位基因小数点前面的数字代表该工件在哪一台机器加工,小数点后面的数字指出在这台机器上该工件排第几位加工。比如,在这个染色体中第五位是2.02,表示第五个工件在第二台机器上排第二个加工。 交叉算子。这里交叉算子采用两个体之间单断点方式交叉。随机地在匹配集中选取两个父体A和B,假定A和B分别为: A={1.01,1.02,1.03,2.01,2.02,2.03,2.04,3.01,3.02,2.03}B={3.01,3.02,3.03,1.01,1.02,1.03,1.04,2.01,2.02,2.03} 而随机选取的交叉断点为6、7之间,那么交叉后的两个子代A′、B′为: A′={1.01,1.02,1.03,2.01,2.02,2.03,1.04,2.01,2.02,2.03}B′={3.01,3.02,3.03,1.01,1.02,1.03,2.04,3.01,3.02,3.03} 从A′、B′可以看出每个工件所对应的机器号是可行的,但机器上的加工排序却不可行,例如,A′中第四个工件和第八个工件都安排在二号机器上第一个被加工,显然不可行。换句话说,交叉后的新一代基因链码中每个基因的小数点前的数字是可行的,小数点后面的数字是不可行的,有待后面将要述及的有理化算子将其变为完全可行解。 变异算子。随机地在匹配集中选取一个父体C,设C为: C={1.01,1.02,1.03,2.01,2.02,2.03,2.04,3.01,3.02,3.03} 在父体中随机选中一个基因,例如第四个基因,将此基因小数点前换成任意可生产该工件的机器号、小数点后换成一个小于0.05的随机数。那么子代C′为: C′={1.01,1.02,1.02,3.017351,2.02,2.03,2.04,3.01,3.02,3.03}  我们看到C′与应用前述交叉算子所产生的子代一样仍然是不可行的,有待于后面有理化算子将其变为可行解。 有理化算子这个算子是一般遗传算法所不具有的,它的具体操作如下:(1)将按前述方法得到的新一代不可行个体,依照基因数值从小到大排序。 第4章 复杂系统的遗传进化分析与建模121 例如,10个工件两台机器Job-Shop调度问题中的一个不可行个体D: 排序后得 1 2 2 7 4 8 5 9 6 10 D={1.01,1.02,1.03,1.05,2.01,2.01,2.02,2.02,2.02,2.02} 由此我们也可以看到采用此种编码的一个好处,即只需通过一个计算机上很容易实现又很快速的排序操作便可将工件集按照所分配机器的不同而分开。不可行个体D排序后,前四个便是排在第一台机器上加工的工件,后六个是排在第二台机器上加工的工件。 (2)将排序后的个体从前到后依次按机器不同而将每个基因小数点后面的数值有理化。 例如D则变为: 1 2 3 7 4 8 5 9 6 10 D={1.01,1.02,1.03,1.04,2.01,2.02,2.02,2.04,2.05,2.06} 我们这样操作是基于这样一个理解。虽然交叉后的个体不可行,但它仍继承了父代的优良特征。例如,不可行个体D,它的第四个和第八个工件都排在第二台机器上第一个被加工,不可行,但也表达了这样一个信息,即D的两个父体之所以优秀可能是因为它们把第四个和第八个工件排在第二台机器上比较靠前的加工位置上,我们希望D继承两个父体的优良特征。因此,在有理化操作中把第四个和第八个工件排在第二台机器加工的第一、二位,当然具体哪个第一哪个第二由随机产生。 (3)把基因链码按照未排序前的顺序排列,构成新一代可行解。 1 2 3 4 5 6 7 8 9 10 D={1.01,1.02,2.03,2.01,2.03,2.05,1.04,2.02,2.04,2.06}4.仿真分析 冷轧精整生产调度安排精整生产计划,排产的钢卷数目从几十到几百不定。根据它们的宽度和厚度分为一定的类别,不同类别的钢卷有不同的加工条件,分配给不同的生产线。同时,生产调度又受到钢卷交货期和库存时间的。以上生产调度是一个典型的Job-Shop调度问题,调度的评价函数如下:minC=maxT1+a∑max(0,tcj-tdj)。这里的a是交货超期惩罚系数,tcj表示第j个钢卷的完成时间,tdj表示第j个钢卷的交货期。 横切机组共有四条生产线,一条只能加工宽度小于1.0m的,一条可以加工1.5m以下的,一条可以加工2.0m以下的,另一条可以加工所有宽度的钢板。为了能说明算法的有效性,便于观察,这里我们把问题简化,设定的对象如表 1 2 3 4 5 6 7 8 9 10 D={1.01,1.02,1.03,2.01,2.02,2.02,1.05,2.01,2.02,2.03} 122复杂系统的分析与建模 4-3-4、表4-3-5所示,其最优解可以一眼看出来,翻译成我们的编码即为: {4.01,4.02,4.03,4.04,4.05,3.01,3.02,3.02,2.04,2.05,2.01,2.02,2.03,2.04,2.05,3.01,2.02.3.03,2.04,3.05} 表4-3-5 工件操作 钢  卷生产时间交货期类  别钢  卷生产时间交货期类  别 11.01A111.01C 21.02A121.02C 31.03A131.03C 41.04A141.04C 51.05A151.05C 61.01B161.01D 71.02B171.02D 81.03B181.03D 91.04B191.04D 101.05B201.05D 表4-3-6 四台机器能加工的操作 机器M1M2M3M4 AAAA BBB 操    作 CC D 遗传算法的初始解随机取得,选择方法采用将父串和子串都加入新一代的初始解群,然后按其适应值由大到小排序,取其前一半为新一代的解群。 5.结论 本文根据了基于遗传算法的Job-shop调度问题的基本特点,并结合实际问题提出了一种切实可行的新遗传编码方式及相应遗传算子。这里提出的遗传编码及算子,可以处理一类加工路径不固定的问题。 4.3.4 港口投资辅助决策[26] 1.问题的提出 关于港口投资决策方法有许多种,各种方法建立起来的决策模型或多或少存在着某些欠缺: (1)模型大多只能应用于线性场合,对于非线性场合不能很好应用。(2)难于应用于多因素场合。 (3)模型的建立依赖于预测人员对具体问题的了解程度和已有的知识体验。 人工神经网络是一种包括许多简单的非线性计算单元的非线性动力系统, 第4章 复杂系统的遗传进化分析与建模123 它是模拟人脑的信息处理方法,具有知识的分布存储和并行处理的特点,并且具有记忆和联想的功能。理论研究表明,它能以任意精度逼近任意的非线性函数。因此,它对港口投资决策这类涉及到多因素,包含定性和定量分析的复杂非线性问题的模型构建是比较适合的。为此,本文探讨了采用神经网络建立港口投资决策模型,运用神经网络对样本数据进行学习记忆,建立起港口投资决策模型,然后利用神经网络联想能力对拟建港口进行计算,以辅助实际决策。 2.神经网络的遗传算法 神经网络的结构有多种形式,文中采用一种常用的前向神经网络模型,其最为常用的学习算法为BP算法,为了避免在对多峰值问题上BP算法的收敛性差和仅收敛于局部非劣解的缺点,这里将遗传算法思想移植到BP算法中,该种算法的基本思想是模拟自然界中生物群体的进化过程,按照生物遗传特点,通过遗传因子的信息传递。变异及自然淘汰,使遗传个体最终由不适应环境进化到适应环境。以此得到的进化算法,能以多个初值点开始寻优,沿多路径搜索实现全局或准全局最优。 1)神经网络的表示形式和遗传因子形式 用4.2节中前向神经网络的拓扑结构和权值。为了方便遗传运算,可用一字符串来表示前向神经网络拓扑结构,字符串由权值组成,设前向神经网络的权值Wij,Wij在[0,1]之间,其中k表示前向神经网络的层号,i、j分别表示神经网络第k层中神经元节点的序号,则此神经网络可表示为: W11 W12 … W21 W22 … W11 W12 … W21 W22 … 如用字符串来表示为: 111112222 W111 W12 W21 W22 W31 W32 W11 W12 W21 W221 1 1 1 2 2 2 2 k k 通过这样编码方式将神经网的拓扑结构表示遗传因子的特定结构,将网络信息存储在其中,以便进行各种遗传操作,获得最佳染色体。 2)评价函数与淘汰 像常规最优化算法一样,在迭代计算前必须给定初始点,所不同的是迭代在常规优化算法仅以一个初始点开始迭代计算,而遗传算法是同时以多个初始点开始迭代计算。这里迭代初始点个数构成个体群(population)。对个体群中任一个体的优劣程度可用f来评价。 f(k)=Fmax- ∑(y i -^yi) 式中:yi为期望输出,它来自样本(xi,yi);^yi是当输入为xi时神经网络的实际输出;Fmax为预先设定的系数。 淘汰准则是按个体的优劣度来衡量,f的数值越大,则能参与繁殖的机率就越大,因此f值越大的个体将被选出用于后代再生;相应地f的数值越小的个 124复杂系统的分析与建模 体被淘汰的机会就增加。淘汰的个体数目由淘汰概率PS来反映。假设个体群个数为POP,意味着PS・POP个优劣程度差的个体将被淘汰而不能进入下一次迭代计算,为了在新一次遗传(迭代)计算保持固定的个体总数,被淘汰的个体总数将由优良度好的个体变异(mutation)的新一代染色体(个体)所替代。 3)变异运算 考虑到染色体(神经网络表示方式)的特性,这里不采用交叉算子,它仅采用变异算子,突然变异率Pm是遗传算法中的重要参数,它可使变异个体在一定范围内发生变化。变异运算的具体过程是从保留下来的个体中随机选取Pm・POP个个体用于变异运算,对所选每一个个体。以W11 W12 … W21 W22 222k … W211 W12 … W21 W22 …中随机选出一个整数Bit=Wij,Bit表示 1 1 1 1 变异的码所在的位置。比如: P= W11 W12 … W21 W22 … W11 W12 … W21 W22 … |→  选出变异位置Bit k 1 1 1 1 2 2 2 2 其变异时就是在原数值上增加一增量ΔWij: k ΔWij=N(0,bm) bm=λ(1-f/fmax) 式中λ为系数,N(0,bm)是均值0、方差为bm的高斯函数(gaussfunction),如第i个神经元的优良度差,则bm就越大,从而ΔWij偏离均值0的可能性就越大。 11 假设Bit=W112+ΔW12=W12,经过变异运算产生的后代为 k P′=W11 W12 … W21 W22 … W11 W12 … W21 W22 … 11112222 再将新一代个体群进入下一轮的优选过程。 4)GA的终止条件 GA的终止条件,按考虑方法不同,可以取不同的形式。但对于某个初始个体群,可用如下条件满足时使迭代终止。即当进行k次(几十次乃至上百次)不同初始个体GA运算。当出现个体达到使用着的精度要求,则终止全部GA运算。通常选择下式作为收敛准则: |f(k+1)-f(k)|≤ε 式中:f(k)为第k代最佳个体优良度。 3.港口投资辅助决策的算例 港口投资决策时,须从拟建港口技术经济宏观和微观层面上综合考虑,这里以建设集装箱港口泊位为例,在建立神经网络模型时确定其输入指标为:交通集疏运能力、港口自然条件、腹地经济发展程度、装卸搬运机械工艺、财务NPVI、财务内部收益率、财务投资回收期、国民经济NPVI、国民经济内部收益率。因此,输入层共有九个节点,网络的输出层只有投资决策综合指数一个输出节点, 第4章 复杂系统的遗传进化分析与建模125 中间的隐层节点数的确定可根据经验公式: n1≤ n(m+3)+1 式中:m,n分别为输出输入层节点数;n1为隐层节点数,故选n=7。对腹地经济发达程度指标值是通过隶属函数表示: 1 Ur(Xs)= 0.001(Xs-600) 0 所示。 表4-3-7 指标评定标准 指标港口自然条件装卸搬运工艺 好(Ⅰ)1~0.81~0.7 一般(Ⅱ)0.5~0.40.6~0.4 差(Ⅲ)0.1~0.00.3~0.1 Xs(1600,+∞) Xs(600,1600) Xs:GNPXs(-∞,600) 港口自然条件和装卸搬运机械工艺指标值通过设定标准来衡量,如表4-3-6 算例根据资料表4-3-7中所选择的七个典型集装箱泊位技术经济指标作为训练样本,另一个作为估算分析。表中投资决策综合指标被分为四种情况:很好(1~0.8),好(0.7~0.6),一般(0.5~0.4),差(0.3~0.0)。在输入学习样本前,为了使神经网络的输入数据与输出数据与某些模糊隶属度指标数据具有可比性,将表4-3-7中的输入指标值进行规范化处理,把它们的值限定在[0,1]区间内。 本文选用初始个体群个数POP=60个,它是通过随机发生器产生,淘汰率PS为50%,为了保证新一代的个体群个数为60个保持不变,须对保留下来的个体作突然变异率Pm也应为50%。淘汰率和突然变异率的不同取值,会影响各初始个体群的遗传算法收敛程度,在计算中曾做过一些不同取值的计算实验,但由于试验的数目有限,尚须作进一步的探讨。GA法的计算流程如图4-3-3所示。 计算表明,在现取定的突然变异率和淘汰率下,该初始个体群经过750次繁殖(迭代)后染色体优良度基本趋于稳定,没有优良度更高的个体(染色体)发生,其染色体最优值f(k)max=1352.850456,满足条件ε=10-4,从图4-3-4中看出,1/f(k)是随着繁殖的增加而单调下降,说明GA运算能将个体群中个体种类也几乎快速单调地减少,保留优良的个体特性,并得以进一步改善,即GA法可以保证初始给定染色体(表示神经网络的权值)的一定范围内寻找到较大区域内的最优体,而且收敛速度较快。从750到0次子代繁殖ε减少了5个数量级,但有几次波动,如在550~600次子代繁殖中,其原因是该问题具有多峰值性,在遗传的过程中染色体突变而产生的劣质染色体。但在运算过程中未出现陷入局部极 126复杂系统的分析与建模 值点的现象。 学习训练结束后的网络很好地逼近了所有的样本点。亦即神经网络已很好地实现了决策指标值与技术经济指标值之间的函数映射关系,为了对未知集装箱港口泊位的投资进行决策,用已训练的神经网络对序号八的样本预测得到决策综合指标值为:0.71,属于“好”的类型。与表4-3-6列出的具体数据相对比,神经网络的相对误差为1.43%,表明以神经网络建立起的投资决策模型是可行的,且计算的精度较高。另外,为了反映遗传算法的收敛速度,我们采用BP算法从单个初始体出发寻找最优解(实验几次),均因迭代次数很大(大于1000多次)而不到或未能达到优解。说明系统算法的收敛速度比GA算法慢了许多。 表4-3-8 待训样本和评价样本 序号 交通集港口自财务评 财务评国民经国民经 辅运能然条件腹地经集装机价内部投资回综合指 价济评价济评价 力发展程济械工艺收益收期(年)数 NPVI/%NPVI/%IRR/% (TEU)度率%3134134000560735436734830874214911 ⅡⅡⅠⅡⅡⅡⅡⅡ 0.91.00.60.80.50.81.00.7 ⅢⅠⅡⅡⅢⅡⅠⅡ 8.214.47.87.31.26.215.38.2 7.312.85.05.21.05.210.07.0 8.011.09.016.012.017.019.010.0 12.018.310.010.51.511.117.715.3 10.714.18.410.01.29.816.314.4 0.60.80.30.50.00.50.90.7 12345678 4.结论 综上所述,可得出如下结论: (1)GA算法可以有效地在整个解空间寻优,收敛速度比BP算法快,结果准确。 (2)采用GA算法的ANN模型可以避免权值确定的人为因素,并不必知道各影响因素之间的关系。 第4章 复杂系统的遗传进化分析与建模127 参考文献 [1] 孙增圻,张再兴,邓志东.智能控制理论与技术.北京:清华大学出版社,1997[2] 李敏强,寇纪松,林丹,李书全.遗传算法的基本理论与技术.北京:科学出版社, 2002 [3] 潘正君,康立山,陈毓屏.演化计算.北京:清华大学出版社,1998 [4] Z・米凯利维茨.演化程序———遗传算法和数据编码的结合.周家驹,何险峰译. 北京:科学出版社,2000 [5] 吴胜.遗传算法在财务管理中的应用.微型机与应用.2001:(7) [6] 王安麟.机械工程现代最优化设计方法与应用,上海:上海交通大学出版社,2000.5[7] 王安麟.非线性强制振动解的一GA解法.机械设计与研究,1998(3),14~16[8] 王炬香,胡宗武,王安麟.基于电子商务的供应链管理.制造业自动化,2000 (10):27~30 [9] 王炬香,王安麟,胡宗武.供应链管理中的战略库存.制造业自动化,2001(3): 7~8,21 [10] WangJuxiang,PanErshun,WangAnlin.DevelopmentandModelingofE-suply chain.ProceedingsofICeCE2001,2001InternationalConferenceoneCommerceEngineering:NewChallengesforGlobalManufacturinginthe21stCentury.Xi′an,China,2001.9 [11] 王炬香,胡宗武,王安麟.敏捷供应链重组过程研究.机械科学与技术(录用)[12] 王炬香,胡宗武,王安麟.支持敏捷供应链重构的模块化Petri网建模与分析. 工业工程与管理,2002.6(录用) [13] 王炬香(指导教师:胡宗武,王安麟.上海交通大学博士学位论文:基于帕累托进 化的敏捷供应链重组技术研究,2003 [14] 攀登,王安麟.基于遗传算法的一类无序加工调度.机械设计与研究,1999No.1, 19~21 [15] 攀登(指导教师:王安麟).上海交通大学硕士学位论文:基于遗传算法的电梯群控 规则进化,1999 [16] 朱学军,王安麟等.用Pareto遗传算法实现机械/结构系统多目标优化设计.机械 科学与技术,第17卷增刊,1998.11 [17] 张志伟,叶庆泰,王安麟.进化设计思维与进化设计系统.上海交通大学学报,Vol. 34,No.10(2000.10),1449~1452 [18] 攀登,王安麟.多个体参与交叉的遗传算法.上海交通大学学报,Vol.33,No.11, Nov.1999 [19] 王安麟,朱学军,张惠侨.Pareto多目标遗传算法及其在机械健壮设计中的应用. 机械设计与研究,2000No.1,10~12 [20] 朱学军,王安麟.非稳态罚函数遗传算法及其用于机械/结构系统的健壮性设计. 128复杂系统的分析与建模 机械科学与技术,Vol.19,No.1(2000.1),49~51 [21] 朱学军,攀登,王安麟.混合变量多目标优化设计的Pareto遗传算法实现.上海交 通大学学报,Vol.34,No.3(2000.3),411~414 [22] 朱学军,王安麟.基于健壮性的机械设计方法.机械科学与技术,Vol.19,No.2 (2000.3),230~233 [23] 王安麟等.Pareto多目标遗传算法及其在机械健壮设计中的应用.机械设计与研究, 2000(1),1~3 [24] 朱学军,董,王安麟,张惠侨.模糊罚函数遗传算法及其在曲线光顺中的应用. 上海交通大学学报,Vol.34,No.10(2000.10),1421~1424 [25] 黎继子,倪武帆,方呈样.基于遗传算法的神经网络港口投资辅助决策.中国管理 科学,2003,8(1) [26] 李士勇,模糊控制、神经控制和智能控制.哈尔滨:哈尔滨工业大学出版社,1996[27] 陈国良等著.遗传算法及其应用.北京:人民邮电出版社,1996 第5章 复杂系统的神经网络自适应 分析与建模 所谓神经网络系统是指利用工程技术手段模拟人脑神经网络的结构和功能的一种技术系统。它是一种大规模平行的非线性动力学系统。严格地讲神经网络应该称为人工神经网络,为了简化起见,一般简称为神经网络(NeuralNet-works,NN)。由于神经网络具有信息的分布、存储、并行处理以及学习功能,所以它在信息处理、模式识别、控制等领域有着广阔的应用前景。本章将着重介绍人脑及其神经系统的基本结构和功能、人工神经元模型、神经网络模型和算法以及神经网络在工程系统中的进化分析与建模。在叙述中,突出基本概念、基本思想和基本方法的介绍,省略公式推导、理论证明以及系统分析。 5.1 神经网络与自适应分析概述 克劳斯・迈因策尔在其《复杂性中的思维》一书中指出:一般说,学习算法的目标在于通过自组织来减少大脑的内部世界模型与真实环境之间的信息-理论测量的差距。人们最近对于神经网络领域兴趣的恢复,主要是受到统计力学和非线性动力学技术的成功运用的鼓舞,这些成功运用的领域包括固体物理学、旋晶物理学、化学平行计算机、光学平行计算机以及———在协同计算机的情形———激光系统。另外的原因是,计算资源和技术水平的最新发展,使得对非线性系统进行计算处理越来越可行。从哲学上讲,认识论的传统课题,如感知、想象和认知,都可以在跨学科的复杂系统框架中进行讨论[1]。 5.1.1 什么是自适应过程 自适应性,通常指有一定的向环境学习的功能。复杂的自适应系统具有通常动力学系统性质,包括分层结构、多个吸引盆以及许多亚稳态图形之间的竞争;除此而外,它们还必须有一种能应付并利用环境变化的能力。一种自适应系统的研究方法是构造一个明显的时间层次:一个时间尺度描述真实动力学,另一个较慢的时间尺度考虑非线性方程本身的变化。神经网络是一种自适应学习算法,它可能是我们解决复杂的非线性动力学系统的功能最强、效率最高、最完善的信息处理系统。因此,神经网络成为复杂系统自适应分析的主要方法 [2] 。例 如,人们对于脊髓索状组织受损的病人,尝试借助于电刺激来增进其站立和行走 130复杂系统的分析与建模 功能。假定末梢组织器是未受损的,末梢神经的电刺激引起了肌肉的收缩。这是由适应性学习网络的平行脉冲引起的,学习网络对病人的感觉系统的听觉命令进行编码。这个系统具有学习能力,因为它通过把感觉反馈到运动的腿上,以适应特定的病人条件。 神经网络是一个具有高度非线性的超大规模连续时间动力系统,其最主要特征为连续时间非线性动力学、网络的全局作用、大规模并行分布处理及高度的鲁棒性和学习联想能力。同时它又具有一般非线性动力系统的共性,即不可预测性、耗散性、不可逆性、高维性、广泛联接性与自适应性等。因此,它实际上是一个超大规模非线性连续时间自适应信息处理系统。 5.1.2 神经网络的适应性模拟 1958年,罗森布洛特设计了第一台学习神经计算机,它以名字“感知机”而闻名。罗森布洛特原先是一位生理学家,专注于人的学习过程的生理学活动。他设计的学习机具有复杂的适应性行为,工程师和物理学家都很感兴趣。因此,用不着惊奇,生理学家的新颖思想被工程师抓住了,那些工程师对机器人和计算机技术比对于模拟人脑中的过程具有更大的兴趣。从技术的观点来看,神经计算机的学习程序是否与心-脑系统的学习过程类似不是根本性的。它们必须在管理复杂的适应行为时是有效的,但是可以利用完全不同于已知的生物进化中的方法。 1982年,美国物理学家霍普非尔德(T.Hopfield)提出了一种全新的神经网络模型,它体现了D.Marr的计算神经理论、耗散结构和混沌理论的基本精神,使网络的稳定性有了严格的判据,模型具有联想记忆、分类与误差自校正等智能,两年以后研制出模型硬件电路,成功地求解了数学中著名的“旅行推销员问题”,这是一项突破性的进展。与此同时,在神经网络的硬件实现方面,大规模集成电路做成的神经芯片已经包含几百个神经元,各种神经网络仿真器也大量涌现。神经科学、脑科学、思维科学、计算机科学、行为科学的研究成果奠定了神经网络研究的基础,非线性科学的发展为霍普非尔德模型的动力学特性的分析提供了有力的研究方法。以美国为发端,掀起了神经网络研究的新热潮。 虽然有不少人对当前似乎过高的热情存在疑虑,但最悲观的估计仍然认为这一领域的发展会带来重大的科学研究成果和应用前景;而最为乐观的估计则称之为一种新主义———联接主义,一种能解决诸如知识表达、推理学习、联想记忆乃至复杂的社会现象(如混沌)、社会演变等复杂系统的统一模型,它将预示着一个新的工业。 基于神经网络的适应性模拟的基本原理在于联接主义(Connectionism)。联接主义的先驱是心理学家麦卡洛克(W.S.McCulloch)和数学家匹茨 第5章 复杂系统的神经网络自适应分析与建模131 (W.Pitts,1909)。他们在1943年合作的论文“神经活动中内在意识的逻辑运算”中,提出了形式化神经元模型,并认为由简单神经元构成网络,原则上可以进行大量复杂的计算活动。因此,早期的联接主义观点在本质上与符号主义无太大的区别。 20世纪60年代以后,由于许多科学家的不懈努力,其中包括霍普菲尔德等人的卓越贡献,使得人工神经网络技术有了重要的突破,为实现联接主义的智能模拟创造了条件。 联接主义者从生物,尤其是人的大脑神经系统的构造和功能出发,把人的智能归结为脑的高层神经网络活动的结果,认为智能活动是大量简单的神经细胞,通过复杂的相互联接成网络后并行运行的结果。 联接主义认为神经细胞不仅是大脑神经系统的基本单元,而且是行为反应的基本单元,故称为神经元。任何思维和认知功能都不是少数神经元决定的,而是通过大量突触互相动态联系着的众多神经元协同作用来完成。 基于神经网络的适应性智能模拟方法,是以工程技术手段模拟人脑神经网络的结构与功能为特征,通过大量的非线性并行处理器来模拟众多的人脑神经细胞,用处理器错综灵活的连接关系来模拟人脑神经细胞之间的突触行为。这种联接机制的模拟方法,在一定程度上有可能起到对人脑形象思维的模拟,即承担了人脑右半球形象思维功能的模拟。 在人工神经网络系统中,信息的存贮与处理是合二为一的,即信息的存贮体现在神经元互连的分布上,并以大规模并行分布方式处理。这种并行处理决不是简单地以“空间复杂性代替时间复杂性”,而是反映了完全不同的“计算”原理。从数学观点看,可以把神经网络看做是由大量子系统组成的大系统,系统的最终行为完全由它的吸引子决定,如果视动力系统的稳定吸引子为记忆的话,那么从初态向吸引子流动的过程就是寻找记忆的过程。初态可以认为是给定有关记忆的部分信息。换言之,流动的过程就是从部分信息找出全部信息的过程,这就是联想记忆的基本原理。进一步,若视动力系统的稳定吸引子为系统计算能量函数的极小点,系统最终会流向期望的最小点“,计算”也就在运动过程中悄悄地完成了。运动的时间就是计算时间,这就是神经网络计算机的基本原理。 5.1.3 企业的自适应管理[3] 神经网络技术,顾名思义,就如同人类的神经系统一样可以迅速接收到外界的刺激并马上做出反应。神经网络技术在企业管理中的应用就具备这样的功能,它能够对影响业务市场和技术环境发展变化的各种因素加以详尽分析,并对这些因素本身即将发生的变化也做出详细而准确的分析和预测。企业可根据它做出的预报找出潜在问题,使可能产生故障的概率降低,提前采取补救措施。 132复杂系统的分析与建模 准确地说,现在的神经网络技术应该可以帮助企业进行智能化管理。它是一个能对分布式计算机环境实施前期预报管理和智能型管理的解决方案。与传统管理解决方案中需要使用多人以手工方式监控大量系统数据相比,它应该能够同时自动分析、监控几千个系统状态参数。如果将这种神经网络技术运用到因特网的管理上,那么它的因特网管理功能就获得了极大的增强。它还可以通过神经智能代理扫描网络,查找潜在问题,例如正在形成的瓶颈现象、违反安全性的企图或设备故障等。它还应能够从最终用户的角度提供端到端的响应时间,发现网络资源和用户,提供自动化建议,并优化多供应商环境中客户机/服务器应用的服务水平。它还能为企业进行监控和趋势分析,从而使企业具备更加广泛、更加详细的监控和管理功能。 1.企业系统管理面临的问题 随着信息技术的发展,其应用也不断多样化,各行各业对信息技术的依赖也提到了前所未有的高度。一个企业自身信息化水平的高低已直接决定了该企业在市场上是否具有核心竞争力。目前,企业在信息技术的应用方面,主要是借助计算机与互联网替代人去对其软硬环境进行管理与监控以提高企业的运作效率。在这些应用中不仅出现了多台客户机,而且还出现了各种不同的新的应用、硬件、平台和协议,企业IT系统环境面临着新的挑战。 以互联网应用企业为例,互联网、内部网和外部网及新技术浪潮令世界变得更加错综复杂,企业需要管理的信息技术资源的绝对数量也呈指数增加。网络技术日渐普及使得这些企业也需要依靠更多的人力投入来监控其运营状况,这些状况包括硬件设备、网络设备以及网络流量等,因此,互联网应用企业必须为包括网络流量、CPU以及硬盘存储等在内系统设备设定处于临界工作状况的报警门限值。这些门限值的界定往往需要大量业内的专家提供支持。这一问题对新兴的互联网应用企业如此,对那些应用计算机的传统制造企业更是如此,为确保企业系统环境的正常工作,这些企业往往需要很多专家提供支持与维护。当其用于管理与监控企业生产的系统出现问题时,这些专家就不得不奔波在各个部门之间,忙于解决问题。做大量的工作花很多时间变成了理所当然的事,但问题仍然会不时地困扰着企业的计算机系统,这其中造成的重复性工作与人力工作时间的浪费自然是一言难尽。 面对这一阻碍企业信息化发展的关键问题,人们便开始寻找解决问题的捷径。这时,神经网络技术这一可以在很多时候替代专家进行系统环境的“分析”、“研究”等工作,甚至可以在业务智能化方面为企业助一臂之力的技术一经出现,无疑为企业理顺纷繁芜杂的系统环境、开展智能化业务带来了一丝曙光。 2.神经网络技术的管理应用 神经网络在企业管理方面的应用可能是人们最关心的问题。在企业的智能 第5章 复杂系统的神经网络自适应分析与建模133 化管理方面,神经网络技术的功能主要体现在两个方面:即自适应性和预测未来的功能。由于神经网络技术具有神奇的“自适应”功能,并能够通过“观察”系统历史数据积累知识、训练自己,所以借助它可监控系统性能和可用性,并使得几千个代表系统“通常”行为模式的参量共同组成一个关于系统性能的剖析,即“个性剖析”,同时还能够洞察到系统行为参数之间的转移,从而预测到系统状态发生变化时某些变量从“正常”到“非正常”状态发生的可能性,以便在问题出现之前做出警告。 另外,由于使用了模式识别和统计概率等技术,运用了神经网络技术的企业的智能化管理系统能够对系统特性未来可能发生的改变加以准确预测,如工作流、系统活动状态和内存占用率的变化等。尽管这些变化可能现在并不会对系统性能产生丝毫影响,但如果不加以及时修正,它们的确有可能在将来导致系统发生严重问题。 3.神经网络技术的领导者———美国国际联合电脑公司(CA公司) 在神经网络技术的研究方面,CA公司作为全球领先的商用软件提供商,一直处于业界领先地位。自1985年起,CA公司的AI(artificialintelligence)部门就已开始从事神经网络技术的开发和研制。在几年以前,CA公司就已在神经网络结构的核心技术———功能链接网(Functional-LinkNet,FLN)的研究方面取得突破性进展。 CA公司对功能链接网(FLN)这一独一无二的最新神经网络结构拥有专利。FLN是一个简化的神经网络结构,它和比它复杂得多的结构具有同样强大的计算功能,而且在各种企业环境下,它对环境的适应所需要的培训时间要比其他类似技术少得多。即使在需要处理大量输入或数据时,FLN仍可快速地开发出成功的神经网络模型(说明:注意省略的隐藏层与用于功能转换的原始输入层的额外节点。它们尽管没有被显示出来,但其重要性是与每一个相互联络相关联的,就如同一流的隐藏层结构)。 在神经网络技术的企业管理应用方面,CA公司的旗舰产品———全面企业管理解决方案UnicenterTNG可以称为业内的典范,其中包含了Neugents技术。同时UnicenterTNGNeugents是头一个应用神经网络技术Neugents的企业管理产品。在帮助企业管理网络时,Neugents搜集到的数据越多,它就能够获得更多的学习机会;而它学得越多、预测得就越是准确。一旦Neugents积累了足够的历史经验,它们就能够根据现有已知条件对被监控系统未来的性能和可用性进行连续不断的预测。综合运用种种分析手段,UnicenterTNGNeu-gents能够产生多种前期预告警信息,比如“:40分钟内,系统发生性能瓶颈的概率将上升至70%”等等。它还可积累长达2个星期的系统性能历史数据,并在15分钟内使用这些数据训练神经网络。随后,完全不需要人工干预,Neugents 134复杂系统的分析与建模 就能够自动去预测系统即将发生的错误———有些情况根本预料不到,而所有这一切又都是通过程序自动完成的。借助Neugents技术,Unicenter实现了现有常规趋势分析和资源分析解决方案所无法达到的预报分析精度和准确度,对系统未来可能发生的性能或可用性故障加以预测、预防,企业可根据这些预报做出反应和处理。通过Neugents技术,Unicenter能够在系统发生问题之前做出预测,并在对商业市场的条件进行分析后,预测这些条件下的变化,进而预见商业机会、建议系统采取相应实施方案,同时Unicenter统一了多种不同的产品与进程,提供了完善的IT系统预测能力。 采用Neugents技术的软件具有同人类大脑相似的功能,它可以学习、积累知识,并在新情况下运用这些知识进行推理。对网管员来说,软件具有对关键系统工作状况的探明和预测功能至关重要。有了这样的工具,对于复杂的系统,网管员也能轻松应对。在帮助企业管理局域网时,UnicenterTNGNeugents通过自我训练来熟悉、理解工作环境。通过学习,Neugents可对环境未来的发展变化做出准确的预测,并对自己进行高效编程,甚至针对策略提出改进的意见。因此,这就不需要专家奔波于各部门之间进行系统安全运转的考察研究。现在只需一个专家就能够训练Neugents,使Neugents具备越来越多的处理问题的经验,真正做到了以一当百。正因如此,在业内对UnicenterTNGNeugents分析预测的功能好评如潮,所以业内人士还称其为“会思考的软件”。 4.神经网络技术的未来 在神经网络技术的未来发展趋势上,应该是能够应用于除了对系统设备监控管理以外的其他方面,如智能化业务管理与客户关系管理等方面。仍以CA公司神经网络技术Neugents为例,CA公司将致力于让它的自学习与自适应功能体现在:你越是使用它,它的功能就越是完善。为此,CA公司甚至把这一业界领先的技术产品化,CA公司现已推出了智能化电子商务工具———Neugentsii,这一完善的解决方案可用于构建实时智能电子商务应用程序,以使应用程序具有“自学习”能力,从而可实时判断、预测与响应电子商务需求。使企业能够快速构建与配置智能组件的Neugentsii通过监测电子商务的商业进程,从而发现关系、探测模式、确立优先原则,以预测变化对未来商业结果的影响。从动态个性化网站到预测市场趋势和商业结果,基于Neugentsii的解决方案使电子商务企业能够抓住市场机遇,为其用户提供无与伦比的服务。在今后,CA公司计划将其应用于包括金融、服务、司法等众多部门在内的几乎所有行业,以便让智能化管理迈入一个新纪元。 第5章 复杂系统的神经网络自适应分析与建模135 5.2 复杂系统的神经网络建模技术 神经网络系统可能是我们所面临的高度复杂的非线性动力学系统,也是迄今所知功能最强、效率最高的最完善的信息处理系统,因此,很自然地成为复杂系统的建模技术。 5.2.1 神经网络的概述 1.初创期(1943~1969年) 1943年,心理学家马卡洛序(McCulloch)和数学家匹特(Pitts)首先提出了形式神经元模型(简称MP模型),把神经元作为双态开关,并应用布尔逻辑的数学工具研究客观事件的形式神经网络的模拟。1948年,维艾纳(Wiener)在发表的《控制论》著作中,多次谈到他和马卡洛序、匹特以及波兰特等人在生物神经系统、信息、控制等方面的亲切讨论、交流和合作。可以说,Wiener的杰出工作对神经网络的研究起到了重要的推动作用。1949年,心理学家Hebb提出了神经元的学习规则,使神经网络具有了可塑性。到目前为止,大部分神经网络学习规则仍采用Hebb规则或它的改进型。1958年,罗赛波拉特(Rosenblatt)提出了感知器(percep-tron)模型,指出感知过程具有统计分离性,利用教师信号可以对感知器进行训练,试图模拟人脑感知能力和学习能力。1962年,卜罗卡(Block)用解析法证明了感知器的学习收敛性;同年威德龙(Widrow)提出了自适应线性元件,它是一连续取值的神经网络,主要用于自适应系统。米斯科(Minsky)和帕坡(Paper)经过对感知器模型的深入研究,在1969年出版了《感知器》一书,严格地论证了简单线性感知器功能的局限性,并且指出多层感知器还不能找到有效的计算方法。日本的中野在1969年提出一个联想记忆模型,同年,码(Marr)提出小脑功能及其学习法则的小脑感知机模型,这是一项神经网络与神经生理学相结合的研究成果。 2.过渡期(1970~1986年) 自从1969年米斯科和帕坡的著作发表后,曾一度使神经网络研究处于低潮,但是这项研究并未因此而中断。东京大学甘利教授从1970年起,就对神经网络的性质及其局限性作了许多理论研究,取得了一定的成果。1972年芬兰克号列(Kohonen)发表了一个与感知器不同的线性神经网络模型,比起非线性网络模型,它的分析要容易得多。1975年福岛提出了一个自组织识别神经网络模型。1976年,美国波土顿大学教授哥洛斯贝(Grossberg)根据对生物学和心理学的研究,提出了几个非线性动力系统结构,对神经网络的研究起到了重要的推动作用。1980年,芬兰克号列提出了自组织映射理论。1982年,美国加州工学 136复杂系统的分析与建模 院物理学家浩普费德对神经网络的动态特性进行了研究,引入了能量函数的概念,给出了网络的稳定性判据,提出了用于联想记忆和优化计算的新途径。这项研究成果为神经网络的研究注入了新的活力。1984年,多伦多大学教授赫顿(Hinton)等人把神经元的输出函数与统计力学的波尔兹曼分布联系起来,提出了波兹曼(Boltzmann)机模型。1986年努迈哈特(Rumelhart)等人提出了误差反向传播神经网络(简称BP网络),它是一种能朝着满足给定的输入输出关系方向进行自组织的神经网络。这种网络实际上早在1974年前后,已被哈佛大学的威波斯(Werbos)博士所发明,只因当时没有充分体会到它的用处而多年未受到足够重视。BP网络目前已经成为广泛使用的网络,并且以此为基础做了许多改进,发展了某些快速收敛学习算法。 1970~1986年间,经过许多科学家长期不懈的努力和潜心研究,取得了突破性的重要成果,使得神经网络领域的研究工作摆脱了困境,并步入健康发展的新时期。 3.发展期(1987年至今) 1987年6月在美国圣地亚哥召开了第一届世界神经网络会议,标志着神经网络研究在世界范围内形成了高潮。美国国防部预研计划管理局(DARPA)在1987年8月组织了大规模调研和论证,并于1988年11月开始一项投资数亿美元的发展神经网络及其应用研究的八年计划。此后许多国家也制定了相应计划发展神经网络。 进入20世纪90年代后,神经网络的国际会议接连不断,1990年在美国的华盛顿召开;1991年在美国西雅图召开国际神经网络学术会和IEEE联合年会;1992年国际神经网络学会和IEEE神经网络委员会联合学术会议在北京召开;1993年国际神经网络会议(’93ICNN)在美国旧金山举行;1994年首次将模糊系统、神经网络和进化计算三个方面内容的会议综合在一起召开,被称为’94IEEE的全球计算智能大会(WCCI)在美国奥兰多召开,并决定这样的大会每三年举行一次,在这期间各学会仍单独召开年会;1995年在澳大利亚的Perth召开ICNN和ICEC会议;1996年在美国华盛顿召开ICNN会议。 19年我国在广州召开了全国第一届神经网络信号处理会议。1990年在北京我国八个一级学会联合召开了神经网络首届全国学术会议。1991年在南京召开了中国第二届神经网络学术大会。此后,于1992年、1993年、1994年、1995年又分别召开了第三、第四、第五、第六届CCNN大会。 总而言之,神经网络的研究无论是在国际和国内,都受到了空前的关注并引起了许多领域研究人员的极大兴趣。尤其是进入20世纪90年代以来,IEEE神经网络刊物问世以来,各种专著逐年增加,许多期刊不断推出研究专集。可以说,在世界范围内已经形成了研究神经网络的前所未有的热潮。可以预言,21 第5章 复杂系统的神经网络自适应分析与建模137 世纪初,神经网络的研究将会有更大的突破。 5.2.2 神经网络的主要特点[4] 人工神经网络是由人工神经元(简称神经元)互连组成的网络,它是从微观结构和功能上对人脑的抽象、简化,是模拟人类智能的一条重要途径,反映了人脑功能的若干基本特征,如并行信息处理、学习、联想、模式分类、记忆等。神经网络系统与现代数字计算机相比有如下不同的特点: (1)以大规模模拟并行处理为主,而现代数字计算机只是串行离散符号处理。 (2)具有很强的鲁棒性和容错性,关于联想、概括、类比和推广,任何局部的损伤不会影响整体结果。 (3)具有很强的自学习能力。系统可在学习过程中不断完善自己,具有创新特点,这不同于AI中的专家系统,后者只是专家经验的知识库,并不能创新和发展。 (4)它是一个大规模自适应非线性动力系统,具有集体运算的能力,这与本质上是线性系统的现代数字计算机迥然不同。 这里,我们研究神经网络的目的是为了实现具有接近人脑信息处理能力的系统。因此,神经网络的样本应该是人类信息处理系统的中枢(脑)。实现这样的系统,一则是为了应用,另一方面是为了搞清人脑信息处理的机理,人类对模糊信息具有非常巧妙的处理能力。让计算机具有这种能力,一直是工程技术人员和研究者的理想。但是,用传统的人工智能技术和计算机技术实现人类的日常思维活动,从本质上讲是极其困难的。 从广义角度讲,微积分、文字翻译、推理等都是一计算过程,而从数学观点看,计算就是在满足一定公理、定理的条件下,从一空间到另一空间的代数映射;从物理观点看,计算是按照一定的自然规则,在某种“硬件”上所发生的一些物理规则。因此,计算可表示为一动力系统中的状态间变换的轨迹。神经网络的计算就是其中状态的转换,其计算过程可以认为是状态的转换过程,对给定的输入,其计算结果即是系统的稳定状态。 总之,神经网络的计算过程是适用于人类的信息处理系统。神经网络模型用于模拟人脑神经元活动的过程,其中包括对信息的加工、处理、存储和搜索等过程。它具有如下基本特点: 1.具有分布式存储信息的特点 它存储信息的方式与传统的计算机的思维方式是不同的,一个信息不是存在一个地方,而是分布在不同的位置。网络的某一部分也不只存储一个信息,它的信息是分步式存储的。神经网络是用大量神经元之间的联结及对各联结权重 138复杂系统的分析与建模 分布表示特定的信息。因此,这种分布式存储方式即使当局部网络受损时,仍具有能够恢复原来信息的优点。 2.对信息的处理及推理过程具有并行的特点 神经网络可以看作为由多数处理单元(processingelement)同时动作、并行处理的机器。这里的处理单元是人工神经细胞。人脑中大约有140×109个神经细胞进行并行处理。现在能够实现的神经网络所具有的人工神经细胞数是140×102个,还极其少。人脑的信息处理系统可以认为是阶层型结构,如图5-2-1所示的并行分散处理系统,在阶层内各模块间的相互结合呈阶层状的并行分散处理。这种并行分散处理系统,同由一个处理器顺次执行程序的计算机是不同的,它的许多模块(单元)在相互影响的同时进行不同的处理。总之,每个神经元都可根据接受处的信息作的运算和处理,然后将结果传输出去,这体现了一种并行处理。神经网络对于一个特定的输入模式,通过前项计算产生一个输出模式,各个输出节点代表的逻辑概念被同时计算出来。在输出模式中,通过输出节点的比较和本身信号的强弱而得到特定的解,同时排除其余的解。这体现了神经网络并行推理的特点。 图5-2-1 作为并行分散处理系统的脑模型 3.对信息的处理具有自组织、自学习的特点 神经网络中各神经元之间的联结强度用权重的大小来表示,这些权重可以事先定出,也可以为适应周围变化的环境而不断地调整权重(自组织能力)。这种过程称为神经元的学习过程。神经网络所具有的自学习过程模拟了人的形象思维方法,这是与传统符号逻辑完全不同的一种非逻辑非语言的方法。神经网络根据给予的学习数据,可以自学习。因此,不需要人类进行非常复杂的并行处理系统的编程,这可谓是一大优点。 第5章 复杂系统的神经网络自适应分析与建模139 在这里,让我们来考察一下人类大脑的学习。人类大脑的学习过程(见图5-2-2),具有进化阶段的学习、发育阶段的学习和日常学习等多重结构的学习形式。刚出生的小孩,因为已经获得了进化过程的学习结果,所以具有先天的能力。在这个阶段,可以讲大脑的硬件结构已基本完全形成。在以后的发育阶段中,在接受外部环境的影响和语言学习的同时,形成其人格,并进行基本的学习。发育阶段的学习效果,在幼儿期最显著,此阶段大约进行到20岁前后;一 图5-2-2 人类的多重学习结构 般地讲,发育阶段学习的东西,与其日常学习中学习的东西(如功课的记忆)相比较是难以忘却的,这在神经生理学中叫做学习方式的不同。 现在,神经网络的学习,还未把这样的人类学习过程完全引入。同时,人类对于人类大脑学习的机理也未完全搞清楚。因此,将来的神经网络学习方式,可以从人类大脑学习的方式得到启发,从人类大脑研究最新成果中得到发展。 5.2.3 细胞元模型 人类的智能是长期进化的结果,作为人类智能的大脑是一块极有组织的高度复杂的物质。人类大脑的神经细胞总数达140亿个,它是神经系统的结构和功能单元。神经元负责接收或产生信息,传递和处理信息。神经细胞的种类繁多,人类约有50多种,其大小形状也各不相同,直径在4~150μm之间。它们在结构上具有许多共性,且在接收或产生信息、传递和处理信息方面有着相同的功能。 1.神经元的结构 神经元由细胞体、树突和轴突等组成,其结构如图5-2-3所示。 细胞体由细胞核、细胞质和细胞膜组成。细胞体的外面是一层厚为5~10μm的细胞膜,膜内有一个细胞核和细胞质。神经元的细胞膜具有选择性的通透性,因此会使细胞膜的内外液的成分保持差异,形成细胞膜内外之间有一定的电位差,这个电位差称为膜电位,其大小受细胞体输入信号强弱而变化,一般约在20~100mV。树突是由细胞体向外伸出的许多树枝状较短的突起,长约1mm左右,它用于接受周围其他神经细胞传入的神经信号。轴突是由内向外伸出的最长的一条纤维,其长度一般从数cm到1m。远离细胞体一侧的轴突端部有许多分支,称为轴突末梢,或称神经末梢。其上有许多扣结,称为轴突扣结。 140复杂系统的分析与建模 图5-2-3 神经元的结构 轴突通过轴突末梢向其他神经元传递信息。一个神经元的轴突末梢和另一个神经元的树突或细胞体之间,通过微小间隙相联结,这样的联结称为突触。突触的直径约为0.5~2μm,突触间隙有200A数量级。从信息传递过程看,一个神经元的树突,在突触处从其他神经元接受信号,这些信号可能是激励性的,也可能是抑制性的。突触有兴奋型和抑制型两种形式。 总之,至今已知人脑中有多种类的神经元存在,其中许多具有高级功能。可是现在使用的人工神经元模型是非常简单的。作为人工神经元,根据其生理学特征,通常使用图5-2-4所示的多输入、单输出的单元。n个神经元接受输入信号,设输入信号分别为x1,x2,…,xn。在第i个轴突上,单位强度信号输入时把受到影响而变化的膜电位的量用ωi表示。ωi是表示突触结合效率的量,称为突触结合强度,或叫做联接权重。对于兴奋性神经细胞的突触,ωi>0;对于抑制性神经细胞,ωi<0;当ωi=0时,可以理解为没有与第i个神经元结合。 2.神经元的响应特性 一般的神经元基于上述的动作功能,具有以下特性:1)时空整合功能 (1)空间总和特性。单个神经元在同一时间可以从别的神经元接受多达上千个突触的输入,这些输入到达神经元的树突、细胞体和轴突的分布各不相同,对该神经元影响的权重也不相同。所以,单个神经元对于来自空间四面八方的输入信息具有进行加工处理、空间总和的功能。其空间总和的定量描述是:膜电 图5-2-4 神经元形式化结构模型 第5章 复杂系统的神经网络自适应分析与建模141 位的响应与输入信号和权重的线性组合有关。 (2)时间总和特性。由于输入信号影响会短时间地持续,故与后到达的输入信号影响的叠加同时起作用,即神经元对于不同时间通过同一突触的输入信号具有时间总和的功能。 (3)时空整合作用。神经元把不同时间、位于不同部位的突触输入进行加工处理,决定其输出的大小的过程,称为时空整合作用。t时刻膜电位的变化定量描述为 n t ∑∫ i=1 ωi(t-t′)xi(t′)dt′(5-2-1) -∞ 式中:xi(t′)为第i个神经元时间t′的输入信号。 2)阈值特性 神经元的输入输出关系具有非线性特性(见图5-2-5),即 y= 其中:θ为阈值。 3)不应期 阈值θ不是一个常数,随着神经元的兴奋而变化。绝对不应期,即无论多么强的输入信号到达,也不会输出任何输出信号的期间,可以看作θ值上升为无穷大。 4)疲劳 一个神经细胞持续兴奋,其阈值慢慢增加,神经细胞很难兴奋的现象叫做疲劳。 5)突触结合的可塑性 突触结合的强度,即权重ωi不是一定的,根据输入和输出信号的可塑性变化,并且可以认为由于这个变化导致具有长期记忆和学习的生理机能。 6)神经元的模型 当不考虑时间总和只考虑空间总和时,其膜电位的变化是神经元输入信号(xi)的线性和(X);X的响应特性由响应函数决定。响应函数模型有多种多样,以下在图5-2-6中列举几种典型的神经元函数模型。 (1)阶跃函数模型。 n y0 u≥θu<θ (5-2-2) 图5-2-5 阈值特性 y=f(X)=U(X)  X= ∑ωx i i=1 i -θ(5-2-3) 式中:θ为阈值;U()为阶跃函数;y为神经元的输出;X为膜电位,如图5-2-6(a) 142复杂系统的分析与建模 所示。 这个模型是1943年由McCulloch和Pitts提出的,在神经网络的研究初期,被Perceptron神经网络所采用。 图5-2-6 典型的神经元模型(θ=0) (a)二值函数y= 10 X≥0X<0 (b)Sigmoid函数y=f(X)= 1 1+exp(-X) (2)Sigmoid函数模型: y=f(X)= 1  X= 1+exp(-X) n ∑ωx i i=1 i -θ(5-2-4) 这个函数模型与阶跃函数模型相比,是采用了连续的信息作输入和输出,可反映实际神经方向传播网络,即著名的BP网络。 (3)概率函数模型。这种模型的输入和输出信号采用0与1的二值信息,它是把神经元的动作以概率状态变化的规则模型化。由输入X到输出y给出的概率分布形式为: P(y=1)= 1  X= 1+exp(-X/T) n ∑ωx i i=1 i -θ(5-2-5) 式中:T表示网络温度的正数。作为概率神经元模型应用有Blotzmann神经网络。 除此而外,还有时间滞后型神经元模型。 5.2.4 神经网络模型 人脑中大量的神经细胞都不是孤立的,而是通过突触形式相互联系,构成结构和功能十分复杂的神经网络系统。为了便于从结构出发模拟智能,因此必须将神经元联接成神经网络。其联接形式的不同,决定了神经网络的结构类别和功能。一般按照拓扑结构,神经网络的结构大体可分为层状和网状两大类。根据人工神经网络对生物神经系统的不同组织层次和抽象层次的模拟,神经网络模型可分为: (1)神经元层次模型:研究工作主要集中在单个神经元的动态特性和自适 第5章 复杂系统的神经网络自适应分析与建模143 应特性,探索神经元对输入信息有选择的响应和某些基本存贮功能的机理。 (2)组合式模型:它由数种相互补充、相互协作的神经元组成,用于完成某些特定的任务,如模式识别、机器人控制等。 (3)网络层次模型:它是由许许多多相同神经元相互连接成的网络,从整体上研究网络的集体特性。 (4)神经系统层次模型:一般由多个不同性质的神经网络构成,以模拟生物神经的更复杂或更抽象的性质,如自动识别、概念形成、全局稳定控制等。 (5)智能型模型:这是最抽象的层次,多以语言形式模拟人脑信息处理的运行、过程、算法和策略。 这些模型试图模拟如感知、思维、问题求解等基本过程。无论哪种神经网络,其神经元间的联接强度可通过学习改变。在涉及神经网络之前,先就神经元间的联接的约束和动作给出以下约定。 1.有关神经网络模型的约定1)神经网络中神经元间联接的约束 人脑中约有140亿个神经元,不用说它们并不是全部都相互联接着的。一个神经元同其他神经元相联接的个数约1万个。再之,脑的功能是以其局部相对应的模块结构形式而构成的,信息从下位的神经网络层向上位的神经网络层传递,以层状结构形式而存在。因此,人工神经网络中神经元间的联接,同样受着此类约束。 2)神经网络中神经元的同期性问题 神经网络中,各个神经元的动态动作决定了神经网络特性的不同。因此,一般情况下,约定所有的神经元以同一时钟进行同期动作。 3)神经网络中神经元的均一性问题 脑中存在着多种不同类别的神经元,即使是相同类别的神经元其特性也存在着差别。从实用角度讲,现在的神经网络中,其所有神经元大多以无差别、相同形式给出,而实现其功能。 2.神经网络的结构形式1)模块型网络 模块型网络如图5-2-7(a)所示,它包含着复数个神经元,在系统中具有一定的功能的部分叫模块。模块的概念对理解和处理大系统是非常重要的。我们已经知道,即使在脑中也具有各种各样功能的模块,其存在于脑的特定位置。神经网络是把神经元作为基本处理器的并行处理系统。更进一步讲,也可把图5-2-7(b)所示的模块作为基本处理器的并行处理系统。 2)前向网络 如图5-2-7(b)所示的那样,神经元形成层状集团群,各神经元之间没有反 144复杂系统的分析与建模 图5-2-7 模块型网络 (a)模块 (b)模块间的网络 馈,信号仅在层间以特定的方向传递的结构形式,叫做层状结构。也可以把单个集团看作为模块。在生物体的神经系统中,从解剖学角度看,存在着像末梢器官和大脑皮质那样的层状硬件结构;把脑看作信息处理系统,也可认为其具有层状软件结构。 三层前向网络分为输入层、隐层和输出层。在前向网络中有计算功能的节点称为计算节点,而输入节点无计算功能。 3)相互结合型网络 相互结合型网络如图5-2-13(b)所示,属于网状结构。构成网络的各个神经元都可能相互双向联接。所有神经元既作输入,同时也可用于输出,与前向网络不同。在网络中,如果在某一时刻从神经网络的外部施加一个输入,各个神经元一边相互作用,一边进行信息处理,直到使网络所有神经元的活性度和输出值收敛于某个平均值为止。 图5-2-8 反馈 (a)神经元间的反馈 (b)模块间的反馈 4)反馈和反馈网络 所谓反馈,从机理上讲,是将某个单元(或模块)的输出发生某种变形后的信息,再作为其系统自身的输入信息(见图5-2-8)。生物系统具有各种各样的形态,为了确保系统的稳定,反馈机理是不可缺少的。一般情况下,相互结合型网络必定包含有反馈;神经网络的学习过程也必定包含着反馈评价的过程。反馈有正反馈和负反馈,正反馈具有激振机理,负反馈具有抑制控制机理。例如,在 第5章 复杂系统的神经网络自适应分析与建模145 生物体中,癌的发作就是负反馈的抑制控制机构出现问题而引起的;脑中神经系统的时钟同期功能也许是正反馈激振作用的结果。 反馈网络(见图5-2-9)从输出层到输入层有反馈,即每个节点同时接受外来输入和来自其他节点的反馈输入,其中也包括神经元输出信号引回到本身输入构成的自环反馈。这里,每个节点都是一个计算单元。 图5-2-9 反馈网络 5)混合型网络 混合型网络(见图5-2-10)是介于相互结合型和层状结构中间的网络联接结构形式,即在前向网络的同一层中,神经元有互联的结构。这种在同一层内的互联,目的是为了同层内神经元同时兴奋或抑制的神经元数目,以完成特定的功能。 6)侧抑制网络 侧抑制(laterelinhibition)网络(见图 图5-2-10 混合型网络 图5-2-11 侧抑制网络 146复杂系统的分析与建模 5-2-11)是某个单元兴奋时,由其周围的单元实现其抑制的网络结构。侧抑制的机理主要是起到一个强调和抽出外部输入信号的特征的作用。例如,在人类的视觉系统中,对图像边缘的强调作用,就是使视觉神经产生侧抑制的效果。 5.2.5 神经网络的学习 神经网络学习的本质特征,在于神经细胞特殊的突触结构所具有的可塑性联接,而如何调整联接权重就构成了不同的学习算法。因此,所谓神经网络的学习,就是相对于神经网络信息处理的目的,进行有机地调节其系统中神经元间的权重。如图5-2-12所示,人类通过感觉器官接受外界的刺激,再通过控制肌肉或器官,作用于外界。同外界的信息交流对于大脑的学习是非常重要的。例如,在幼儿学习发音的过程中,通过听觉听到母亲的声音,试着模拟其声音。然后再反馈自己的声音到自己的听觉,同母亲的声音进行比较,判断自己的发音是否正确。 图5-2-12 脑和外界的关系 外界总是在变化的。因此,人类为了适应外界,总是不断地去学习。原则上,神经网络与人类相同,有必要通过学习进行调整,适应外界的变化。以下对神经网络学习的要点作一简述。 1)目的性的学习 生物体内存在着各种各样的学习机理,这可以说是在长期进化过程中获得的。这些仿佛具有某种目的性的巧妙机理,常常使人不可思议。可以认为在我们的脑中也存在着各种各样的目的性学习系统。 神经网络也一样,为了实现某种目的,需要为其准备学习算法。因此,为了评价神经网络的性能,需要设定评价标准,去评价其是否满足目的,或满足目的 第5章 复杂系统的神经网络自适应分析与建模147 的程度。 2)权重矩阵的调整 神经网络中神经元间的权重可以用矩阵的形式表示。例如,图5-2-13(a)的相互结合型网络的权重矩阵可用表5-2-1表示。其次,图5-2-13(b)的层状型网络的权重矩阵,就是将表5-2-1对角线部分除去后的部分。因此,可以理解为层状型网络是相互结合型网络的特殊形式。 图5-2-13 典型的网络结构 (a)相互结合型网络 (b)层状型网络 表5-2-1 权重矩阵 1 1234567 ω11ω21ω22ω23ω24ω25ω26 2ω11ω21ω22ω23ω24ω25ω26 3ω12ω22ω23ω24ω25ω26ω27 4ω13ω23ω24ω25ω26ω27ω28 5ω14ω24ω25ω26ω27ω28ω29 6ω15ω25ω26ω27ω28ω29ω30 7ω16ω26ω27ω28ω29ω30ω31 3)学习的过程 神经网络的学习,一般以图5-2-14所示的过程进行。首先,设定初始权重。如果没有初始权重的设定知识,可以随机设定。次之,输入学习数据,相对于权重参照评价标准进行评价。再之,根据评价标准调整权重,再进行评价。此过程反复进行,逐渐接近最优值。 4)全部搜索法(权重调整的问题) 148复杂系统的分析与建模 在此,以学习方法中的全部搜索法(exhaustivesearchmethod)说明权重调整的方法。 为了简单说明起见,首先假定把每个权重ωij 离散为K个值,应考虑的联接数为M,则可选权重ωij的组合数为K M 个。那么,通过学习数据和 评价标准进行评价,求解最优权重值的组合。从这个意义上讲的学习,虽然在原理上是非常简单的,可是假如联接数M较大,其组合数将相当庞大。例如,即使是K=10、M=100的小规模网络,必须进行KM次评价,这个计算量是难以实现的。因此,需要高效率的学习方法。 神经网络按学习的方式分为有教师学习和无教师学习两大类,图5-2-15给出了其直观描述。 图5-2-14 学习的过程 图5-2-15 神经网络有、无教师学习直观示意图 1.有教师学习 为了使神经网络在实际应用中解决各种问题,必须对它进行训练,就是从应用环境中选出一些样本数据,通过不断地调整权重矩阵,直到得到合适的输入输出关系为止,这个过程就是对神经网络的训练过程。这种训练过程需要有教师的示教,提供训练数据,又称为样本数据。在训练过程中又需要教师的监督,故这种有教师的学习又称为监督式学习。 如图5-2-15所示,在有教师学习中所提供的样本数据集是指成对的输入xi和输出yi,这样的样本数据集{xi,yi}实际上代表了实际问题输入输出的 * * * * 第5章 复杂系统的神经网络自适应分析与建模149 关系。训练过程就是根据网络输入的xi*和网络输出的yi*误差来调整权重,调整是基于奖惩式规则。示教者提供正确答案,当网络回答正确时,调整权重朝着强化正确(即奖励)的方向变化;当网络响应错误时,调整权重往弱化错误(即惩罚)方向变化。 有教师学习方法虽然简单,但是要求教师对环境和网络的结构比较熟悉,当系统复杂、环境变化时,就变得困难。为了适应环境变化就要重新调整权重。这样,学习到新知识的同时,也容易忘掉已学过的旧知识。这些是有教师学习方法的缺点。 2.无教师学习 无教师学习的训练数据集中,只有输入而没有目标输出,训练过程神经网络自动地将各输入数据的特征提取出来,并将其分成若干类。经过训练好的网络能够识别训练数据集以外的新的输入类别,并响应获得不同的输出。显然,无教师的训练方式可使网络具有自组织和自学习的功能。 3.学习规则 1)联想式学习(Hebb规则)心理学家Hebb基于对生理学和心理学的研究,在1949年提出了学习行为的突触联系和神经群理论:突触前和突触后两个同时兴奋(即活性度高,或处于激发状态)的神经元之间的联接强度将得到增强。后来,这则。 如图5-2-16所示,从神经元uj到神经元ui的联接强度,即权重的变化Δωij可用下式表达: Δωij=G[ai,yi(t)]×H[yj(t),ωij] * * 图5-2-16 Hebb学习规则 一思想被其他研究者加以引用,并以多种形式加以数学表达,则称为Hebb规 (5-2-6) 式中:yi(t)是神经元ui的教师信号;函数G是神经元ui的活性度ai(t)和教师信号yi(t)的函数;H是神经元uj输出yj(t)和联接权重ωij的函数。 输出yj(t)与活性度。ai(t)之间满足如下关系式: yj(t)=fj[ai(t)] 式中:fj为非线性函数。 当上述的教师信号yj(t)没有给出时,函数H只与输出ai(t)成正比,于是式(5-2-6)可变为以下更为简单的形式: Δωij=ηaiyj 式中:η是学习率常数(η>0)。 (5-2-8)(5-2-7) * 150复杂系统的分析与建模 上式表明,对于一个神经元较大的输入或神经元活性度大的情况,它们之间的联接权重会更大。 Hebb学习规则的哲学基础是联想,在这个规则基础上发展了许多非监督式联想学习模型,依据确定的学习算法自行调整权重;其数学基础是输入和输出间的某种相关计算。因此,Hebb学习规则又称为相关学习,或并联学习。 2)误差传播式学习(Delta学习规则) 前述的函数G与教师信号yi(t)和神经元ui实际的活性度ai(t)的差值成比例,即 G[ai(t),yi(t)]=η1[yi(t)-ai(t)] * 式中:η1为正数,把差值[yi(t)-ai(t)]称为δ。 * * * (5-2-9) 此外,函数H与神经元uj的输出yj(t)成比例,即 H[yj(t),ωij]=η2yj(t) 式中:η2为正数。 根据Hebb学习规则可得: Δωij=G[ai,yi(t)]×H[yj(t),ωij] =η1[yi(t)-ai(t)]・η2yj(t)=η[yi*(t)-ai(t)]・yj(t) 在上式中,如果将教师信号yi(t)作为期望输出di,把ai(t)理解为实际输出yi,则上式变为 Δωij=η(di-yi)yj(t)=η・δ・yj(t) 修正规则。 根据这个规则的学习算法,通过反复迭代运算,直至求出最佳的ωij值,使δ达到最小。 上述δ规则只适用于线性可分函数,不适用于多层网络非线性可分函数。广义的规则将在后述的BP算法中详细介绍。 3)概率式学习 从统计力学、分子热力学和概率论中关于系统稳态能量的标准出发,进行神经网络学习的方式,称为概率式学习。概率式学习的典型代表是Boltzmann机学习规则,它基于模拟退火的统计优化方法,因此又称为模拟退火算法。 Boltzmann机模型是一包括输入、输出和隐层的多层网络,但隐层间存在着互联结构且网络层次不明显。对于这种网络的训练过程,就是根据下述规则对神经元i、j间的联接权重进行调整: Δωij=ηpij 式中:η为学习率;pij (+) (+) ** * (5-2-10) (5-2-11) (5-2-12) 式中:δ=di-yi为期望输出与实际输出的差值。因此,称上式为δ规则,或误差 -pij (-) (5-2-13) ,pij (-) 分别是i与j两个神经元在系统中处于α状态和自 第5章 复杂系统的神经网络自适应分析与建模151 由运转状态时实现联接的概率。调整权重的原则是,当p(ij+)>p(ij-)时,则增加权重,否则减少权重。权重调整的这种规则就是Boltzmann机的学习规则。 由于模拟退火过程要求高温,使系统达到平衡状态,而冷却退火过程又必须缓慢地进行,否则易造成局部最小,所以这种学习规则的主要缺点是学习速度很慢。 4)竞争式学习 竞争式学习属于无教师学习方式。这种学习方式是利用不同层间的神经元发生兴奋性联接,以及同一层内距离很近的神经元间发生同样的兴奋性联接,而距离较远的神经元产生抑制性联接。这种在神经网络中的兴奋性或抑制性联接机制中引入了竞争机制的学习方式,称为竞争式学习。它的本质特征在于神经网络中高层次的神经元对低层次神经元输入模式进行竞争式识别。 前向网络的竞争式学习规则,是由Rumelhar和Zipser在1985年提出的。他们把前向网络结构设计成:第一层为输入层,而以后的每一层都增加许多不重叠的组块,每一组块在特征识别中只有一个竞争优胜单元兴奋,其余单元受到抑制。 设i为输入层某单元,j为获胜的特征识别单元,则它们之间的联接权重变化为 Δωij=η[(Cik/nk)-ωij] 的总数。 这种学习方式表明,在竞争中输入单元间联接权重变化最大的优胜单元实现每一特征识别,而失败的单元Δωij为零。 在竞争式学习机制的研究方面,1987年哥洛斯贝(Grossberg)提出将学习机制底———顶匹配和顶-底期望学习机制有机结合的原则,进一步完善了他所建立的自适应共振网络模型(ART)。ART网络包括许多功能模块,单个功能模块和单个层单元间按竞争式学习规则发生联接和变换。两层之间联接权重按照在竞争中优者取胜的原则进行调整。在多次顶-底与底—顶联接权重变化中优者取胜的平均值,作为模式识别的分类模式标准。 采用竞争式学习机制的神经网络还有克号列(Kohonen)提出的自组织特征映射网络等。 从上述介绍的几种学习规则不难看出,要使人工神经网络具有学习能力,就是使神经网络的知识结构变化,这同把联接权重用什么方法变化是等价的。所以,所谓神经网络的学习,目前主要是指通过一定的学习算法对突触结合强度的调整,使其达到具有记忆、识别、分类、信息处理和问题的优化求解等功能。当然,使用VLSI技术,在硬件上实现神经芯片,可以极大提高神经网络的学习效 (5-2-14) 式中:η为学习率;Cik为外部尾系列中i项刺激成分;nk是刺激k激励输入单元 152复杂系统的分析与建模 率和进一步完善学习功能。 4.关于学习的其他问题1)学习和“随机波动” 在生物系统中,经常出现随机波动。例如,一个人即使发出同一音节,第一回和第二回都存在微妙的差别。这样的差别,在人类的行为中到处可见。在这里,我们将其定义为“随机波动”。另一方面,人类同计算机相比,擅长于认识这些“随机波动”的现象。例如,人类对于具有“随机波动”的声音和手写文字可以很容易地识别。 即使在学习中,这种“随机波动”也起着重要的作用。例如,在反复学习过程中,我们期望有某种变化,即“随机波动”。在生物进化过程中的学习、突然变异等实际上产生了某种“随机波动”,形成了进化的契机。 2)梦和学习 有的科学家提出:人类的梦,是在假睡眠(RapidEyeMovement,REM)期间产生的。而且假睡眠只有高级动物才会发生。 5.2.6 多层前向神经网络(BP网络) 1.感知器 1957年,美国学者Rosenblatt提出了一种用于模式分类的神经网络模型,被称为感知器(perceptron)。它是由阈值元件组成且具有单层计算单元的神经网络,其联接权重可变,具有学习功能。 感知器信息处理的规则为 n y(t)=f ∑ω(t)x i i=1 i -θ(5-2-15) 式中:y(t)为t时刻输出;xi为输入向量的一个分量;ωi(t)为t时刻第i个输入的加权;θ为阈值;f[・]为阶跃函数。 感知器的学习规则如下: ωi(t+1)=ωi(t)+η[d-y(t)]xi (5-2-16) 式中:η为学习率(0<η<1);d为期望输出值(又称教师信号);y(t)为实际输出。 简单的Perceptron网络(见图5-2-17)为层状,各层分别叫S单元(sensoryunit),A单元(associativeunit)以及R单元(Responseunit)。根据以上学习规则,其学习的流程如图5-2-18所示,不断调整权重,使得权重对于样本保持稳定不变,学习过程即可结束。 罗赛波拉特(Rosenblatt)提出的感知器模型奠定了由信息处理、学习规则和作用函数三要素构成的基本模式。这种模型成为后来出现的几十种模型的重要基础。 第5章 复杂系统的神经网络自适应分析与建模153 应该指出,上述的单层感知器能够解决一阶谓词逻辑问题,如逻辑与、逻辑或问题,但不能解决像异或问题的二阶谓词逻辑问题。感知器的学习算法保证收敛的条件,要求函数是线性可分的(指输入样本的函数类成员可分别位于直线分界线的两侧),当输入函数不满足线性可分条件时,上述算法受到了。为此,米斯科(Minsky)等试图利用加入隐单元以扩大感知的功能,但是由于缺乏有效的训练方法,导致他们在1969年对感知器过分批评,致使神经网络研究一度处于困境,影响了研究工作的进展。含有隐单元的Perceptron网络(见图5-2-17)为层状,各层分别称S单元、A单元和R单元。 图5-2-17 简单的Perceptron网络模型图5-2-18 三层网络的结构 2.前向多层网络的BP学习算法 前向网络是目前研究最多的网络形式之一,如图5-2-18所示,它包括输入层、隐层及输出层,隐层可以为多层或一层。在隐层为一层的情况下也可把隐层叫做中间层。每层的神经元称为节点或单元。 BP(BackPropagation)法是相对于由输入层、隐层和输出层构成的前向网络,由Rumelhart等于1986年提出的有教师学习法。这个学习法,同甘利(1967年)、Tsypkin(1966年)曾提出的概率下降法相同。 1)BP网络误差反向传播学习算法的基本思想 (1)向网络提供训练的例子,包括输入单元的活性模式和期望的输出单元活性模式。 (2)确定网络的实际输出与期望输出之间允许误差。 (3)改变网络中所有联接权重,使网络产生的输出更接近于期望的输出,直到满足确定的允许误差。 2)误差反向传播算法的计算步骤 这里以图5-2-18所示的三层网络为例来说明误差反向传播算法的计算步 154复杂系统的分析与建模 骤(见图5-2-19)。为了说明方便起见,特引入一些记号: (1)初始化,对所有联接权重赋予随机任意值,并对阈值设定初值。 (2)给定最初的学习数据。(3)把学习数值{Ii}赋予输入层单元,用从输入层到中间层之间的权重{ωij}和中间层单元的阈值θj,求中间层单元j的输入Uj和输出Hj。其中间层单元j的输入Uj和输出Hj由下式计算: Uj= ∑ω・I ij j i +θj (5-2-17) (5-2-18) Hj=f(Uj) (4)用中间单元的输出{Hj}和从中间单元到输出单元的权重{vkj},以及输出层单元k的阈值γk,求输出层单元k的输入Sk和输出Ok。其输出层单元k的输入Sk和输出Ok由下式计算: Sk= ∑v kj ・Hj+γk (5-2-19) (5-2-20) Ok=f(Sk) (5)由学习数据的教师信息Tk与输出层的输出Ok的差,求出输出层单元k相对于中间层单元阈值的误差δk=(Ok-Tk)・Ok・(1-Ok) (5-2-21) (6)用误差δk、从中间层向输出层的联接权重{vk}以及中间层的输出Hj,求出相对于与中间层单元j联接的权重和中间层单元的阈值的误差σj= ∑δ・v・H・(1-k k j Hk) (5-2-22) 图5-2-19 BP学习法框图 (7)用输出层单元k的误差δk、中间层单元j的输出Hj以及系数α的积的求和,修正从中间层单元j到输出层单元k联接权重vkj。同时用误差δk和系数β的积的求和,修正输出层单元k的阈值γk: vkj=vkj+α・δk・Hjγk=γk+β・δk (5-2-23)(5-2-24) 第5章 复杂系统的神经网络自适应分析与建模155 (8)用中间层单元j的误差σj、输入层单元i的输出Ii以及系数α的积的求和,修正从输入层单元i到中间层单元j联接权重ωji。同时用误差σj和系数β的积的求和,修正中间层单元j的阈值θj: ωji=ωji+α・σj・Iiθj=θj+β・σj (9)把下一学习数据作为教师数据。 (10)学习数据终止的话,返回③。(11)进行下一学习循环。 (12)假如学习次数不满足设定的学习次数,则返回②。 以上的③到⑥,是从输入层经中间层到输出层的正向处理;⑦到⑧是从输出层经中间层到输入层的反方向处理。因此,这种方法叫做BP算法。 总之,图5-2-18所示神经网络的输入输出关系,由图5-2-20所示的矩阵和向量的关系形象地表达出来。图5-2-20中有关记号的说明如表5-2-2所示。 Ok=f(Sk)Sk= Hj=f(Uj) k・Hj+γ (5-2-25)(5-2-26) ∑v kj Uj= ∑ω・I ji j i j+θ 图5-2-20 三层BP网络的计算流程表5-2-2 图5-2-20中记号的说明 记 号IiHjOk 输入层单元i的输出中间层单元j的输出输出层单元k的输出 说  明 156复杂系统的分析与建模 (续表) 记 号Tkωjivkjθjγk 说  明 相对于输出层单元k的教师信息 从输入层单元i到中间层单元j的联接权值从中间层单元j到输出层单元k是联接权值中间层单元j的阈值输出层单元k的阈值 3.BP算法的问题以及改进算法1)BP算法的问题 BP算法实质上是把一组样本输入输出问题转化为一个非线性优化问题,并通过梯度计算利用迭代运算求解权重问题的一种学习方法。已经证明,具有Sigmoid非线性函数的三阶神经网络可以以任意精度逼近任何连续函数。但是,BP算法在实际应用中尚存在以下问题: (1)由于采用非线性梯度优化算法,易形成局部最小而得不到整体最优。(2)迭代算法次数甚多使得学习效率低,收敛速度很慢。 (3)BP网络是前向网络,无反馈连接,影响信息交换速度和效率。(4)网络的输入节点、输出节点由问题而定,但隐节点的选取却根据经验,缺乏理论指导。 (5)在训练中学习新样本有遗忘旧样本的趋势,且要求表征每个样本的特征数目要相同。 (6)对每一应用,大多需要调整其学习参数。2)BP算法的改进 (1)MFBP算法。BP算法中网络参数每次调节的幅度均以一个固定的因子η比例于网络误差函数或误差曲面,这些参数的偏导数的幅度大小是造成BP学习算法收敛很慢的一个重要原因;此外,网络参数的调节是沿着网络误差函数梯度下降的最快方向进行的,由于网络误差函数的Hesse矩阵出现严重的病态特征,致使这一梯度下降的最快方向极大地偏离指向误差曲面最小方向,从而急剧地加长了网络参数到达最小点位置的搜索路径,这又是造成BP学习算法收敛慢的另一个重要原因。其次,BP学习过程中存在着某些“训练差的模式”,这些模式在学习过程中未对网络进行较好的训练,以致网络缺乏对这些模式的响应,从而退化网络的泛化特性,影响BP算法的学习效果。 克服这些缺陷的基本出发点是:网络中每个参数的调节应该有各自的学习率,且学习率在网络整个学习过程中,可以根据网络误差曲面上的不同区域的曲率变化自适应调节。在误差曲面的某一区域处,若它对某一参数有较小的曲率,则在这一参数的连续几步调节中,误差函数对这一参数的偏导数一般具有相同 第5章 复杂系统的神经网络自适应分析与建模157 的符号;若误差曲面相对于这一参数有较大的曲率,则在这一参数的连续几步调节中,误差函数对这一参数的偏导数符号一般将发生改变。因此,在这些参数的连续几步调节中,根据误差函数对网络参数的偏导数符号,可决定是否改变相应参数来提高学习效率。为了强调第n步相邻偏导数符号的效应,采用指数加权平均方案。 经过分析推导可知,网络每层所对应的因子项的取值范围受到,是Hesse矩阵呈现病态的主要原因。 n ∏O m=1 pkm (1-Opkm)  n=1,2,…,L-1 (L为网络层数) (5-2-27) 为了减轻Hesse矩阵的病态特性,一个自然的想法就是将网络每层对应的病态因子取值范围扩至[0,1]区域。为此,网络中每个节点的输入输出关系修正为如下形式: Opj=21+exp-2 -1 pj ∑ωO iji +θj -1(5-2-28) 式中:pj为模式p输至网络节点j的输出,同时网络的节点误差信号pj相应变为 δpj=(tpj-Opj)(1+Opj)(1-Opj)  (j为输出节点)δpj= (5-2-29)(5-2-30) ∑δ k pk (1+Opj)(1-Opj)  (j为隐节点) 基于以上讨论,快速算法FBP算法由式(5-2-29)、(5-2-30)及以下公式描述: ωji(n+1)=ωji(n)+ηji(n)∑δpj(n)Opj(n) p (5-2-31) 式中: ηji(n)・αηji(n+1)= ∑δ pp pj (n)OpjΔ1(n-1)>0 ηji(n)・β∑δpj(n)OpjΔ1(n-1)<0ηji(n) ∑δ p pj (n)OpjΔ1(n-1)=0 Δ1=γ・Δ1(n-1)+(1-γ)Δ1(0)= ∑δ p pj (n)Opj(n) ∑δ p pj (n)Opj(n) (5-2-32) θj(n+1)=θj(n)+ηj(n)∑δpj(n) p 式中: 158复杂系统的分析与建模 ηj(n)・α∑δpj(n)Opj・Δ2(n-1)>0 ηj(n+1)= ηj(n)・β∑δpj(n)Opj・Δ2(n-1)<0ηj(n)・ ∑δ(n)O pj pj ・Δ2(n-1)=0 Δ2(n)=γ・Δ2(n-1)+(1-γ)Δ2(0)= ∑δ p pj (n) ∑δ p pj (n) 式中:α>1,0<β<1,0<γ<21,均为一选定的常数因子。ωji(0)与θj(0)预先初 始化为[-1,1]内均匀分布的随机数,ηji(0)与ηj(0)为预先给定的一小的正数。 采用上述FBP算法对收敛速度有大幅度的提高,进一步分析FBP算法,可以看出训练网络的学习时间和其推广特性与训练模式在学习过程中的行为有密切的关系,于是在FBP算法扩大的基础上,采用动态训练集技术可改变网络的推广特性,这样就构成了MFBP算法: ①用P中所有元素按FBP算法对网络进行一次调节后,可得集合 TΔ{p∈P:Ep/#P}π 式中:#P表示集合P中元素的个数;Ep为训练集中每个样本模式户所产生的网络误差。 ②建立动态训练集DST。设其中至少有d个元素,它由集合P中所有元素和非主导训练集合T中所有元素或其复制元素构成。如果户中元素个数与T中元素个数之和大于或等于d,则DST即由P中所有元素和T中所有元素构成;如果P中元素个数与T中元素个数之和小于d,则DST由T中所有元素、P中所有元素和T中某些元素的复制元素构成,其中T中某些元素复制多少应视DST中元素个数是否达到d而定。 ③用DST集合对网络参数按FBP进行调节,检查FBP算法收敛条件是否满足,如果满足,则结束训练,否则转向④。 ④更新DST,在P中寻找具有最大误差值Ep的元素p,在T中寻找具有最小误差值Et的元素t,如果t=p,则在DST中增加一个元素p的复印元素,使DST扩大;如果t≠p,则用p取代T中的元素t。 ⑤转向③。⑥训练结束。 MFBP算法比BP算法具有更快的收敛速度。仿真结果表明,MFBP算法的迭代次数为BP算法的1/9~1/7,且具有更好的推广特性。 (2)MBP算法。MBP算法通过改变作用函数f(x)的值域,即加入一个增益因子C以改变作用函数陡度,在训练过程中,增益因子C随权值W和阀值θ 第5章 复杂系统的神经网络自适应分析与建模159 一起发生变化,以达到改善BP算法的收敛特性,加快收敛速度的目的。利用牛顿最速下降法可得到BP算法如下: δjk=f(Netjk)∑δmkωij m (5-2-33)(5-2-34) Er =δijOik ωij ωij(t+1)=ωij-μ 式中: Netjk= Er ωij (5-2-35) ∑ωO iji jk (5-2-36)(5-2-37)(5-2-38)(5-2-39) Oik=f(Netjk)δij=E= ijω 式中:μ为学习因子,μ>0。 Ek Netik N ∑ k=1 Ekijω 利用式(5-2-33)~(5-2-39)可推得网络权值和阈值的学习算法为: ij(t+1)=ηij(t)ΔωδpjOpj+aΔω (5-2-40)(5-2-41) Δθj(t+1)=ηδpj+aΔθj(t) 式中:η为学习步长;a为权值记忆因子。 分析式(5-2-40)、式(5-2-41)可知,影响BP算法的因素很多,归纳起来主要包括学习步长η、权值记忆因子a、网络结构及节点作用函数等。这些参数主要根据经验选取,具有一定的局限性,MBP算法主要基于这些参数的调整,对BP算法进行改进。 首先,将节点作用函数修改为: f(x)=-0.5+ 11+e-x (5-2-42) 此时,函数的值域由(0,1)变为(-0.5,0.5)。由此可对零输入样本进行学习训练,能克服BP算法中零输入样本时,相关的权值和阈值均不改变计算的无效问题,从而加快收敛速度。 其次,适当增加作用函数的陡度,以利于改善算法的收敛性。为此在节点净 m 输入Neti前加一个常数因子Cim,这样输出函数ymi=f(Neti)变为: ymi=f(CimNetim)(5-2-43) 最后,对学习步长采用变步长策略,可根据收敛性加以调整。即在收敛过程中,本次误差大于上次误差,则这次迭代无效,恢复迭代前的步长,减少步长增加 160复杂系统的分析与建模 的幅度重新迭代;反之,本次迭代有效,增大学习步长。 下面给出MBP算法的具体公式及简单的推导过程。 对于一个多层网络,假设yi是第m层的第i个节点的输出,ωij是第m层的第i个节点到第m-1层的第j个节点的联接权值,第m层的第i个节点的净输 mmm-1 入Netim=ωi=∑ωikyk,这时,Netim= k m Net1m,Net2m,…,Netn是第m层的净输 m m 入的列向量,节点作用函数为式(5-2-42)、式(5-2-43)。 假如对于一个输入模式x0,期望的输出为y=[y1,y2,…,yn],而实际的输出为^y对于二次型误差函数 E=1∑(yk-^yk)2k=1 将E对ωij取偏微分得: Em=ωij ENetm-1・m Netyi m-1 m N T (5-2-44) yimNetim ・m・m Netiωij ω1i m-1m-1 ω2i (5-2-45) f′(CiNeti)xj m m m-1 1=[-δ m-1 2 -δ m-1 n … -δ] m-1 … m-1ωni 式中: m δi=- E/Netim(5-2-46) 当i为隐节点时 δi= 当i为输出节点时 δi=(tpiOij)f′(CiNeti)Ci 根据式(5-2-46),式(5-2-41)可得: Δωij=ρωδjyj 式中:ρω为权的学习步长。 同理,计算误差对增益常数C的梯度 Em=Ci m m-1m-1m-1mmmδkωkωki・f′(CiNeti)・Neti∑km m m m m m m m-1 m m m m m ∑δkωkj m-1k m-1 f′(CiNeti)Ci mmm (5-2-47) (5-2-48)(5-2-49) (5-2-50)(5-2-51) ΔCi=ρcδi・Neti/Ci 用。 式中:ρc为增益的学习步长,只要将ρc取为0,Ci初值取为1,增益Ci不再起作 MBP算法经过用于系统辨识仿真表明,与BP算法相比,在选用相同的学习训练步数条件下,MBP算法的精度远远高于BP算法的精度(至少高出三个 第5章 复杂系统的神经网络自适应分析与建模161 数量级)。对于相同精度的要求,则MBP算法可在很少步数内达到精度要求,收敛特性、收敛速度及系统的泛化特性都得到了改善。 (3)前向网络的自构形学习算法。 在前向网络的拓扑结构中,输入节点与输出节点数是由问题本身决定的。而隐节点数的选取则相对困难得多。隐节点数少了,学习过程不收敛;隐节点数多了,存在节点冗余,网络性能下降。为了找到合适的隐节点数,最好的办法是网络在学习过程中,根据环境的要求,自组织和自学习自己的结构,这种网络学习的方法称为自构形学习算法。这种学习过程分为预估和自构形两个阶段。预估就是根据问题的大小及复杂程度,设定一个隐节点数很大的前向网络结构。在自构形阶段,网络根据学习情况合并无用的冗余节点,最后得到一个合适的自适应网络。 设Oip是隐节点i在学习第p个样本时的输出,Oi和Oj是隐节点i和j在学习完n个样本后的平均输出,n为训练样本总数,则 Oi= 1Oip n∑p=1 nn (5-2-52)(5-2-53) Oj=1∑Ojpnp=1 的定义如下: 同层隐节点i和j的相关系数 1OipOjp-OiOj n∑p=1 122Oip-Oi n∑p=1 n n 为了衡量隐节点的工作情况,给出同层隐节点间的相关系数及样本分散度 γij= 122 Ojp-Oj n∑p=1 n (5-2-54) γij表明隐节点i和j输出的相关程度,γij过大说明节点i和j功能重复,需要压缩合并。 样本分散度为: Si=1∑O2ip-O2i np 于阈值。 基于以上定义,给出隐节点动态合并和删减规则如下: ①合并规则:若|γij|≥c1,且Si,Sj≥c2,则同层隐节点i和j可以合而为一。这里c1和c2为规定的下限值。一般c1取0.8~0.9,c2取0.001~0.010。令Oj≈aOi+b,则 n (5-2-55) Si过小表明隐节点i的输出值变化很小,它对网络的训练没有起作用,性能类同 162复杂系统的分析与建模 a= 1OipOjp-OiOj n∑p=1 122 Oip-Oi n∑p=1 n n b=Oj-aOi 图5-2-21 隐节点i和j的合并 如图5-2-21所示,输出节点k的输入 Netink=ωkiOi+ωkjOj+ωkb・1+ ∑ωO kl l≠i,j l =(ωki+aωkj)Oi+(ωkb+bωkj)・1+ 从而得到合并算法:ωki→ωki+aωkj;ωkb→ωkb+bωkj。 ∑ωO kl l≠i,j l ②删减规则:若Si ∑ωO kl l≠i,j l≠i,j l kb+ωkiOi)・1+=(ω ∑ωO kl l 图5-2-22 隐节点i的删减 第5章 复杂系统的神经网络自适应分析与建模163 所以删减算法为:ωkb→ωkb+Oiωki,如图5-2-22所示,实际上是节点和阈值节点合并了。 根据上述的定义和规则可得到前向网络的自构形学习算法。采用三层前向网络应用自构形算法,对机械加工件特征识别实验结果表明,这种算法同BP算法相比,不仅识别准确率高,而且收敛时间缩短约1/7~1/5。 5.2.7 典型反馈网络———Hopfield网络 前面讨论的前向网络是单向联接没有反馈的静态网络,从控制系统的观点看,它缺乏系统动态性能。美国物理学家浩普费德对神经网络的动态性能进行深入研究,在1982年首先提出了一种由非线性元件构成的单层反馈网络系统,称为Hopfield网络。从控制系统的观点看,Hopfield网络是一个非线性动力学系统,由于非线性系统本身的复杂性,且涉及到随机性、稳定性、吸引子以至于混沌现象等问题,所以使得研究反馈网络要比前向网络复杂得多。 1.Hopfield网络的物理学模型 1982年美国物理学家浩普费德(J.J.Hopfield)发表了名为“Neuralnet-workandphysicalsystemwithemergentcollectivecomputationalabilities”的论文。在论文中提出了一种相互联接型网络模型,并指出其模型同物理学中说明物质的磁性的磁极模型非常相似。物理学中的磁极,以“向上”和“向下”两种状态为磁性的基本单位,由多数磁极间的相互作用而产生磁力。例如,永久磁铁的磁力,就是由许多磁极朝向相同的相互作用而产生。 假如把磁极模型的磁极置换为神经元,把磁极间相互作用置换为神经元间的联接,则得到的神经网络即为Hopfield的基本网络(见图5-2-23)。磁极的向上和向下状态,正好与神经元的兴奋和抑制相对应。 图5-2-23 磁极模型和神经网络模型的对比 (a)磁极 (b)神经网络 同时,为使Hopfield网络与物理学中的磁极模型有关概念相对应,引入了神经网络的能量的思想。使用能量这一量度,以考察神经网络的动作以及其全 1复杂系统的分析与建模 局的信息处理能力。 2.Hopfield网络模型 Hopfield网络模型的拓扑结构可看作全联接加权无向图,它是一种网状网络,可分为离散和连续两种类型。离散网络的节点仅取+1和-1(或0和1)两个值,而连续网络取0和1之间任一实数。其信息流向是双向的。即在网络中,单元自己的输出作为其他单元的输入,其他单元的输出又作为自己的输入,从而实现反馈。图5-2-24给出了Hopfield网络的一种结果形式。 图5-2-24 Hopfield网络 1)Hopfield网络模型基本特征的两个重要约束条件 (1)对称的相互联接性。从神经元i到j间的联接权值ωij与从神经元j到i间的联接权值ωji相等即为对称的相互联接性,如图5-2-25(a)所示。因为在实际的生物神经网络中,神经元间的突触联接强度完全是非对称的,如图5-2-25(b)所示,所以其对称性作为生物学的模型也许难以被人们接受。但是,从Hopfield的论文名可知,作为新的计算机(信息处理)模型的神经网络,其神经元间对称相互联接的约束条件的引入,大概不会有大的问题。其次,这种对称性同Hopfield参照的物理学磁极模型之间具有类似性。 图5-2-25 对称的相互联接 (a)人工神经元间联接的对称性 (b)神经元间突触联接强度的非对称性 (2)非同期的神经元动作。神经网络中的各神经元以非同期的形式进行动作即为非同期的神经元动作。以前的计算机,其所有的理论单元都是以时钟同 第5章 复杂系统的神经网络自适应分析与建模165 期动作进行具有系统意义的某些处理。Hopfield网络中,各神经元以自己的动态改变自己的状态(输出)的形式来实现系统信息处理。这种各神经元完全地动作,作为并行计算机的模型是非常具有魅力的。 在以上两个约束条件下,神经网络含有n个神经元,在时刻t,神经元i由其他n-1个神经元得到的输入信息的总和为 Ii(t)= ∑ω j≠i ij Sj(t)+θi(5-2-56) 式中:ωij为神经元i与j间的联接权值;θi为其阈值。在时刻t+1,神经元i的状态(输出)值Si(t+1)取0或1,各神经元按下列规则随机地、异步地改变状态: Si(t+1)= 2)Hopfield网络的时间发展规则 (1)随机地从网络中选出一个神经元。 (2)被选中的神经元i(1≤i≤n),其输入的总和为 Ii(t)= 10 Ii≥0Ii<0 (5-2-57) ∑ω j≠i ij Sj(t)+θi (3)基于Ii(t)的值对神经元i的输出值进行更新:1(Ii(t)≥0) Si(t+1)= 0(Ii(t)<0)  (4)神经元i以外的神经元j的输出不让其发生变化: Sj(t+1)=Sj(t) (5)返回(1)。 3.网络的能量 Hopfield根据系统动力学和统计学原理,在网络系统中引入能量函数的概念,给出了网络系统稳定性问题定理(Hopfield定理)。 定理:设(W,S)是神经网络,若ωij=ωji,且ωij>0,同时各神经元是随机异步地改变状态,则此网络一定能收敛到稳定的状态。 证明:在网络中引入能量函数 1E(t)=-ωijSi(t)Sj(t)-2∑i≠j 能量函数E(t)随状态Sk(t)的变化为 ΔE(t)11kiSi(t)-jkSj(t)+θk=-ωω∑∑ΔSk(t)2i=12j=1 当ωik=ωjk时,则得 n n n ∑θS(t) i i i (5-2-58) (5-2-59) ΔEk(t)=- ∑ωS kj j=1 j (t)+θkΔSk(t)(5-2-60) 166 n 复杂系统的分析与建模 若令Sk(t)= ∑ω j=1 kj Sj(t)+θk,则由式(5-2-56)可知,Sk(t)与ΔSk(t)同号, 再从式(5-2-60)可以看出,Sk(t)与ΔSk(t)之积大于零,故ΔEk(t)<0。这表明网络系统总是朝着能量减少的方向变化,最终进入稳定状态。 Hopfield网络模型的基本原理是:只要由神经元兴奋的算法和联接权系数所决定的神经网络的状态,在适当给定的兴奋模式下尚未达到稳定状态,那么该状态就会一直变化下去,直到预先定义的一个必定减小的能量函数达到极小值时,状态才达到稳定而不再变化。 如果更直观地赋予这种反馈网络系统的动态特性,则整个网络系统中神经元的信息处理过程就好像与在满员的电车中拥挤的乘客最初以不自然的姿势相互拥挤着,后来逐渐地以安定的姿势稳定下来的过程一样,犹如神经元由混沌状态转移到稳定状态。 对于连续的Hopfield网络,通过引入能量函数,可以类同于离散模型的情况加以研究,它同样朝着能量减少的方向运行,最终达到一个稳定的状态。 4.Hopfield网络的联想记忆功能 如前所述,Hopfield网络是一个非线性动力学系统。引入能量函数后并从系统能量的观点看,该网络系统在一定的条件下,总是朝着系统能量减少的方向变化,并最终达到能量函数的极小值而不再变化。如果把这个极小值所对应的模式作为记忆模式,那么以后当给这个网络系统一个适当的激励时,它就能成为想起已记忆模式的一种联想记忆模式,即Hopfield网络具有联想记忆功能。 Hopfield网络联想记忆过程,从动力学的角度就是非线性动力学系统朝着某个稳定状态运行的过程,这需要调整联接权值使得所要记忆的样本作为系统的吸引子,即能量函数的局部最小点。这一过程可分为学习和联想两个阶段。 在给定样本的条件下,按照Hebb学习规则,调整联接权值,使得存储的样本成为动力学的吸引子,这个过程就是学习阶段。而联想是指在已调整好权值不变的情况下,给出部分不全或受了干扰的信息,按照动力学规则改变神经元的状态,使系统最终变到动力学的吸引子,也即指收敛于某一点,或周期性迭代(极限环),或处于混沌状态。 Hopfield网络模型的动力学规则是指:若网络节点在S(0)初始状态下,经过t步运行后将按下述规则达到S(t+1)状态,即 n Si(t+1)=sgn 式中:sgn为符号函数。 ∑ωS ij j=1 j (t)+θi(5-2-61) 实现Hopfield网络联想记忆的关键是:网络到达记忆样本能量函数的极小 ij和阈值θi等参数。以下,将Hopfield网点时,决定网络的神经元间联接权值ω 第5章 复杂系统的神经网络自适应分析与建模167 络用于联想记忆的学习算法规则作一整理。 (1)按照Hebb规则设置权值 n ωij= ∑ m=1 ximxjm0 i≠ji=j m i,j=1,2,…,n (5-2-62) ij是节点i到节点j的联接权值;xi表示样本集合m中的第i个元素;式中:ω xi∈[-1,+1]。 (2)对未知样本初始化 Si(0)=xi i=1,2,…,n 式中:Si(t)是t时刻节点i的输出;xi是未知样本的第i个元素。 (3)迭代计算 n (5-2-63) Sj(t+1)=sgn∑ωS(t) ij i i=1 +θj θj=0 j=1,2,…,n (5-2-) 直至节点输出状态不改变时,迭代结束。此时节点的输出状态即为未知输入最佳匹配的样本。 (4)返回(2)继续迭代。 依据上述算法的联想记忆功能,可用于模式识别,但样本较多且彼此间相近时,容易引起混淆。因此,这种网络要求存储的信息模式必须是两两正交;此外,网络要求联接权中满足对称条件等。 5.Hopfield网络的优化计算功能 Hopfield网络理论的核心思想为:网络从高能状态转移到最小能量状态,则达到收敛,获得稳定的解,完成网络的功能。Hopfield网络所构成的动力学系统与固体物理学模型自旋玻璃相似,可用二次能量函数来描述系统的状态,系统从高能状态到低能的稳定状态的变化过程,相似于满足约束问题的搜索最优化解的过程。因此,Hopfield网络可用于优化问题的计算。 Hopfield网络用于优化问题的计算与用于联想记忆的计算过程是对偶的。在解决优化问题时,权矩阵ω已知,目的是求取最大能量E的稳定状态。为此,必须将优化的问题映射到网络的响应于优化问题可能解的特定组态上,再构造一优化问题的能量函数,它应和优化问题中的二次型代价函数成正比。 通过将能量函数和代价函数相比较,求出能量函数中权值和偏值,并以此去调整响应的反馈权值和偏值,进行迭代计算,直到系统收敛到稳定状态为止。最后将所得到的稳定状态变换为实际优化问题的解。 Hopfield应用这种网络优化计算功能,成功地解决了著名的旅行商TSP问题。TSP问题是给定N个城市,从某一城市出发走遍所有城市但不准重复,然后再回到原出发地其间的路径必须最短。此问题易于表达,但难于求解。用普 168复杂系统的分析与建模 通搜索法极其费时,而采用Hopfield网络在极少时间内找到虽不最短,但却是接近最短的最优近似解,充分显示出这一方法的巨大潜力。 求解TSP问题,其关键在于对所求问题找出用合适的数学表达的能量函数的形式,网络的行为须用能量函数E来描述,它的最小值响应于最佳路径。 Hopfield网络理论不仅奠定了用动力学和统计力学理论研究反馈网络的基础,而且连续的Hopfield网络模型可直接与电子模拟线路相对偶,易于通过VI-SI技术实现,这样就为研制神经计算机开辟了道路。 5.2.8 基于概率学习的Boltzmann机模型 1985年加拿大多伦多大学教授黑顿(G.E.Hinton)等人基于统计物理学和波兹曼(Boltzmann)提出的概率分布模拟退火过程,提出了Boltzmann机的学习算法。这个模型是把Hopfield网络的动作规则以概率动作的形式扩张其规则的网络模型。此扩张使Hopfield网络中难以确定的神经元间的联接权值及网络参数等由学习可以给予确定。其次,网络的动作也不是收敛于能量函数的极小点,而可能收敛于能量函数的最小点。 1.Boltzmann机模型 Boltzmann机是一个相互联接的神经网络模型,其特点是隐节点间具有相互结合的关系。每个都根据自己的能量差ΔE随机地改变自己的或为1或为0的状态。 前述的Hopfield网络的时间发展规则可以归结如下: Ii(t)= ∑ωS ij j≠i j (t)+θi Si(t+1)=l(Ii(t)) 式中:Si(t)是包括输入层、隐层和输出层中所有神经元的状态;函数l()是阶跃函数(也称为阈值函数),可表示为: l(x)= 10 (x≥0)(x<0) Boltzmann机在进行ωij,Ii(t),Si(t+1)的计算中,以概率判定的形式取代阶跃函数。神经元i在下一时刻的输出值Si(t+1),根据Ii(t)的值计算式(5-2-65)概率P,确定其是否为1: P(Si(t+1)=1)=f(Ii(t)/T) 其中:f(x)为Sigmoid函数,其表达式为 f(x)=12 1+tanh x2 = 11+exp(-x) (5-2-66)(5-2-65) 式中:T为网络的温度。随着T的变化,函数f(x/T)的变化形式如图5-2-26 第5章 复杂系统的神经网络自适应分析与建模169 所示。定性地讲,T的值越大(温度越高),f(x/T)函数相对于x越不敏感。T→∞时,f(x/T)=0.5;T的值小(温度低),f(x/T)函数相对于x的值出现正负,表现出敏感性。T→0时,f(x/T)为阶跃函数。这时,Ii(t)的值为正,用概率1.0,Si(t+1)=1;Ii(t)的值为负,用概率1.0,Si(t+1)=0。 由此,我们明确了在与Hopfield网络的动作规则相同且T=0的前提下,Boltzmlann机与Hopfield网络是一致的。下面来讨论用式(5-2-65)所给予的概率条件,向Si(t+1)=1状态迁移时网络能量的变化。在网络状态迁移前后,因为输出的变化仅局限于神经元i,由式(5-2-58)状态迁移前后的能量变化量为 ΔE=E(t+1)-E(t)=-{1-Si(t)}・Ii(t) 由上式可知,在Ii(t)为正的情况下,随着状态迁移,其能量减少(或不变化);由图5-2-26可知,Ii(t)为正的情况下,发生状态迁移的概率也大。相反地,在Ii(t)为负的情况下,随着状态迁移,其能量增加(或不变化)。这种迁移在Hopfield网络中虽是禁止的,但在Boltzmann机中允许以小概率出现(图5-2-26中横轴的左半部分)。正是由此原因,Boltzmann机的状态迁移函 图5-2-26 Sigmoid函数 (5-2-67) 数不停留在极小点,而可能收敛于最小点。当系统达到平衡时,能量函数达到最小值,可以证明Boltzmann机是收敛的。将Boltzmann机的时间发展规则整理如下: (1)随机地从网络中选出一个神经元。 (2)被选中的神经元i(1≤i≤n),其输入的总和为 Ii(t)= ∑ω j≠i ij Sj(t)+θi (3)以式(5-2-65)的概率P,把神经元i输出值Si(t+1)设定为1。 (4)神经元i以外的神经元j的输出不让其发生变化 Si(t+1)=Sj(t) (5)返回(1)。 2.模拟退火 模拟退火的基本思想源于统计力学,统计力学是研究一个多自由度的系统在某温度下达到热平衡时的行为特性。金属在高温熔化时,所有原子都处于高能的自由运动状态,随着温度的降低,原子的自由运动减弱,物体能量降低;只要在凝结温度附近,使温度下降足够慢,原子排列就越来越规整,而形成结晶,这一 170复杂系统的分析与建模 过程称为退火过程。物体的上述结晶过程可对应多变量函数的优化过程,因此可以模拟退火过程而研究多变量的优化问题。 虽然Hopfield网络的状态收敛于所给予的能量函数极小点的某一状态,但是,因为在Boltzmann机的状态迁移中引入了概率,故网络的各状态收敛于各自出现的概率状态(平衡状态)。收敛于平衡状态后,再以相同的时间发展规则反复进行,其中计算各状态出现的次数的时间平均值,即可求出各状态出现的概率分布。此概率分布叫做Boltzmann分布。Boltzmann分布函数Q(En)的显著特征是:它仅是状态能量的函数。其表达式如下: Q(En)= Z= 1-En expZT (5-2-68)(5-2-69) ∑exp n -En T 式中:Z是为了概率分布正规化的系数;T是状态迁移规则(式5-2-65)中的温度参数;En是状态n的能量。由此式可知,能量越低,实现概率越大,即“以最大概率出现最小能量状态”。 下面我们来考察温度参数T,从式(5-2-68)可知相对于实现概率Q(En),温度越高,其越不敏感;温度越低,其越敏感。当温度T→0时,最小能量状态的实现概率为1,其他状态的概率全为0。因此,如果有效地利用此特性,就可能使网络的状态总是收敛于能量函数的最小点。可是,值得注意的是,正如我们在前面所讲的那样,Boltzmann机的状态迁移规则,在温度T→0的极限时,与Hopfield网络是一致的。所以,如果从最初就让温度T=0,按时间发展规则下去,其状态会收敛于极小点,未必会收敛于最小点。 因此,最初以高温度出发,让网络按时间发展,在到达平衡点以后,保证平衡状态不破坏的条件下,慢慢地降低温度,最终使温度降低到0的极限的方法,叫做模拟退火法(simulatedannealing)。这种方法,类似于把金属材料通过加热,再慢慢地冷却,以消除其内部的缺陷的退火原理。 模拟退火要点是温度下降的幅度。假如很快地降低温度,仍会收敛于极小点。关于这个问题,S.Geman和D.Geman提出,如果温度T(t)下降满足式(5-2-70)的条件,网络一定收敛于最小点。 T(t)≥c/log(1+t) (5-2-70) 式中:t表示Boltzmann机的时间发展规则的使用次数;c是一常数。上式虽然由模拟退火保证了收敛于最小点,但由于式(5-2-70)是取对数的形式,温度变化非常缓慢,计算需要相当长的时间,因此,使用模拟退火时如何提高其计算速度乃是关键。 3.Boltzmann机模型的学习算法 以Boltzmann机的时间发展规则动作,其状态的出现概率收敛于Boltz- 第5章 复杂系统的神经网络自适应分析与建模171 mann分布所表示的平衡状态。处于平衡状态的各状态的出现概率,是根据Boltzmann分布,由状态的能量值而得到的:因为确定各状态能量值的能量函数是由神经元间的联接权值和神经元的阈值等网络参数所决定的,所以通过适当调整这些参数,可以实现所期望的状态的出现概率的平衡分布。而这里的调整就相当于Boltzmann机的学习。 实际上,Boltzmann机的全部神经元可分为可视单元群(visibleunits)和隐单元群(hiddenunits)两个单元群(见图5-2-27(a))。进行学习是为了使可视单元群的状态的平衡分布与所期望的概率分布相一致。作为特例,如果隐单元的个数为0,则进行所有神经元的学习。学习的方法分为自想起型学习和相互想起型学习两种。 自想起型学习是对学习时所提出的目标分布(相对于网络来讲,是对应可视单元的外部环境)实现模拟式学习的过程。学习结果是用网络参数表达外部环境的概率结构。 相互想起型学习是将可视单元群分为输入单元群和输出单元群(见图5-2-27(b)),在将输入单元群的状态(输出值的群)固定时,使输出单元群的平衡分布与期望的概率分布相一致。Boltzmann机通过学习,建立起输入单元群(输入模式)和输出单元群(输出模式)之间的有条件概率关系。这种相互想起型学习可以实现联想记忆的功能。例如,在把输入单元群固定表达为苹果时,假定在输出单元群中与之相对应,以概率的形式出现“红色”“圆的”、等模式,那么,网络即会从苹果联想出“红色”“、圆的”。 图5-2-27 自想起型学习和相互想起型学习的Boltzmann机 (a)自想起型 (b)相互想起型 以下介绍Boltzmann机的自想起型学习方法。将其扩张易于类推出相互想起型学习,限于篇幅,请读者参考文献“ALearningAlgorithmforBoltzmannMachines”。 假设可视单元群的状态为Va(可视单元数的向量),隐单元群的状态为Hb。 172复杂系统的分析与建模 其中下标a,b分别为其状态的号码。想让Boltzmann机学习的可视单元群的期望分布函数为P(Va);网络所有单元的平衡分布为Qω(Va,Hb),其中下标ω代表性地表示单元间的联接权值和单元的阈值等参数;与指定的状态(Va,Hb)相对应的状态能量用Eω(Va,Hb)表示的情况下,其Qω(Va,Hb)用的Boltzmann分布给出: Qω(Va,Hb)= Z= -Eω(Va,Hb)1exp TZ (5-2-71)(5-2-72) ∑ a,b -Eω(Va,Hb)exp T 故仅考虑可视单元群的情况下,其状态的分布函数Qω(Va)为 Qω(Va)= ∑Q x ω (Va,Hb)(5-2-73) 此时,期望分布函数为P(Va)与网络实现的所有单元的平衡分布Qω(Va)间的差异为 G(ω)= P(Va)Qω(Va) ∑P(Va)log a (5-2-74) 式中:G(ω)称为Kullback信息量(Kullback-Leiblerdivergence),表示分布函数间的距离,无论对于怎样的分布Qω(Va),均有G(ω)≥0,等号仅在P(Va)和Qω(Va)完全一致时成立。 把G(ω)作为学习的评价函数,假如使G(ω)趋向很小时确定网络的参数ω,就能以P(Va)近似地构成实行网络。 仅让ω的微小量δω变化的情况下,因为G(ω)变化为G(ω+δω)可用下式给出: G(ω+δω)=G(ω)+δω・ 所以,把ε假设为一微小常数,把δω用下式表示: δω=-ε则G(ω)必定能单调减小。即有 G(ω+δω)≤G(ω) (5-2-77) 如此,开始就选择适当的初始值ω,用式(5-2-76)反复地修正ω,能够得到满足期望分布(使G(ω)为极小值)的参数。式(5-2-76)中的微分,由下式给出: Gωij =-1(+)(-) (pij-pij)T (5-2-78) Gω(5-2-76) Gω(5-2-75) p(ij+)= ∑P(Va) a ∑SS i b b j exp[-Eω(Va,Hb)/T] Eω(Va,Hb)/T] (5-2-79) ∑exp[- 第5章 复杂系统的神经网络自适应分析与建模173 p(ij-)=(1/Z)∑SiSjexp[-Eω(Va,Hb)/T] a,b (5-2-80) p(ij+)是先把可视单元群的输出值按照期望分布P(Va)给以固定,仅让剩余的隐单元群的单元按照Boltzmann机的时间发展规则动作,在达到平衡状态时,单元i和j的输出值同时为1的期待值(Si和Sj间相关)。pij (-) 是让网络所有 单元(可视单元群和隐单元群)自由,在达到平衡状态时,单元i和j的输出值同时为1的期待值。把以上的式子代入式(5-2-76),可以得到单元间联接权值的修正量表达式: δω=-(ε/T)(p(ij+)-p(ij-)) (5-2-81) 上式中右边的第一项是表示与单元i和j的输出值的相关成比例使其联接权值增大的项,可见这同Hebb的学习规则相类似。右边的第二项表示与单元i和j的输出值的相关成比例使其联接权值减小的项,也叫做反学习(unlearning)项。总之,网络在通过可视单元群同外部环境相联接时(醒时)进行学习;同外部环境联接切断时(睡眠时)进行反学习。可见Boltz-mann机的学习理论有许多都是同(睡眠和记忆(学习))的过程相对比进行的。 在式(5-2-78)中,虽只表示了相对单元间联接权值ωij的微分,可是相对于各单元阈值θi的微分,假如把阈值θi看作输出值总是为1的假想单元同单元i间的单元联接权值,那么其处理能以ωij的相同形式进行。下面,将以上的学习规则作一整理: (1)以概率P(Va)将可视单元群的输出值固定为Va。(2)把隐单元群的状态设定为温度为T的平衡状态。 (3)统计所有的单元对(单元i同单元j)在平衡状态,同时输出为1的次数n(ij+)。 (4)让可视单元群自由,所有单元的状态到达温度为T的平衡状态。(5)统计所有的单元对(单元i同单元j)在平衡状态,同时输出为0的次数n(ij-)。 (6)(1)~(5)反复进行,将算出的nij p(ij-)。 (7)所有单元间的联接权值ωij按下式进行修正: δω=-(ε/T)(pij (8)返回(1)。 在以上学习规则的(2)和(4)中,为了实现温度T的平衡状态,虽然是根据Boltzmann机的时间发展规则进行计算的,但此时是由比T更高的温度开始计算,按照模拟退火法一边冷却,一边向温度T的平衡状态迁移,实现到稳定的温度T的平衡状态。 (+)(+) 和nij (-) 的各自的平均值作为pij (+) 和 -pij) (-) 174复杂系统的分析与建模 5.3 神经网络在工程系统中的自适应分析与建模 5.3.1 非线性系统的识别[5]~[9] 1.问题的提出 在计算机集成技术迅速发展的要求下,简单且易于操作的非线性系统识别技术的研究和开发既具有客观的迫切性,也具有广泛的应用前景。有关利用神经网络进行非线性的系统识别的研究虽已有许多,但是以简单的神经网络结构和简单的学习,能够高精度、大泛用性地预测出其时序列非线性响应的研究仍存在着许多问题。例如,在生物或机械等系统建模中,只允许或只能通过简单加振测定对象的响应,并需依此进行其未知非线性系统识别。由于对象的实验条件局限性,非线性特性的未知性,以及可使用学习信息的有限性,常常难以确定神经网络的结构、输入和输出的构成以及选用的学习信息。因此,把非线性振动的简单响应作为学习信息,以实现系统时序列非线性响应预测是生物、工程等领域中通过试验完成系统建模所需求的重要手段。 本节从工程应用的实际出发,列举一适用于非线性振动系统识别的神经网络模式。其基本思想是:从神经网络的预测结构形式、输入和输出的构成以及有限学习信息的充分利用三个方面入手,以尽可能少而简单的学习信息,实现非线性系统的高精度、大泛用性时序列预测。文中,通过非线性振动时序列脉冲响应的学习,实现强制激振响应的预测,通过时序列周期响应的学习实现混沌响应的预测例,验证了所介绍的神经网络模型的有效性。 2.神经网络和系统识别的研究1)识别的对象和系统预测的条件研讨的非线性振动解析模型为: m¨x(t)+cx+FR(x,t)=F(t) (5-3-1) 式中:x(0)=x0,x(0)=x0为初始条件;FR(x,t)为非线性复原力;¨x(t),x(t)和x(t)分别为系统的加速度,速度和位移。激振力F(t)为脉冲力时,使用如下的半波正弦形式: F(t)= Bsin(ωt) 0 (0≤t≤tm)(t>tm) (5-3-2) 式中:tm=π/ω。激振力F(t)为强制激振时,使用如下的正弦形式: F(t)=Bsin(ωt) (5-3-3) 以少量、简单条件下的时序列响应作为教师数据,学习后的神经网络,相对于任意的初始条件(x0,x0)和任意的激振力(激振力的形式以及B,ω,tm),能够预测 第5章 复杂系统的神经网络自适应分析与建模175 出其时序列响应。 2)提高神经网络预测精度和泛用性的方法 这里,所追求的神经网络主要功能是:在仅使用有限脉冲激振力和其响应的前提下,神经网络通过这些有限信息的学习、记忆、联想,达到对系统非线性动特性的识别。在识别中,神经网络学习的系统信息与需要预测的系统响应,由于激振力、激振频率、初始条件的不同,虽然在其响应上是不同的,但是其确定性物理模型决定了其物理机理的同一性。这种非线性机理同一性用于神经网络表达,不仅需要通过神经网络学习算法的改进来实现,同时需要研究神经网络的结构、输入和输出的构成以及学习信息的有效利用来提高神经网络的预测精度和泛用性。 (1)确定神经网络的输入、输出的构成。在确定模型的离散时间域中,假如给定t时刻系统的x(t),x(t),F(t),F(t+Δt),那么Δt后系统响应的增加量Δx(t),Δx(t)应该是确定的。因此,把神经网络的输入确定为x(t),x(t),F(t),F(t+Δt),输出确定为Δx(t),Δx(t),通过学习其非线性机理和特性是有可能实现系统识别的。完成学习后的神经网络,在学习信息条件附近的某一域内,预测的初始值、强制激振力和频率的大小等取任意值作为已知条件,从初始条件x(t),x(t)开始预测。将其输出Δx(t),Δx(t)代入式(5-3-4)、(5-3-5)。 x(t+Δt)=x(t)+Δx(t)x(t+Δt)=x(t)+Δx(t) (5-3-4)(5-3-5) 把求出的值x(t+Δt),x(t+Δt)再作为下一Δt后的系统输入,再预测出Δx(t+2Δt)、Δx(t+2Δt)。以此方式反复进行,即可实现时序列x(t+Δt),x(t+Δt)响应的系统预测。 (2)教师数据的结构和其向量形式。在连续时间序列离散化为t=Δt・k的情况下,把教师数据条件(x(0),x(0),B,ω,tm)下得到的系统时序列数据表示为以下形式: 珟xk=x(t)xk=x(t)珟Fik=F(t)Δ珟xk=Δx(t)Δx=Δx(t) i kiii (5-3-6)(5-3-7)(5-3-8)(5-3-9)(5-3-10) 图5-3-1 学习用三层BP网络 图5-3-1是学习用神经网络的输入、输出的向量关系,由以下定义: Iki=(珟xik,xki,Fik,Fik)TOiK=(Δ珟xki,Δxik)T (5-3-11)(5-3-12) 通过教师数据的学习,为了使神经网络具有非线性系统的频率、振幅和初始 176复杂系统的分析与建模 条件的依存特性,必须提高神经网络的联想功能。为此,有时需要用复数组试验条件。 (Pi,tim;i=1,2,…,m)下的试验数据,以增加学习信息,增加对系统非线性机理的联想能力。即把取得的复数组试验条件下的离散化时系列数据用下式的输入、输出向量的序列形式表示: I={I1,I2,…,Ik,…,In,I1,I2,…,In} 1 i 1 1 2 2i 1 i 1 1 2 2i m T (5-3-13) m T O={O1,O2,…,Ok,…,On,O1,O2,…,On}(5-3-14) 在预测中,完成学习后的神经网络,在给定预测条件的激振外力离散值和初始值下,以图5-3-2所示的预测结构,依次得到响应xk+1,xk+1(k=1,2,…,N)。输入、输出的向量关系通过BP学习法进行。 图5-3-2 预测用网络的输入和输出的关系 (3)神经网络的结构。 对于时序列系统预测,一般多使用反馈型神经网络结构。这里,在特定的识别问题和识别条件下,为了提高对非线性振动系统预测的精度和泛用性,采用图5-3-1所示的多层型神经网络,并且针对多层型神经网络的学习特征,介绍以上的输入、输出的构成。其神经元的输入、输出变换函数采用sigmoid函数模型。 3.非线性振动响应的学习和系统预测 以下通过两个非线性振动的解析例来验证所介绍的神经网络的预测结构和输入、输出的构成,以及有限学习信息的利用方法的有效性。为了证明方法的有效性,事例中物理模型以已知非线性振动模型为例。教师数据以及与预测结果相比较的基准数据全由RKG(Runge-Kutta-Gill)法解析得到,以具有可比性。 1)非线性振动脉冲响应的学习和系统预测 通常,1组试验条件下的时序列脉冲响应数据,其所持有的系统信息过于单调。事例中的学习数据,将2组试验条件下的时序列脉冲响应数据加工为4组,以尽可能减少学习信息。本节,叙述通过分段线性振动模型时序列脉冲响应的学习,实现其非线性系统响应预测的一仿真例。 (1)分段线性振动的运动方程。式(5-3-1)中的非线性复原力由 第5章 复杂系统的神经网络自适应分析与建模177 (k+k1)x+k1δ1 FR(x)= kx (k+k2)x+k2δ2 程中的参数如表5-3-1所示。 (2)分段线性振动脉冲响应的学习。 (x<-δ1)(-δ1≤x≤δ2) (x>δ2) (5-3-15) 所示的分段线性项表示。其运动方程表现了机械式制动鼓的物理模型。运动方 学习方法使用BP法的修正力矩法。学习中,神经网络的输入层、中间层、输出层的单元数为4、16、2。时间离散化增量为Δt=2πωn/LB=0.001s,其中ωn为线性固有圆频率;LB为线性固有周期的离散数;η=ω/ωn;ωn= k/m。 教师数据使用四组(m=4)条件为表5-3-2所示的半波正弦激振力下的时序列数据作为输入、输出向量序列(见图5-3-3)。学习次数Ln=50000。 图5-3-3 分段性振动的4组(m=4)学习数据 (a)输入数据 (b)教师数据 表5-3-1 分段线性振动的非线性复原力参数 i12 ki(N/m)40004000 δi(mm) 1-1 m(kg)c(N・s/m)k(N/m) 1400 表5-3-2 分段线性振动脉冲响应学习的教师数据条件 iBi(N) i tm(s) 1200.03 2200.05 3-200.03 4-200.05 LB i 珟x0,i=1,…,4ix0,i=1,…,4 20000 (3)分段线性振动系统响应的预测。 相对于学习的脉冲响应两组条件(P,tm)进行预测,其预测例如图5-3-4 178复杂系统的分析与建模 (a)、(b)所示;相对于强制振动响应两组条件(η,P,x0,x0)进行预测,其预测例如图5-3-5(a)、(b)所示。 图5-3-4 分段线性振动脉冲响应的预测例 (a)B=15.0,tm=0.08 (b)B=25.0,tm=0.04 2)Duffing振动的学习和预测(1)Duffing振动的运动方程及解析。 运动方程的物理模型为一端固定梁的大振幅振动。式(5-3-1)运动方程的非线性复原力项为: FR(t)=k(x+βx) 运动方程中的有关参数如表5-3-3所示。 表5-3-3 Duffing方程的有关参数 m(kg)c(N・s/m) 1.00.0 k(N・s/m)β(N/m3) 0.351.0 3 (5-3-16) (2)学习和学习数据。 图5-3-5 分段线性振动强制振动响应的预测例 (a)η=0.5,B=15.0,x0=0.005,x0=0.0 (b)η=1.0,B=20.0,x0=-0.005,x0=0.2 第5章 复杂系统的神经网络自适应分析与建模179 根据前述的学习输入、输出关系,以图5-3-6中所示□位置(ω=1,B=10.0,x0=0.8,x0=0.0)为学习条件,即如图5-3-7所示,用四个周期(m=1,由=0开始200个,Δt=2π/(50ω))的强制激振力和其时序列周期响应为输入,用其时序列响应的增量为教师数据。 图5-3-6 用B-x0平面表示Duffing方程式的响应分类 (k=0.35,ω=1,x=0.0,□:Regio(n),Uniquen=3,网络:Chaos) 图5-3-7 Duffing非线性振动(m=1)学习数据 从图5-3-6知,作为系统识别对象的Duffing模型,其解的特性与激振力和初期值呈极强的敏感性。神经网络的学习参数由学习的平均误差和最大误差同时稳定收敛为基准决定,学习次数为1000次,学习误差如图5-3-8所示。与学习条件相同的响应预测结果如图5-3-9所示。由RKG法解析所得三个周期解的响应相比较,时序列响应、相平面轨迹(Trajectory)以及庞加莱映射(Poincaremap)均显示出相当好的一致性,说明完成了高精度的学习。 (3)由周期响应的学习实现系统响应的预测。 运动方程中的有关参数如表5-3-1所示。由Ueda的结果,式(5-3-1)的 180复杂系统的分析与建模 Duffing方程式的响应在c-B平面被分为单纯混沌响应域、混沌和周期响应的共存域以及周期响应域。例如,假定x0=0.0,ω=1,由RKG法在共存域中(P=10.0,x0=0.8的附近)的时序列响应如图5-3-6所示。图5-3-6在B-x0。平面把响应分为混沌响应(网格),三个周期响应(□)(以后的图中与此相同,网格和□分别表示由RKG法解析得到的混沌响应,三个周期响应)。由图5-3-6可以看出此非线性方程对初期值和激振力的大小非常敏感,其非线性机理十分复杂。 图5-3-8 学习误差 图5-3-9 用B-x0平面表示神经网络预测结果 (k=0.35,ω=1,x=0.0,□:Regio(n),Uniquen=3,网格:Chaos) (4)预测。 在这里,由条件B,x0,x0,ω的组合,以神经网络的预测结果同RKG法的数值解析结果相比较,检验神经网络的预测泛用性。但是,式(5-3-1)的衰减系数c和预测离散时间增量Δt与学习条件相同。 在式(5-3-1)的Duffing方程的ω=1的前提下,在学习条件的附近,进行B-x0,B-x0平面的预测。为了从多方面评价预测结果,使用时序列响应、相平面轨迹以及庞加莱映射与RKG法的结果进行比较,其响应的评价仅表示省去4周期的过渡响应后40周期的响应。 (d-1)B-x0平面的预测。图5-3-9定性地表示了在x0=0.0条件下,对应于B、x0各条件的时序列响应预测结果同RKG法解析结果的比较。图 第5章 复杂系统的神经网络自适应分析与建模181 5-3-10(a)、(b)、(c)、(d)给出了从图5-3-9中四种评价表示(◎、○、○D、△)的预测结果,代表性地以四个预测例表示其时序列响应、相平面轨迹以及庞加莱映射。图5-3-10(a)的预测条件与学习数据条件相同(图5-3-9中附有*记号的B,x0),其预测结果与RKG法的结果一致,用◎表示。图5-3-10(b)的例中,RKG法的解析结果是混沌响应,神经网络的预测结果从时序列波形和庞加莱映射看,较好地预测了其混沌响应,但在相平面轨迹出现偏差,用○表示。图5-3-10(c)的例中,同样虽然定性地预测了混沌响应,但在相平面轨迹上出现180°误差,用○D表示。图5-3-10(d)的例中,RKG法的解析结果是三个周期的周期解,但预测结果却是混沌响应,用△表示。 图5-3-10中的记号◎、○、○D、△,表示了神经网络的预测结果的精度。◎表示时序列波形和相平面轨迹均呈现高的预测精度。○表示从相平面轨迹可看出其预测稍有误差。○D表示实现了混沌。响应的定性预测,但相平面轨迹上出现180°误差。△表示预测的定性结果RKG法的解析结果截然相反(以下各图中◎、○、○D、△记号的意思均相同)。 图5-3-10 用B-x0平面的预测条件预测的时序列响应、相平面轨迹和庞加莱映射例 (k=0.35,ω=1,x0=0.0) 182复杂系统的分析与建模 (d-2)B-x0平面的预测。图5-3-11定性地表示了在x0=0.件下,对应于B,x0各条件的时序列响应预测结果同RKG法解析结果的比较。图5-3-12是图5-3-11B-x0平面中的预测例。 图5-3-11 用B-x0平面表示神经预测结果 (k=0.35,ω=1,x0=0.0,□:Regio(n),Uniquen=3,网格:Chaos) 图5-3-12 用B-x0平面的预测条件预测的时序列响应、相平面轨迹和庞加莱映射例 (k=0.35,ω=1,x0=0.8) (d-3)x0-x0平面的预测。图5-3-13定性地表示了在B=10条件下,对应于x0,x0各条件的时序列响应预测结果同RKG法解析结果的比较。图 第5章 复杂系统的神经网络自适应分析与建模183 5-3-14是图5-3-13中x0-x0平面中的预测例。 图5-3-13 用x0-x0平面表示神经网络预测结果 (k=0.35,ω=1,b=10.0,□:Regio(n),Uniquen=3,网格:Chaos) 图5-3-14 用x0-x0平面的预测条件预测的序列响应、相平面轨迹和庞加莱映射例 (k=0.35,ω=1,B=10.0) 184复杂系统的分析与建模 (d-4)相对激振频率变化的预测例。图5-3-15定性地表示了在B=10.0,x0=0.8,x0=0.0条件下,对应于激振频率条件的变化,其时序列响应预测结果同RKG法解析结果的比较。但是,因图形表现的原因,其时序列响应的预测结果未必是省去4周期过渡响应的40周期。 图5-3-15 由激振频率(ω)变化得到的时序列响应、相平面轨迹和庞加莱映射例 (k=0.35,ω=1,x0=0.8,x0=0.0) 3)预测精度和泛用性的考察 以上两例中,从预测结果同RKG法解析结果的一致性,充分说明了其预测精度,从所使用教师数据(脉冲或强制振动响应)的信息形式和信息量及系统预测时所给出的预测条件的多样性,充分说明了其预测具有相当的泛用性。 4.结论 这里,说明了使用阶层型神经网络由简单的脉冲响应的学习,实现其复杂响应预测的可能性。通过对分段线性振动脉冲响应的学习,实现了对其时序列非线性振动脉冲和强制响应的预测,通过在Duffing非线性振动的混沌响应和周期响应的共存域中,让神经网络学习其周期响应后,改变激振力的大小和频率以及初始条件,进行其响应的预测。预测的结果,用时序列响应、相平面轨迹、庞加莱映射,与RKG数值积分的结果进行比较和判定。由此,验证了介绍的神经网络模型对非线性振动系统识别的有效性,即验证了所介绍的神经网络模型中的预测结构形式、输入和输出的构成以及有限学习信息利用方法的有效性。需要说明的是,Duffing非线性振动中,在混沌响应和周期响应的境界等部分,由于其相对预测条件的敏感性,存在预测的难度。 5.3.2 案例挖掘的神经网络决策[10] 1.问题的提出 随着数据仓库技术的迅速发展,人们积累的数据越来越多。激增的数据背后 第5章 复杂系统的神经网络自适应分析与建模185 隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。机器学习的难点在于处理系统在无实体的知识的帮助下识别蕴涵的在数据库中的客观规律,反映这类规律的知识也尚未被预先所知;专家系统的发展在知识获取和知识表达方面基本上没有突破人机之间的交互过程,依赖于对个别知识和随机性的处理;现有的管理决策支持系统无法发现数据中存在的关系和规则,缺乏挖掘数据背后隐藏的知识的手段。这就导致了“数据爆炸但知识贫乏”的现象,在信息社会需求的促进下,数据挖掘与知识发现便应运而生,并得到了迅速的发展。 近年来,决策支持系统技术已得到了长足的发展,但决策支持系统的实用化问题依然十分突出。例如,在管理应用中,会遇到许多棘手的问题: (1)决策支持系统专家所做的研究在理论上非常严密,但许多企业或公司却难以实现。 (2)决策目标多元化,存在描述与比较的困难。 (3)不确定性因素太多,这就需要通过建立案例仓库,针对企业的实际问题;应用神经网络等智能方法来训练案例,用数据挖掘与KDD方法来做案例挖掘,以辅助企业或公司做决策。 智能决策支持系统的成功与否,很大程度上取决于其设计是否符合人类的思维特点、模式,也就是两者之间是否存在认知匹配。而人的特点之一是善于学习和收集案例,并推理得出结论。因此,近年来对做智能决策支持系统的案例支持系统研究,已经越来越引起人们的注意。以往的案例支持系统的设计大多基于这样的假设:人对客观世界的认识和表达都是精确的。但实际上人的认识思维特点是可同时认识事物的质和量,也就是有一定的模糊性,并基于此进行模糊推理,这使得那些传统的方法不能与之匹配。本节根据ANN方法和案例推理的各自特点,应用递归的自组织模糊神经推理网络(recurrentself-organizingneuralfuzzyinferencenetwork,RSONFIN)的方法,介绍一种基于案例挖掘的新的智能决策支持系统。 2.递归的自组织模糊神经推理网络 神经网络模型是一种案例推理模型,它模拟人脑神经元结构,以MP模型与Hebb学习规则为基础,主要有前馈式网络、馈式网络和自组织网络三种。神经网络的知识体现在网络连接的权重上;神经网络的学习体现在神经网络权重的逐步计算上。建立神经网络模型的关键在于:选取非线性计算函数,即神经元;获取合适的网络拓扑结构;获取训练案例集。 近年来,用模糊神经网络解决问题的方法成为越来越普遍的研究课题,模糊神经网络的许多特点体现了这一现象。其中某些方法与通常的神经网络比较,具有更快的收敛速度和更小的网络规模。同时,模糊神经网络方法自动设计模 186复杂系统的分析与建模 糊规则,不仅使专家知识表示假设规则尽可能的模糊,而且组合学习数值数据。与纯神经网络或模糊系统相比,模糊神经网络具有它们两者的优点,它使得低水平的学习和组合动力神经网络进入模糊系统,并且提供高水平的类似于人类思想和模糊推理进入神经网络。然而,现有模糊神经网络的主要缺点是它们的应用领域受到由它们本能的前馈网络结构产生的静态问题的,出现时间问题无效。因此,需要寻找一种能够解决时间问题的递归模糊神经网络。 在过去几年里,一种自然包括动力学元素在内部存储形成反馈连接的递归神经网络,已经引起了许多人的关注。与前馈神经网络相比,它的输出仅仅是它的输入的一个函数,且是有限的静态作图,而递归神经网络完成动态作图。递归网络用于解决至少有一个系统状态变量不能被观察的问题。大多数的递归神经网络是通过增加可训练的时间元素给前馈神经网络使得输出更敏感而获得。如前馈神经网络,这些网络函数看作黑箱,我们不知道在这些网络中每个分量和节点的方式。近年来,在一些论文中,介绍了把模糊逻辑引入一种递归网络的概念。由于上面所提到的模糊神经网络与前馈神经网络相比有如此多的优点,以至于值得我们去构造在模糊神经网络的基础上的一种递归网络。 RSONFIN相对其他递归网络的所有优点总结如下: (1)其他递归网络模型的网络结构是一种正常的神经网络,且功能为一个黑箱,而RSONFIN是一种模糊推理网络。当一个元素在一种模糊推理过程中,每个节点和分量有它自己的方式和功能。 (2)对于大部分递归网络模型,使用者事先都有特别的网络结构;对于RSONFIN,则不需要预先指定,因为RSONFIN能够及时地自动构造。 (3)RSONFIN具有网络容量小和学习速度快的特点。3.案例推理与案例挖掘的关键技术1)基于案例推理(CBR)原理及其基本步骤 基于案例推理的工作原理,就是人们的认知心理过程。即假定人们总是利用已有的经验和知识来解决具有相似性的新问题。实际上,真正的专家不会将问题按规则一条一条地匹配,直接利用以前的经验才是最为自然的做法。只有新手才会认真地回忆,仔细地按照前人或专家制定的规则、指南按部就班地做下去。当专家遇到新问题时,他们的做法往往是:识别新问题与以前遇到过的问题的相似性;询问一些有关联的贴切的问题,以确定新问题到底与哪些经验相似或应将以前的经验做些什么调整;最后得出结论。基于案例推理就是按照人们的这种自然的认知心理过程,检索出与新问题相近的案例,并加以补偿那些匹配不一致的地方,形成问题的辅助求解方案。 基于案例推理方法应用领域广泛,表示形式和实现方法可以是多种多样的,但究其根本,基于案例推理的系统一般包括以下步骤: 第5章 复杂系统的神经网络自适应分析与建模187 (1)问题的表示和存储。 (2)对以前案例的检索和匹配,按照一定的算法找出当前新问题的最佳相似案例。 (3)对检索出的方案,用RSONFIN方法进行调整得出新解。(4)评价方案的有效性。(5)调整/维护案例库。2)案例仓库及其特点 案例仓库是由带有特定标识的多个案例组成的,当然也可按某种原则对其进行模糊聚类。一个抽象的案例可表述为五个因素构成的五元组,即 Case=(Pc,Rc,Ac,Tc,Ec) 式中:Pc为有限个因素(p1,p2,…,pn)构成的用来表达问题的复合因素;Tc为期望达到的目标集;Ac为实际达到的效果或得到的答案集;Rc为从问题Pc到解答Ac的操作、变换,可以是抽象为矩阵或函数形式表示的关系,且有Ac=Pc・Rc成立;Ec为对案例的评价。 案例仓库是面向主题的、集成的、稳定的、不同时间的案例的集合,用于支持经营管理中的决策制定过程。 3)案例仓库的结构和案例仓库管理系统 案例仓库的数据量大约是案例库的100倍,它的存储结构形式的设计以及数据查询和提取的效率就显得很重要。一般采用分布式结构形式,案例仓库管理系统的一项重要工作是实现对传统案例库进行提取、清理和转载案例到案例仓库中,这项工作占整个管理工作的80%。 4)案例仓库中的分析工具 案例仓库虽然存有大量的案例,但提供辅助决策的信息需要利用各种分析工具,如CLAP工具、DM工具、统计分析和查询优化工具等。这些工具直接影响辅助决策的效果。 5)案例挖掘的方法 目前,已经形成了分类、聚类和分割等多种案例挖掘的方法,每种方法均有它的优点,也有一些不足;还需要研究更多的案例挖掘的方法,以及多种方法的综合。使案例挖掘得到的知识具有更强的辅助决策效果。 4.构建基于案例挖掘的神经网络 智能决策支持系统新的决策支持技术的发展和基于模型库的开发困难,促使人们重新考虑IDSS的结构体系。本节介绍了案例仓库+CLAP+案例挖掘+RSONFIN=IDSS的解决方案,案例仓库、CLAP、案例挖掘和RSONFIN是作为四种的信息处理技术出现的。案例仓库用于数据的存储和组织;CLAP集中于数据的分析;案例挖掘致力于决策信息的自动发现;RSONFIN用 188复杂系统的分析与建模 于案例训练,使其更接近于人的思维模式。这四种技术具有内在的联系性和互补性,把它们结合起来,形成了新的决策支持系统结构,如图5-3-16所示。 图5-3-16 IDSS的体系结构 该结构的特点是以大量的数据为基础,系统由数据驱动。案例仓库对低层的业务数据进行集成、转换和综合,重新组织成面向主题的全局数据视图。CLAP是在全局数据视图上进行数据分析。案例挖掘是从案例库或案例仓库中进行挖掘,获得辅助决策信息。由于案例仓库、CLAP、案例挖掘都是数据驱动的,故它们的共同点是寻找大量数据中的规律性,从三个不同角度为决策者提供辅助决策信息,这是决策支持系统新的发展方向。 RSONFIN与专家系统是人工智能领域中的两个热门题目,它们已成功地应用于许多领域。但是它们在实际运行中各自遇到了许多困难,这是由它们自身机制特点所决定的,所以其应用受到了很大的。专家系统的致命弱点是:知识获取困难,因为它是人工地把各种专家知识从人类专家的头脑中或其他知识源那里转换到知识库中,费时低效;对于动态和复杂系统,由于其推理规则是固定的,难以适应变化的情况;对于有大量数据的输入,由于数据中存在较强的干扰因素,使得专家系统的结果受到很大的影响;专家系统不能从过去处理过的事例中继续地学习,这使知识获取变得更加困难。 与专家系统相比,RSONFIN具有良好的自组织、自学习和适应能力,因而特别适用于处理复杂问题或开放系统,这正好可以弥补专家系统的不足。同样,RSONFIN也有其弱点:RSONFIN的知识是分布在整个系统内部,对用户而言是个黑箱;而且,RSONFIN对于所采取的结论不能做出合理的解释,而这正是专家系统的长处。如果将RSONFIN与专家系统结合起来,充分发挥两者的优势,克服各自的不足,取长补短,产生巨大的合力,将会更好地满足实际需要。 RSONFIN主要是作为专家系统的前端完成知识获取功能,将大量历史案例数据输入神经网络,经过训练学习达到稳定状态时,所获取的知识存储体现在网络神经元互连分布及其权重上,必须通过某种转换机制将其变换成人类专家 第5章 复杂系统的神经网络自适应分析与建模1 可理解的符号规则。在这种结合模式中RSONFIN主要作用是知识获取,专家系统的主要作用是完成推理和解释任务。当然神经网络也可完成推理功能,那么究竟由谁来实现,可根据实际情况来确定。例如,求解问题的输入数据不全时,可采用专家系统的符号推理系统实现;若输入数据完全时,可直接利用RSONFIN完成推理。这种模式实现的特点在于转换方法的选择、设计和实现。 智能决策的新结构体系是将决策支持系统、专家系统、案例仓库、案例挖掘结合起来,即将多种不同的辅助决策方式结合起来,起到相辅相成的作用,进一步提高辅助决策的效果。 5.RSONFIN用作案例挖掘的应用实例 我们用中国各省区农业统计数据的实例来说明RSONFIN用作案例挖掘方法的可行性和有效性。从多年的中国统计年鉴中收集中国30个省区1962~1990年间农业人口、耕地面积、农业投资、农业总产出等有关数据,目的是分析和发现其中的普遍特征以及多种因素与农业总产出的关系。 用各省区农业统计数据的挖掘和知识发现过程来考查RSONFIN的推理能力。具体的方法是:首先,对表5-3-4进行属性泛化,将省份和城市名属性泛化为所在区域位置,分为东北部、北部、西北部、东部等;将其他属性分别泛化为“小”“、中”“大”、或“低”“、中”“高”、等;用最大方差法分别使这些数值属性离散化(见表5-3-5)。选取农业数据样本点,共150个(表5-3-4为其中的一部分),以区域、耕地面积、农业人口、农业投资作为输入模式,以农业产出为输出目标值,我们按照样本先后次序取出一半的样本点用于网络的学习训练,剩余的一半则用于网络的测试。 表5-3-4 农业统计属性表 编号123456710… 区域黑龙江辽宁吉林山东河北北京天津河南山西陕西… 耕地面积8826.533347.403935.536867.876560.47414.47432.276944.403701.803541.07… 农业人口20084.6022724.4014883.4068459.6052315.503952.963830.4774522.5022177.7026659.60 … 农业投资343.00327.00195.00216.00279.00132.00120.00479.00167.00123.00… 农业产出24540.0027380.00110.00750.0035760.007020.005490.0050200.0012480.0017000.00 … 190复杂系统的分析与建模表5-3-5 泛化的农业信息决策表 编号123456710… 区域东北东北东北北部北部北部北部北部北部西北… 耕地面积 大中中大大小小中中中… 农业人口 中中少多多少少多中中… 农业投资 大大中中中中小大中小… 农业产出 中中低高中低低高低低… 在具体的实现方面,我们在IBM个人计算机上采用Matlab5.3来编写实验程序,将训练好的网络用于对测试样本进行推理,正确率为93.4%。 6.总结 基于案例挖掘的新的智能决策支持系统主要是以知识和模型为主体,以RSONFIN为挖掘方法,结合大量企业管理案例,形成定性和定量相结合的辅助决策信息;通过中国各省区农业统计数据的应用实例说明了RSONFIN作案例挖掘方法的可行性和有效性。但在智能决策支持系统开发的过程中,存在许多困难,例如,需要大量的案例,且企业的外部环境千变万化,应如何建立实用的案例仓库以及决策过程中存在许多不确定性因素等问题还有待于进一步研究。 5.3.3 新产品和改型产品成本估计的模型[11] 1.问题的提出 在当前变化日趋剧烈的市场环境中,由于产品寿命周期越来越短,新产品和改型产品推出的速度越来越快。企业要在激烈的竞争中立于不败之地,就必须对新产品成本做出正确的估计,并以这种估计作为决策和计划的客观基础。在成本管理工作中,成本估计是成本管理过程中的重要环节。在管理日益复杂、对新产品和改型产品成本估计要求越来越高的情况下,现有的成本估计方法各有其局限性。趋势外推法的估计数据只能为纵向数据,在进行产品成本的估计时,只能利用过去的产品成本一个指标估计它随时间的走势,并不涉及影响成本的产品性质、功能、特点等方面的因素。但对于一个新产品,由于它的功能和特点 第5章 复杂系统的神经网络自适应分析与建模191 的改进,其成本构成与老产品有所不同,就不能像估计老产品那样只按时间的推移来考虑成本的变化。而因果法中的回归分析法尽管可同时按横向数据和纵向数据进行估计,但由于它往往只能考虑少数几种主要成本影响因素,略去了许多未考虑的因素,所以,所建模型对实际问题的表达能力不够准确,估计结果与实际的符合程度有较大偏差。而神经网络方法的优势是,以其并行分布处理、自组织、自适应、自学习和其容错性等独特的优良性能,可以较好地处理成本估计这类多因素、不确定性、非线性问题。它克服了上述各方法的不足,事实证明它自身的强大学习能力可将需考虑的多种因素的数据进行融合,输出一个经非线性变换后较精确的产品成本估计值,减少和克服估计的局限性,提高估计精度,对当前的企业管理具有十分重要的意义。 2.成本估计机理 在建立输入、输出学习样本时,分级宜散,不宜过细,且防止样本间出现矛盾现象。在训练网络时,应反复调整学习效率、隐节点数等参数。用三层BP神经网络对产品成本进行估计时,从输入层输入影响产品成本的n个因素信息,经隐含层处理后传入输出层,其输出值即为成本值。在正向传播阶段,每一层神经元的状态只影响下一层神经元的状态。如果输出层得不到期望的输出结果,则进入误差的反向传播阶段。误差信号沿原来的连接通路返回,网络根据反向传播的误差信号修改各层的连接权,使误差信号达到最小。这就是网络的学习过程。这种训练过的BP神经网络可以成为对某地区、某企业的产品成本估计的有效工具。 3.成本估计模型 1)产品成本估计的指标体系 由于BP神经网络的输入(X1,X2,…,Xn)就是影响产品成本的n种因素,所以必然构成成本估计的指标体系。这些指标的设置,考虑了概括性和动态性,力求全面、客观地反映某一时间、某一地区影响产品成本的主要因素及导致产品个体成本差异的主要因素。 2)指标体系的量化、规范化和同趋化处理 由于指标体系中既有定性指标又有定量指标,为使各指标在整个系统中具有可比性,应将定性指标进行定量化处理。量化处理的方法很多,较常用的是通过打分来区分优劣。对定量指标,因其衡量单位不同,级差有大有小,趋向也不一定一致,必须利用效应系数对其进行规范化和同趋化处理。当目标越大成本越低时,效应系数可由下式计算: Fj=(Xj-Xjmin)/(Xjmax-Xjmin) 当目标越小成本越低时,效应系数计算公式为: Fi=1-(Xi-Xmin)/(Ximax-Ximin) 192复杂系统的分析与建模 当目标越偏于中间成本越低时,效应系数计算公式为: Fi=1-|Xj-(Xjmax-Xjmin)/2|/[Xjmax-Xjmin)/2] 式中:Fj是目标值为Xi的效应系数;Xjmin是预先确定的第j个指标的最小值;Xjmax是预先确定的第j个指标的最大值;j是评价指标的数目。 4.模型建立 网络结构参数的选择十分重要,输入层与隐含层神经元个数的增加会增加网络的表达能力,但也会影响其收敛速度并加大噪声干扰。为使模型既有理论价值又有可操作性,应视产品成本估计的具体情况选取较为典型的指标。本节在实际调研的基础上,选取八个指标作为输入层。由于目前隐单元数目的选择尚无一般的指导原则,为了兼顾网络的学习能力和学习速度,选取隐单元数目为15。 5.估计实例 现以流程工业中的冶金工业为例,建立BP估计模型,并将其应用于天津无缝钢管厂热轧管分厂的产品成本估计。 首先,从实际生产文档中搜集用于学习样本的原始数据(见表5-3-6)。针对冶金工业在技术上具有分段连续、有间歇的大批量分解型生产及工艺路线单一固定、工序之间物流一致的特点;在管理上具有工艺条件制约生产计划、生产的间歇性要求制定合理的批量和多阶段的生产计划等特点,结合实际经验,给出各种影响钢管成本的因素,设立如下评估指标体系: 表5-3-6 学习样本的原始数据 工艺 复杂程度9.810.09.57.08.06.09.0 外径mm9511460941087773 壁厚mm9.7010.006.008.8014.0014.006.424.83 原料等级9.09.58.88.59.27.07.59.7 钢耗(去 动力消耗质量工具消耗成本 头尾) 要求 t元/t元/t元/t6.52.4906.4434.0696.7823.8083.84818.444 256272244232261214220284 9.09.58.88.49.27.57..8 34.0439.2731.8630.6636.2230.3831.2740.26 6.2806.6006.0005.8006.4504.8805.0506.700 钢管品种 35CrMo45Mn2汽车半 轴套管热轧200高压锅炉管API接箍J55热轧管API接箍N82热轧管低中压锅炉管API袖管(J55) API袖管(N80)10.0 X1———工艺复杂程度(最高10分,最低3分,工艺越复杂,成本越高); 第5章 复杂系统的神经网络自适应分析与建模193 X2———外径(mm,外径越偏于中间值,成本越低;越向两端,成本越高);X3———壁厚(mm,壁厚越偏于中间值,成本越低;越向两端,成本越高);X4———原料等级(最高10分,最低2分,原料等级越高,成本越高);X5———钢耗(t,钢耗越大,成本越高); X6———动力消耗(元/t,动力消耗越大,成本越高); X7———质量要求(最高10分,最低5分。质量要求越高,成本越高);X8———工具消耗(元/t,工具消耗越大,成本越高)。 根据评估指标体系对表5-3-6进行量化,得到神经网络的学习样本输入数据如表5-3-7所示。 表5-3-7 学习样本输入数据表 评估指标效应系数值 实例编号 X1 12345678 0.0500.0000.1250.7500.5001.0000.2500.000 X20.9080.6900.6900.9200.7590.8850.9770.839 X30.9700.9380.6370.9350.425 X4 X5 X60.4000.1710.5710.7430.3291.0000.9140.000 X70.3480.1300.4350.6090.2611.0000.8700.000 X80.3700.1000.8500.9720.4091.0000.9100.000 0.6280.6600.6000.5800.50.4880.5050.670 0.2590.8140.0740.6120.3330.8200.4440.9820.1850.800 成本 0.4251000.0001.0000.6820.513 0.8150.9970.0000.000 将表5-3-7的数据输入计算机,训练神经网络,建立起BP神经网络估计模型。模型的输出即为对天津无缝钢管厂的产品成本估计,结果如表5-3-8所示。 表5-3-8 估计对象指标及估计结果 工艺 复杂程度8.48.0 外径mm102 壁厚mm8.008.00 原料等级8.07.5 钢耗(去 动力消耗质量工具消耗成本 头尾) 要求 t元/t元/t元/t5.1247.825 225219 8.08.2 32.8431.86 5.5305.250 钢管品种 结构用无缝钢管输送流体用 无缝钢管 6.结论 对表5-3-6的原始数据使用不同的方法进行估计,连同事后得到的实际数据列入表5-3-9。 194复杂系统的分析与建模表5-3-9 估计结果对照表 估计对象结构用无缝钢管 回归分析法 5.62 时间序列法 5.37 神经网络法 5.5 实际数据5.46 可以看出,神经网络模型对产品成本的模拟效果和估计精度比其他方法高一些。随着样本系列的延长,由于其较强的容错性,其准确性可望进一步提高。鉴于此,人工神经网络方法在产品成本估计领域有广阔的应用前景,可为产品成本估计提供有效的辅助手段。 5.3.4 企业破产预测[12]~[18] 为了构建上市公司经营失败风险的判定和预测模型,将1998~1999年我国上市公司分为三类:一是连续两年净资产收益率高于同期银行存款利率;二是连续两年净资产收益率大于零但低于同期银行存款利率;三是连续两年净资产收益率小于零。同时收集了三类各50家,共计150家上市公司为建模样本,根据其有关财务指标数据,应用BP神经网络分析方法建立我国上市公司经营失败风险的判定和预测模型,并且使用同期上述三大类290家公司的有关财务数据为检验样本对模型进行验证。研究结果表明:由于BP神经网络模型是一种非线性判定模型,且在某些样本指标数据缺漏不全的情况下仍可得到满意的结果,因此具有较高预测准确性和更广泛的应用价值。 1.问题的提出 2001年4月24日,上市八年之久的“PT水仙”成为中国上市公司第一家被摘牌公司,关于上市公司的退出机制这一争议已久的问题终于获得一个满意的答复。1992年和1994年水仙通过发行A股和B股分别从资本市场上募集了1.5亿元和1504万美元,连续两年亏损的PT水仙虽然不是清盘或破产,但其每股净资产-0.25元意味着企业已经资不抵债,股东蒙受了巨大的损失。各界对中国上市公司质量的质疑由来已久,不少公司“改制不改革,上市不上进”,借上市之名,行“圈钱”之实,并没有借上市之机进行转机建制,结果“一年上市、两年亏损、三年ST、四年PT”,挥霍和浪费股东和债权人的财富。在中国的股票市场上,类似PT水仙的公司不少。这类公司实际上在发生经营失败之前一直惨淡经营,效益滑坡,濒临或已经资不抵债,所以几乎没有投资价值,更没有资格继续作为上市公司在资本市场上募集资金。如何提前分析、判定或预测上市公司是否面临财务困境、经营失败或破产风险,是广大投资者关心的问题,也是理论界长期研究的热点问题。上市公司经营业绩持续下降是财务困境(FinancialDis-tress)的前期表现,也是破产风险(RiskofBankruptcy)或经营失败的前兆(Bus-inessFailure)。毕沃(Beaver,1966)就提出企业破产风险的判定问题,并探索以 第5章 复杂系统的神经网络自适应分析与建模195 财务指标判定企业是否将发生经营失败。Altman(1968)首次应用费希尔(Fish-er)线性判定分析对美国的企业破产进行了研究,建立了企业破产的判定和预测模型。此后的45年,学术界围绕着如何更加准确地判定和预测企业经营业绩或经营失败展开研究,研究的重点集中在如下四个方面: (1)企业经营失败的界定。经营失败的界定因研究目的不同而异。毕沃的研究中包括59家破产公司,16家拖欠优先股股利公司和三家拖欠债务的公司;阿特曼(Altman,1968)认为是“进入法定破产的企业”;蒂耿(Deakin,1972)的研究“仅包括已经经历破产、无力偿债或为债权人利益而已进行清算的公司”。由此可见,国外对经营失败的界定因研究目的的不同而不同,主要有:已经破产的企业;进入破产程序的企业;无法还本付息的企业;资不抵债的企业。目前,我们认为对上市公司经营失败的界定可以根据研究目的不同分为:无力付息还本的企业;REO低于银行利率的企业;ST的企业;PT的企业。 (2)判定指标的选择。无论是企业经营失败或破产预测,一般都基于这样三类指标:财务指标信息类、现金流量信息类和市场收益率信息类。阿特曼等学者使用常规的财务指标作为判定指标。在此研究的基础上,阿兹(Aziz)等人以现金流量信息构建判定指标。毕沃发现在有效的资本市场里,股票收益率也如同财务指标一样可以预测破产,但时间略滞后;阿哈诺尼(Aharony)建立了一个基于市场收益率方差的破产预测模型;克拉克等人发现破产公司股票在破产前至少三年内存在负的市场收益率;阿兹等人在比较各类预测和判定模型的准确率后,发现现金流量预测模型的准确性较高。由于研究结果仍然不足以支持我国证券市场有效的论点,因此在构建上市公司经营业绩或财务困境判定模型时,宜选择财务指标和现金流量信息。 (3)判定或预测方法的研究。从研究方法看,企业破产和经营失败的判定和预测方法在不断地改进和创新中,主要有统计判定(StatisticalDiscrimina-tion);时间序列累积和(Time-SeriesCumnlativeSum)和神经网络(NeuralNet-work)三种分析方法。毕沃应用单变量判定分析于预测企业破产;阿特曼应用多变量判定分析于预测企业破产,简称“ZETA模型”。可以说,统计判定分析一直是研究预测和判定企业失败的最重要方法。但是,近年来应用新的研究方法提高预测和判定的准确度是该领域重要课题。威尔松(Wilson)和撒德(Sharda)(1992)等人就曾经使用人工神经网络的方法进行过企业破产模型的研究探索。埃迈(Emel)和帕拉依替(Panayiotis,1999)应用时间序列累计和研究企业的财务困境。我们认为,我国证券市场处于规范和完善之中,应用多种研究方法建立我国上市公司的财务困境或经营失败的判定模型,有利于提高模型的适用程度和预测的准确性。 (4)判定和预测企业破产和经营失败在各行业的应用。判定分析的方法不 196复杂系统的分析与建模 仅广泛地应用于研究和预测上市公司经营失败、破产和财务困境问题,也广泛地应用于解决证券等级判定、银行贷款违约判定、债券付息还本能力判定、银行破产、铁路企业破产等。目前我国上市公司披露的信息比较完整和系统,而且信息披露制度日趋完善,因此开展上市公司财务困境或经营失败判定和预测研究有较可靠的数据基础。近年来,有关我国企业破产判定和预测问题引起学术界的重视。吴世农和黄世忠(1986)曾介绍费希尔判定分析方法和财务指标在预测破产中应用。陈静(1999)、张玲(2000)、吴世农和卢贤义(2001)应用统计判定分析方法,建立了基于财务指标信息的判定和预测模型。总的来看,我国对企业破产或经营失败的判定和预测研究尚在起步之中,主要应用单变量或多变量统计判定分析方法构建二类判定模型。我们以我国上市公司为研究对象,将其按ROE高低分为经营失败风险不同的三类企业,应用神经网络分析方法,通过抽取三类150家上市公司为估计样本,建立基于1998~1999年样本公司财务指标信息的费希尔三类判定模型和BP人工神经网络三类判定模型,以此判定和预测上市公司的经营失败风险。同时,为了验证二种模型的效率,又以同期290家上市公司为检验样本,根据其1998~1999年的财务指标数据进行检验,并且比较了费希尔判定模型和神经网络模型的判定效果。由此可见,从建模方法看,我们不但采用统计判定分析,而且采用BP神经网络分析,引入了新的研究方法;从企业经营失败风险的分类看,将上市公司划分为三类进行三类判定,而不是一般简单的二类判定,使经营失败风险的分类和判定进一步接近现实;从样本构造看,不但样本容量大,而且还分别构建建模样本和检验样本,提高了估计模型的可信度和应用性。 2.建模思想和研究方法 建模思想基于企业的财务指标信息,企业经营失败风险的状态可以简单地描述为二类“:具有失败风险状态”和“没有失败风险状态”。但是,实际上总是存在一批数量众多的企业界于这二类之间。因此,简单地将失败风险划分为二类,构建二类判定模型进行企业经营失败风险的判定和预测,容易将居于两类之间的第三类误判为第一或第二类,结果导致较高的误判率。从理论上来说,准确地确定被判对象的本质差异才能建立合理的判定模型。我们认为,企业经营失败风险不是一个简单的二类可分的研究对象,而是一个多类可分、至少是三类可分的研究对象,即“没有失败风险状态”“一般状态”、或“具有失败风险状态”。从理论上来说,研究对象又可以分为“线性可分”和“线性不可分”,其中“线性可分”有“二类线性可分”和“多类线性可分”;而“线性不可分”又可划分为“非线性可分”和“非线性不可分”,其中“非线性可分”又有“二类非线性可分”和“多类非线性可分”。本文所研究的对象———企业经营失败风险,可能是一种“多类线性可分”,也可能是一种“非线性多类可分”的问题。如果研究对象是线性可分的,费希尔 第5章 复杂系统的神经网络自适应分析与建模197 线性判定分析是理想的建模方法;如果研究对象是非线性可分的,应用能进行非线性可分的神经网络模型对这一问题进行研究可能收到良好的效果。因此,我们将应用BP人工神经网络构建上市公司的经营业绩的判定模型。 BP人工神经网络是众多人工神经网络中的一种。由赫顿(Hinton)等人提出的一种基于误差的反向传播的训练算法,该算法完整而又简明。因此,BP神经网络模型是近年来应用最广泛的人工神经网络模型,它在有教师的学习方式下通过对大量的输入和输出样本的学习能很好地解决一些判别性的问题,如工业过程控制、银行信贷风险评价、保险、自适应控制等方面的判别问题。 BP神经网络的主要思想是把学习的过程分为两个部分,一部分是信息流经过输入和隐含层的处理计算输出,另一部分是输出和期望输出间误差值的反向传播,借此调节网络的权重。如果不采用此学习方式,其算法的基本过程如下: 在构建判定模型时,首先需要根据研究对象或被判定总体的特征确定评价的指标体系,又称判定指标体系。判定指标体系的选择是众多学者争论的焦点之一,阿特曼(Altman,1977)等人在ZETA模型中使用了资产报酬率、收入的稳定性(长期的资产报酬率的标准差的倒数)、利息保障倍数、盈利累积(留存收益/总资产)、流动比率、资本化比率(长期的股票平均市场值/总长期资本)和企业规模七个指标。另外在一些Logiatic模型的研究中,还有学者引入了资产负债率、资产净利率等指标。综观文献,判定指标有财务指标信息类、现金流量信息类和市场收益率信息类,但多数研究从财务指标体系中选择判定变量。作者考虑到近年来我国证券主管机关出台一系列规范和完善上市公司信息披露的制度,绝大多数上市公司财务指标信息的可靠性有基本保障;同时也考虑到目前我国证券市场运行的实际情况,因此,从财务指标体系中选择八个指标为判定变量,即: (1)流动比率,衡量企业短期偿债能力。 (2)负债比率,衡量企业长期偿债能力及资本结构情况。 (3)应收账款周转率,反映企业资产周转能力和营运能力,同时又反映企业的短期偿债能力。 (4)存货周转率,反映企业销售能力和流动资产流动性。(5)总资产收益率,反映企业资产综合利用效果。(6)每股收益,反映企业每股的盈利能力。(7)每股净资产,反映每股拥有的净资产价值。 (8)每股经营性现金流量,反映企业现金的周转能力和支付能力。尽管其中有的指标之间可能有比较高的相关性,但BP人工神经网络是一种非线性的结构模型,变量的数据之间是否存在多重共线性对数据处理的影响不大,因此,在进行指标的选择时将尽量包含比较多的信息,力图从多方面反映企业面临经营失败风险的状态。 198复杂系统的分析与建模 对于神经网络模型,还有需要考虑设置的几个重要参数。首先是网络的层数和隐含层神经元的数量,在实际的模型中一般采用三层的BP神经网络,隐含层神经元的个数是通过多次的试算学习来确定的,即:首先选择数目较少的神经元的个数,然后根据学习效果和收敛的情况,特别是看判别的准确程度来调节隐含层神经元的个数。此外,学习的效率η也是BP网络学习的重要参数,比较高的学习效率将有利于学习速度的提高,加快收敛的速度。但值得注意的是,过高的学习效率有时将产生振荡的情况,即误差在多次迭代的过程中往复变动,而不是朝梯度下降的方向逐渐减小。因此,学习效率的选择也是通过对学习过程的观察来调节的。 3.模型的样本、数据处理和估计结果 本节选取1998~1999年我国150家上市公司的财务指标数据,应用BP人工神经网络模型和费希尔线性判定模型,估计上市公司经营业绩的判定和预测模型,并以290家上市公司为检验样本,对我国上市公司的经营失败风险进行判定和预测分析。首先,将上市公司简单地分成三类,第一类是经营业绩优良、没有失败风险的企业;第三类是经营业绩低下、面临失败风险的企业;第二类是介于这两者之间的企业,该类企业可以称其为临界状态的企业。第二,从三类不同的企业中各抽取一批企业为样本,然后将样本分为学习样本(又称“建模样本”)和检验样本。第三,分别将三类学习样本的上市公司的有关财务数据输入模型,通过模型的学习调节权重,使其能够对三类不同企业的财务特征有自动的识别功能,从而对新输入模型的企业的财务指标数据能识别其不同的风险类别。第四,输入检验样本的财务指标数据,检验拟合的判定模型的准确性。 本节学习样本的构成情况如下:第一类学习样本构成为1998年或1999年连续两年的净资产收益率都高于同期的一年期银行存款利率的50家企业及其年报披露的财务指标,其中1998年、1999年各25家,共50家的样本数据;第二类学习样本构成为1998年或1999年连续两年的净资产收益率都高于0、但低于同期的一年期银行存款利率的50家企业及其年报披露的财务指标;第三类学习样本构成为1998年或1999年连续两年的净资产收益率都低于0的50家企业及其年报披露的财务指标。检验样本共计290家上市公司,第一类检验样本的构成为1998年或1999年连续两年的净资产收益率都高于同期的一年期银行存款利率的169家企业的年报披露的财务指标;第二类检验样本的构成为1998年或1999年两年中任意一年的净资产收益率高于0、但低于同期的一年银行存款利率的23家企业年报披露的财务指标,其中1998年13家,1999年10家;第三类检验样本构成为1998年或1999年两年中任意一年的净资产收益率低于0的98家企业的年报披露的财务指标,其中1998年47家,1999年51家。确定的学习效率为0.01,人工神经网络的隐含层的神经元的数量确定为25个,输入 第5章 复杂系统的神经网络自适应分析与建模199 层的神经元为8个,分别对应选取的财务指标,输出层神经元的个数为1个,如果检验样本输入学习后的人工神经网络,输出神经元的输出结果如果接近1,则该公司为失败风险小的企业,如果结果接近-1,则该公司为失败风险较大的企业,接近0则为处于临界状态的公司。具体而言,简单地按照等区间的方法,如果输出结果大于0.3,则该类公司判为经营状态良好的企业;如果输出结果的绝对值小于0.3,则该类公司为处于临界状态的企业;如果输出结果小于-0.3,则判定为经营状态不好的公司。即对输出Oi,如果:Oi>0.3,判别企业无失败风险;|Oi|<0.3,判别企业处于经营良好和经营不好的临界状态;Oi<-0.3,判别企业有较大失败风险。 经过计算,学习的结果是:在选择学习效率为0.01时,最终学习的误差目标设定为10地收敛。 为了对比研究,本节同时根据建模数的样本数据,使用SPSS(社会统计软件包)进行费希尔三类线性判定模型的估计,得到如下判定模型,其由三个线性判定方程组成。其中,第一个方程表示经营状况良好的一类;第二个方程表示经营状态不好的一类;第三个方程表示处于临界状态的一类。判定方程如下:f1=0.652×流动比率+(1.475×10-3)×负债比率+(5.549×10-4) ×应收账款周转率+0.151×存货周转率+0.381×总资产利润率 +(-0.613)×每股收益+5.516×每股净资产+1.922 ×每股经营性现金流 f1=0.422×流动比率+(1.622×10-3)×负债比率+(2.979×10-4) ×应收账款周转率+(3.1×10 ×每股经营性现金流 f1=0.240×流动比率+(1.554×10 -3-2 -6 ,模型采用Levenberg-Marquardt训练算法,运算839个周期后较好 )×存货周转率+(3.006×10 -2 ) ×总资产利润率+(-8.326)×每股收益+2.828×每股净资产+0.816 )×负债比率+(9.037×10 -4 ) ×应收账款周转率+0.114×存货周转率+0.118×总资产利润率 +(-3.391)×每股收益+5.202×每股净资产+0.404 ×每股经营性现金流 使用X2检验,得到检验统计变量X2=221.172>X2(16,99.95%),说明模型在99.95%的显著性水平上是有效的。 按照模型检验程序,首先将相应的建模样本数据分别代入估计后所得的费希尔三类线性判定模型和BP神经网络判定模型,对建模样本的150家上市公司进行返回判定,判定结果如表5-3-10所示。此后,为了进一步检验上述两个估计模型的应用准确性,将检验样本的270家上市公司的有关财务数据带入上述两个估计所得的模型,对检验样本进行判定和预测,结果如表5-3-11所示。 200复杂系统的分析与建模 对比表5-3-10与表5-3-11的判定结果后可见,应用BP人工神经网络模型和经典的费希尔三类线性判定模型于我国上市公司经营失败风险的判定分析表明: (1)两种模型的判定准确性都是可以接受的,但相比之下,神经网络模型的总体判定准确性更高,说明神经网络模型对样本中包含的数据特征的学习比较充分,增强了对主体不明的样本的判别能力。 (2)两个模型对处于临界状态的样本的判定准确性都偏低,其中费希尔线性判定模型几乎无法判定居中的第二类上市公司,由此可见,相对于BP神经网络判定模型,费希尔三类线性判定模型对处于临界状态的上市公司的判定能力较低。 表5-3-10 模型对建模样本的判定情况费希尔模型判定判据 组别 实际个数 状态良好组状态临界组状态不好组正确判定率 505050 91.33% 表5-3-11 模型对检验样本的判定情况费希尔模型判定判据 组别 实际个数 状态良好组状态临界组状态不好组总体判定率 1692398 72.07% 实际个数160040 实际个数1692398 86.21% 实际个数1531384 BP神经网络型判定判据 实际个数 474941 实际个数 505050 100.00% 实际个数 505050 BP神经网络型判定判据 4.结论和启示 基于财务指标信息的BP人工神经网络方法不失为判定和预测企业经营失败风险的有效方法。应用计算机工具可以方便地完成以上的算法设计和数据运算,建立上市公司经营失败风险的判定模型和预警系统,为包括国家在内的广大投资者和银行在内的债权人判定上市公司质量和经营业绩提供科学的决策手段和可靠的依据,同时也为上市公司加强企业内部管理,摆脱财务困境提供参考依据。对比费希尔线性判定模型,BP神经网络模型具有三方面优势:一是可以应用于判定非线性可分的研究对象;二是判定变量之间的自相关对数据处理和模型估计的影响不大;三是具有较高的判定准确性,特别是面对的研究对象属非线 第5章 复杂系统的神经网络自适应分析与建模201 性可分的数据模式。因此,BP神经网络模型在分析和研究我国上市公司的财务困境、破产风险或经营失败等判定问题方面,具有广泛的应用前景和很高的应用价值。值得指出的是:由于缺乏多年的样本数据,本文仅应用同期的上市公司样本数据估计判定模型,然后应用估计的模型对同期总体中的上市公司进行判定,区分和预测其经营失败的风险。这一模型是否具有超前的预测能力,仍有待于实践的检验。随着时间的推移,我国上市公司的数据库将日趋完善,这将为建立经检验具有超前预测能力的判定模型提供必要的数据条件。 202复杂系统的分析与建模 参考文献 [1] 克劳斯・迈因策尔.复杂性中的思维.曾国屏译.编译出版社和施普林格出版 社,1996 [2] 张本祥,孙博文.社会科学非线性方.哈尔滨:哈尔滨出版社,1997[3] 杨晓帅.神经网络技术让管理更轻松.软件世界,www.swm.com.cn [4] 王安麟.机械工程现代最优化设计方法与应用.上海:上海交通大学出版社,2000[5] WangAnlin.,etal.IdentificationofNonlinerVibrationSystembyaNeuralNet-work,JSMEInternationalJournal,SeriesC,Vol41,No.3,1998 [6] Wang,Anlin.,etal.IdentificationofNonlinerVibrationSystembyaNeural Network(ThePro-dictionofResponsebyLeamingofImpactResponse),Trans-actionsofJSME,No.61~586 ,1995,2253~2258(1995) [7] Wang,Anlin.,etal.IdentificationofNonlinerVibrationSystembyaNeural Network(ThePro-dictionofResponsebyLeamingofPriodicResponse),Trans-actionsofJSME,No.61~5(1995) [8] ODA,J.,Mizukami,T.,Wang,Anlin.,DesignofAdaptiveStructureusing NeuralNetwork,TransactionsofJSME,58-553A,1710(1992.9) [9] ODA,J.,Matsumoto,N.,Wang,Anlin.,SelectionMethodofControlMem-bersforAdaptiveTrussStructuresUsingGeneticAlgorithms(GA),TransactionsofJSME,60~570,513~518(1994.2) [10] 郑建国,刘芳,焦李成.基于案例挖掘的新的智能决策支持系统研究.系统工程与 电子技术,2001,23(12):46~59 [11] 胥悦红,顾培亮,沈惠璋.新产品和改型产品成本估计的神经网络模型.天津商学 院学报,2000,20(3) [12] 傅荣,吴世农.我国上市公司经营失败风险的判定分析———BP神经网络模型和 Fisher多类线性判定模型.东南学术,2002(2):71~79 [13] 孙丹,张秀艳.基于人工神经网络的股市预测模型.吉林大学学报(信息科学版), 2002,20(4):68~70 [14] 钟颖,汪秉文.基于遗传算法的BP神经网络时间序列预测模型.系统工程与电 子技术,2002,24(4):9~11 [15] 宗伟,王美娟,郑淑华.基于径向基神经网络的股价预测.上海理工工学学报, 2002,24(1):81~86 [16] 刘新勇,贺江峰,孟祥泽等.基于神经网络的股市预测.南开大学学报(自然科学), 1998,31(3):39~44 [17] 郑丕谔,马艳华.基于RBF神经网络的股市建模与预测.天津大学学报,2000,33 (4):483~486 [18] 丛爽.面向MATLAB工具箱的神经网络理论与应用.合肥:中国科学技术大学出 第5章 复杂系统的神经网络自适应分析与建模 版社,1998 203 [19] 张超,王安麟.机械系统智能化设计的研究———用神经网络实现系统特性的预测. 机械设计与研究,1998(4):11~13 [20] 朱学军,薛量,王安麟.利用神经网络结构近似分析实现复杂结构的多目标优化设 计.机械科学与技术,2000,19(2):368~370 第6章 复杂系统的人工生命 模型分析 人工生命(ArtificialLife,简称为AL或ALife)是用人工的方法模拟自然生命的特有行为。人工生命的研究可归结为四个方面:抽象性,自繁衍,适应性与自组织。抽象性是人工生命学科存在的前提与总的研究思路,自繁衍是生命延续与发展的基础,适应性与自组织则是生命维持生存的两种手段。人工生命的研究目标就是试图获得进化与自组的一般理论。 6.1 复杂系统的人工生命分析 人工生命的研究为复杂性的研究提供了新的思路与工具。从传统的系统论分析方法讲,人们总是试图运用数学模型去解释复杂性,以及解决复杂性所引起的问题。例如,对实际系统施加再三简化,直到能做精确数学分析的地步。这种自上而下的系统分析方法常常从系统表达开始,已经丢掉了系统复杂性的本质。 6.1.1 人工生命的特征 自然生命十分复杂,概括起来具有以下一些特征: (1)自增殖是生命产生的最基本特性,也是区别于非生命现象的主要特性之一。 (2)新陈代谢是维持生命的存在,是生命现象中最重要、最基本的活动。(3)生命的各部分相互依赖,有机地组成生命整体。 (4)与环境相互作用,适应、改造环境,使生命得以生存与发展。 (5)进化是生命存在与发展的具体过程,该过程使生命自身由低级到高级、由简单到复杂不断演化,不断地完善。 所谓人工生命,简略地说就是其行为具有我们通常所认为的基本的生命特征的某种系统。基本的生命特征一般应包括自繁衍(self-reproduction),进化以及自组织等。人工生命的信条是:生命并不存在于单个物质中,而是存在于物质的组合之中;生命行为从大量简单的物质的相互作用中自下而上(bottom-up)地突现出来,这意味着构成生命的物质本身并不重要。这就是生命的抽象性。故生命系统的实现形式有多种。除了我们已知的碳水化合物的形式,还可以是物理的、符号的、化学的以及程序的形式等,既可以生存于真实的物理环境,也可以 第6章 复杂系统的人工生命模型分析205 生存于真实的软件环境(如计算机操作系统、数据库、Internet)或者某种模拟环境(如积木世界,计算机仿真)。总之,人工生命是用计算机、精密机械等人工媒体所构造出的能生成自然生物系统特有行为的模拟系统。这里“,特有行为”主要是指: (1)自组织化行为,即不是通过全局的整体控制,而是通过大量的非生命分子(也就是行为的各个构成部分)的相互作用而形成某种有序的行为。 (2)学习行为,即在生物进化过程的自适应现象中所发现的自学习及其传播行为。 从科学的角度和工程的角度来考察人工生命,又可以产生两个不同的研究层次。从科学的角度研究人工生命是“通过对生命现象的基本动力学加以抽象,进行生命科学的研究”。而从工程的角度研究人工生命则是“利用生命计算原理研究进化系统和自适应系统的构造方法。” 人工生命的本质就是在人工系统上实现与生物一样的行为。因此,人工生命具有以下明显特征: (1)人工生命的系统构成特征。系统由自律的个体集团构成,个体只具有简单过程的行为。 (2)人工生命的系统控制特征。系统由个体之间局部相互作用的简单规则的集合来控制。既不存在全局控制过程,也不存在全局范围的集团行为规则。 (3)人工生命的系统交叉特征。个体的每个过程都包含与其他个体的交叉,反映了它对局部状态的影响。 (4)人工生命的“突现性”(emergentproperty)行为特征。系统能超越各过程范围产生比较高级的行为,并且有“突现”结构与性质。其中的突生结构,即所谓低维个体行为的组织化完成了极重要的任务,这种任务是通过不断地设定唤起低维个体局部规则而完成的,因此突现结构随时间而进化。 人工生命的上述特征是所有生物共同具有的特征,这些特征隐含在自然生命现象之中。人工生命则是体现生命运动过程的模型化特征,因而它能反映出自然生命的一些特有行为。突现原来是生物学的用语,其较典型的例子是蚂蚁的集团生活。一个一个的蚂蚁只有其单纯的机械行动,可是作为蚂蚁集团,对应食物和敌方的分布,构成高度集团化的行动,提高其生存概率。其结果如图6-1-1产生了由胜任不同工作的特殊化个体构成的社会等级,产生了明确的社会分工和协同现象。虽然其巢蚁集团不存在全体的行动规则,但是一个一个蚂蚁所构成的集合作用突现出智能化集团行动。我们把此现象叫做突现,把其模型化的计算叫做突现计算(emergentcomputation)。 人工生命是对传统的研究和分析方法的重要补充。人工生命并不以真实模拟地球上已知的碳水化合物构成的生命形式为目标,因为不同媒体上创建的生 206复杂系统的分析与建模 图6-1-1 各种各样蚁类的特殊化社会等级 (a)小工蚁 (b)中工蚁 (c)大工蚁 (d)公蚁 (e)女王蚁 (f)士兵蚁(以栓状头堵住巢口) (g)守卫蚁(守卫巢口,在敌人接近时可喷出 毒液,不能生育) (h)饱食蚁(在巢中活动,饱食终日) 命形式显然有其自身的特性。但是,无论何种形式的生命应该具有共同的基本特征。这意味着人工生命的研究有助于揭示构成生命所需的本质特征以及生命演化的最基本规律。而且,通过某种易于创建和精确控制的生命形式,能加快研究生命本质的过程。 人工生命更重要的意义在于其高度的抽象性。许多实际的复杂系统就是人工生命系统,例如股票系统就是一例。但并不是实际的复杂系统均是人工生命系统,比如树叶飘落的过程。能被看作为人工生命的系统在发展变化的过程中永不停息地生成秩序相结构,不断突现出永恒的新奇性。这是系统的一种内禀性质,称之为复杂性。人工生命能让我们以新的眼光审查一些传统的学科,比如经济学、社会学与人工智能等等。如果所建立的基于形式的模型未反映出系统的复杂性特征,其结果往往与实际不符,而采用人工生命技术可能出现极大改观。 6.1.2 人工生命的自繁衍 20世纪40年代末期,刚设计完数字计算机的纽曼(VonNeunmann)开始思考这样一个问题:一台计算机是否能通过编程来复制自己?他认为,任何自繁衍的基因材料,无论是人工的,还是自然的,都必须具有两个不同的基本功能。一方面,它起到计算机程序的作用,是千种在繁衍下一代的过程中能够运行的算 第6章 复杂系统的人工生命模型分析207 法。另一方面,它必须起到被动数据的作用,是一个能够复制和传给下一代的描述。这其实就是自繁衍的本质所在。其建立了既能反映自繁衍的本质又能简洁到可以作数学分析的元胞自动机模型。给定某个元胞自动机中每个元胞的初始状态,随着想象中的离散的元胞自动机的时钟每嘀哒一下,自动机中任何一个元胞都按照规则翻转到一个新的状态,从而造成整个自动机状态的变化。在20世纪60年代中期,史密斯(AlvyRaySmith)给出了所需条件更弱,并且证明过程简洁得多的机器可以自我复制的存在性的证明。 “磁心大战(CoreWar)”则可谓是用计算机程序实现自繁衍的先驱,该游戏在真实计算机的一段被封闭起来的内存内展开或者在一个虚拟计算机上进行,游戏双方各写好自己的程序放入内存中,然后相互展开厮杀,直至一方程序不能执行为止。为了赢得胜利,涌现出许多独具匠心的具有自复制、基于自修复能力的程序,有的程序还有永远不死的功能。随着程序设计得越来越精巧,这种隐藏在黑暗的磁芯里的悄无声息的战斗也就愈加精彩。 SantaFeInstitnte的ThomRay所实现的人工生命仿真器Tierra与磁芯大战有某种程度上的类似。Tierra是一个虚拟的生物计算机,有其独特的硬件构造、机器指令与操作系统等,特别适合于编写数字生物,所谓的生命,就是一段能自繁衍和进化的汇编码,CPU是数字生命的能量资源,内存则构成空间资源。数字生命为获得足够的能量和空间资源而相互之间进行着激烈的竞争,整个系统的启动由注入一个仅能自复制的祖先开始,慢慢便衍生出具有复杂生态关系的生态系统,相对于磁芯大战来说,Tierra最根本的特点在于成功地实现了一套能进化的指令集,使磁芯大战自动升级,并由诸多并发运行的数字生命形成数字生态系统。Tierra不仅为生物学、生态学的研究提供了基于人工生命思想的可操作的手段,而且对一般的复杂性的研究也极具启发性。 6.1.3 人工生命的适应性 20世纪60年代初期,浩兰特(Holland)开始致力于适应性理论的研究,1975年,遗传算法的经典著作《自然和人工系统中的适应性》出版。该书总结了他十多年来对学习、进化和创造性之间深刻的内在联系的思考,对遗传算法作了周密的阐述。在遗传算法中,问题的解表达为由某种有限的固定字符集形成的字符串。该算法启动时先随机生成一批字符串,然后依据所得结果的质量对每个串进行评分。质量高的串用以繁衍后代,质量低的串自动消亡,如此一代代地下去,能解决问题的字符串、并最终占据优势。 70年代末期,浩兰特又提出了基于遗传算法的认知模型———分类器系统。分类器系统遵循三个基本原则:知识能够以类似规则的结构表达,这些规则始终处于竞争之中;经验使得有用的规则越来越强,无用的规则越来越弱;新规则产 208复杂系统的分析与建模 生于旧规则的组合之中。分类器系统分别吸收了人工神经网络与符号智能的优点,并将反馈集成于其中。分类器系统体现了进化适应性与学习适应性的完美统一。 1983年,大卫・哥德贝格(DavidGoldberg)证明了怎样把遗传算法和分类器系统运用于对一个模拟的煤气管网线的控制。该工作为遗传算法和分类器系统赢得巨大的声誉,以至被浩兰特誉为分类器系统研究的一个里程碑。 在80年代后期,针对遗传算法中预先将间距的解规定为固定长度的字符串的情况的不足,斯坦福大学计算机系的教授古座(JohnKoza)提出了遗传程序(GeneticProgramming,简称GP)的概念。在遗传程序中问题的解表示为由函数和端点构成的计算机程序,问题的求解归结为在可能的程序空间中通过复制和杂交寻找一个能较好解决问题的程序。相对于遗传算法,遗传程序中解的表达方式更自然,而且能在更大的空间中搜索问题的解。 但是,无论是遗传算法,还是遗传程序,对解决一些具体问题来说可能已经足够了,但是仍存在一些共同的不足: (1)适应性度量函数是预先定义好的,而真正的适应性应该是局部的,是个体在与环境作生存斗争时自然形成的以及随着环境变化而变化的。遗传算法或遗传程序中的选择机制,充其量来说,只是一个人工选择,而非自然选择。 (2)只考虑到生物之间的竞争,而没有考虑到生物之间协作的可能性,真实情况是竞争与协作并存。这也就是所谓的协同演化。生物学证据表明协同演化能大大加快生物进化的历程。 (3)尽管遗传程序能比遗传算法在更大的空间中搜索问题的解,两者的解空间都同样是有限的。所有生物的结构形式都是预先定义好的字符串或树状结构。这样的系统不能实现无穷无尽的演化,系统所能发生的一切均在设计者的掌握之中。 (4)复制与杂交机制过于简单。所谓的复制,就是一个精确的拷贝,而杂交则是各取被杂交个体的一部分拼凑出下一代。 浩兰特于90年代初期所主持开发的模拟生态系统(ECHO)就是针对上述的前两点。而Tierra则改进了第一、第二与最后一点。 (1)Tierra是具有通用计算能力的虚拟机,而其中的生物则是前面提到的一段汇编程序,不受任何形式的,这意味着能在Tierra上创建任何级别复杂性的生物。也就是说,Tierra是一个开底演化(Open-endedEvolution)的系统。 (2)Tierra系统没有预先定义好的选择机制,而是让数字生命在对资源的争夺中创造出自己的信任函数。也就是让自由演化的生物,在各自具体的生存环境中自动实现优胜劣汰。 第6章 复杂系统的人工生命模型分析209 (3)Tierra系统的繁衍与基因突变机制也相对复杂得多。Tierra中的繁衍分有性与无性两种。不过,有性繁殖如何自无性繁殖演化而来,又如何优越于无性繁殖,以及如何完整实现有性繁殖等问题还只是处于初步的研究。 以上三点充分保证了最大限度地发挥系统演化的创造性。 人工生命的研究者努力在最广泛的意义上回答进化的问题,并使之得到更加深入的研究。对于进化的研究,最令人感兴趣的事情莫过于由简单的初始状态出发演化出逐步增长的复杂性。正如老子在(道德经)中所云:道生一,一生二,二生三,三生万物。进化的观点,从最一般的意义上来说,意味着从研究对象的历史和发展变化中把握对象的实质,而不应将现实与历史割裂开来。这对复杂性的研究有重大的指导意义。但是,目前还没有形成类似于遗传算法那样严密完整的一般的进化理论,所得的仅是一些设计进化模型时应遵循的基本原则。但这并没有妨碍人工生命技术在实际中精巧的应用。 6.1.4 人工生命的自组织 所谓人工生命的自组织,是指具有相互作用的诸多子单元所形成的系统突现出单个子单元所没有的大范围性质。比如说,由简单的分子形成细胞,由诸多盘根错节的神经元形成意识,由形形色色的生物构成的生态系统等等。 元胞自动机除了用于分析生物自繁衍的本质外,还可以用于揭示自然界中的自组织过程。以水分子形成雪花为例。在水分子装配成雪花的过程中,既没有统一的指挥,也没有可供利用的模型,水分子居然知道如何构造出具有复杂形状的雪花。理解这种过程的最好方法是设想分子点阵中每一点都由一台计算机来控制。随着晶体的生长,每台计算机都要巡视周围的点,根据它所发现的周围的情况及某种规则决定它自己的这个点究竟是要占着还是要空着。这种雪花生长的计算机模型就是元胞自动机,元胞自动机的规则是水分子形成雪花的本质所在。元胞自动机在自组织方面的应用属于元胞自动机的动力学研究范畴,也是当今元胞自动机研究的核心。这方面最深刻的结果当属C.G.Langon混沌边缘概念。 CraigReynold的bird系统是用计算机程序实现相同个体自组织的一个良好范例。所谓bird是一种类似鸟类的计算机生物。在启动这个系统时,将bird及障碍物随意散布在计算机屏幕的各处。慢慢地,它们会自发地聚集成群,以一种流体性的形式环绕障碍物飞行。该系统实现的基本思想是让每个bird遵循三条简单的规则而突现上述行为: (1)尽力与其他障碍物及其他bird保持最小的距离。(2)尽力与相邻bird保持相同速率。(3)尽力靠近相邻bird群。 210复杂系统的分析与建模 显然,每条规则都是局部的,没有任何一条规则或个体能起全局控制作用。这意味着该系统抓住了鸟类聚集成群的本质。bird系统的设计非常精巧,但并非毫无规律可循。bird所遵循的三条规则是整个系统的核心,而其实它们仅意味着一件事:每个Bird都竭力模仿其邻居行为或群体的共同行为。RmadSchoonderwoed等采用类似于CraigReynolds设计bird系统的方法解决了电信网络的自动装载平衡问题。 波诺卡斯(Brooks)开创的基于行为的AI则是不同个体的自组织的例子。他所创建的机器昆虫由一系列并发运行的行为模块构成。这些行为模块通过相互之间的激活/抑制关系形成动态的行为网络,在外界环境的刺激以及内在目标的驱动下,行为模块自组织出某种整体行为而达到设计者预期的目的。比如说,让机器人沿墙壁做无障碍物行走。这也就是所谓的没有表示或没有推理的智能。 帕蒂埃(PattieMaes)在行为AI的基础上提出了动作选择(ActionSelec-tion)理论,并建立了一套动作选择机制,所谓动作选择,是指具有一套可执行的行为与传感器数据的生物,如何在复杂的动态环境中选择其下一个行为,从而以优化的方式实现多个随时间改变的目标。在Maes的选择机制中,每个模块由激活条件、增加列表与删除列表等三部分组成,行为模块之间通过前继链、后继链与矛盾链形成行为网络。在任一时刻,如果某模块的激活条件与外界环境匹配或部分匹配,或者增加列表含有部分或全部的目标,就能获得一定的激活能量(activationenergy)。然后,所有在外界环境或目标中获得的能量通过三种链在网络中传播,最后所蓄积的能量超过阈值的行为模块被执行。就这样形成的一串行为,最终完成任务。 动作选择理论已得到广泛的研究和应用,但如何将学习功能很好地集成到行为网络之中仍是一个亟待解决的问题。 自组织的思想对复杂性的研究有极大的启发性,因为系统的复杂性可能源于系统构成单元之间的简单的相互作用。同时,为理解和模拟智能提供了新的途径。对于如何设计出所需的自组织系统,即如何针对具体问题选定基本的构造单元以及如何设计单元间的相互作用,目前还无一般规律可循,几乎完全依赖于个人的经验与直觉。只是必须强调的是,自组织意味着不能让任何单元或作用规则起全局控制作用。这并没有否认系统有可能突现出等级制度,只是要求不要预先在系统中强加上人为的等级制度。这与实际是相吻合的。正如历史学所告诉我们的,是历史造就了英雄,而不是英雄造就了历史。人民大众才是真正的历史缔造者。也正如经济学家所普遍相信的,市场经济比计划经济更合理。 第6章 复杂系统的人工生命模型分析211 6.1.5 人工生命技术的本质 人工生命技术的本质是人机集成,而且对人机集成的具体操作提出了有别于以往的新的挑战:第一,它所采取的是一种自底向上的建模策略,通过人对其子单元之间的相互作用规则及演化方式的调整,就可以达到所需的全局演化行为或某种大范围性质,毫无疑问,这与基于形式的建模所带来的人机结合问题有很大不同,是一个几乎全部依赖于人的直觉以把握系统全局的人机结合过程,体现了人的心智与计算机的高性能的较为完美的结合;第二,在人机的合理分工方面,相对于传统的建模方式,起了一点微妙而又深刻的变化,人机分工的基本原则是能够形式化的工作尽量由机器去完成,一些关键的无法形式化的工作则靠人的直接或间接的参与构成人机结合的系统。现在的问题是,以前无法形式化而被视为定性的东西,现在或许能通过构造某种形式的子单元簇以自组织的方式突现出来。甚至一向被认为最不可捉摸的感情都已采用人工生命技术建立起计算模型,而且可以相信,采用粒度更细的单元会得到更精致的模型。人工生命技术导致了一条从定性到定量的新途径。 随着计算机的普及与Internet的高速发展,人工生命显现出重大的实际意义。经过精心设计的,生存于计算机空间的、能理解用户兴趣的数字生命,简化繁琐的计算机操作,自动获取用户感兴趣的信息,过滤电子邮件并自动回复普通信件,自主购买用户满意的商品,并能讨价还价,以及处理其他日常事务等等。随着时间的推移,这些数字生命越来越适应其主人的需求,这种人机互动技术的发展大大超出了传统的人机界面含意,为最终实现人机结合前进了一大步。但是,任何科学的发展都有其两面性,人工生命也不例外。设计完善的、具有破坏作用的效字生命将会对社会造成巨大的危害,而且远非计算机病毒能比。最终可能在不久的将来,在计算机网络中的数字生命形成完整的数字生态系统,各种人造生物在计算机空间中生存,消亡、合作并互相捕食。 人工生命是一门新兴科学,为我们解决问题提供了新的思想与工具。但是,我们要注意避免两种倾向。一是建立完全自治的系统的观点。就是试图排除任何人为的干涉,让系统自由发展。这会导致系统的复杂性达到无法控制的地步,从而也就无法从中得到有用的东西。故必须坚持人机结合的基本原则,在系统中建立合理的人机接口,使得可以随时调整与控制系统的发展。二是人工生命万能的观点,就是完全否认传统方法的作用。正确的做法是将人工生命技术与一些传统方法结合起来,充分利用各门学科各自的优势。 212复杂系统的分析与建模 6.2 人工生命的方法 6.2.1 人工生命的进化模型 人工生命研究的重要内容之一就是进化现象,而遗传算法则是研究进化现象的重要方法之一。遗传算法的基本内容在前面各章已有详细叙述,它采用符号序列来描述信息集合,然后通过一些遗传操作,如交叉(即符号序列的混合)、突然变异(生成符号序列的新的规则)、选择(选取最优符号序列)、淘汰(去除剩余符号序列)等,得到一些优化解。进一步,可以把上述遗传操作反复执行,以得到最优解。若把它与能够分析生命的个体或集团行为的博弈理论结合起来,则可进一步提高人工生命对生态系统的适应性。因此,遗传算法是人工生命研究的重要理论基础之一。 在本节中,我们着重讨论人工生命的生成与进化模型和遗传算法关系比较密切的几个问题。为此,我们先来看看人工生命的生成结构。 表6-2-1 人工生命的生成结构 生成结构生物体内部系统 动作原理法 生物体外部系统 (实体集团系统) 建模法动作原理法 基于混沌、分形、元胞自动机等的组织化遗传算法、博弈理论等 伴有自组织化的分布式协调原理 生成方法建模法 例 神经网络、免疫网络、元胞自动机、L系统等 人工生命的生成结构如表6-2-1所示。它主要分为两大类:一类是构成生物体的内部系统,主要包括生物体中的大脑、神经系统、内分泌系统、免疫系统、遗传系统、酵素系统、代谢系统等;另一类是生物实体及其集团所表现的外部系统,主要包含生物实体集团对环境的适应系统和遗传进化系统等。因此,可以从生物内部和外部系统来获取各种各样信息,用这些信息生成人工生命。就其生成方法来说也分为两种:一种是建模法,即先把由内部或外部系统获得的生命行为信息模型化,然后再由这些模型生成生命特有行为;另一种是动作原理法,即基于混沌、分形等原理的生成方法。混沌、分形原理是可以用来描述生命行为的原理,因此生命行为是自律分布的非线性行为。例如,直接应用现代计算机技术的人工神经网络系统就是属于生物内部系统范畴的建模系统,而遗传算法则是属于生物外部系统范畴的建模系统。事实上,在神经网络信息处理中,其处理行为就包含着混沌现象。而遗传算法可以被认为是自律分布的并行处理方法。因此,人工生命的产生就是从这样一些模型系统所表现出的各种各样生命固有行 第6章 复杂系统的人工生命模型分析213 为出发,把它们的行为原理概括为一些基本算法,用这些算法来生成人工生命。 可见,遗传算法可以用来研究生物体外部系统(也就是实体集团系统)中生命行为规律,而这种规律往往体现出自律分布的并行特性。以下简述人工生命的进化模型与遗传算法有着许多共同特点的问题。 1.个体表现问题 即使是表现相同行为时,某个体如何表现,要决定于该个体所属搜索空间的结构和大小。而这种搜索空间的结构,决定了所谓的“适应度地形”(即淘汰值曲面,该曲面与搜索策略两者决定了进化能力)。即搜索空间和搜索策略决定了人工生命的进化能力。 例如,JoshuaR.Smith从昆虫的进化角度,给出了以下的表达。他定义昆虫集团的染色体为16个。每个昆虫的染色体用2n个基因表达,其图像在X,Y二维空间的坐标值用傅立叶系数(A1,…,An B1,…,Bn)表达(JoshuaR.Smith,1990,1991): n X=Y= ∑Acos(i・t) i i=1n (6-2-1)(6-2-2) ∑Bsin(i・t) i i=1 在n=件下,随着时间t的增加可以描绘出昆虫的形态。在遗传进化过程中,通过对基因型的增殖、交叉、突然变异,其进化如图6-2-1、图6-2-2、图6-2-3、 图6-2-1 昆虫的第一代进化形态 214复杂系统的分析与建模 图6-2-4所示发展下去。 图6-2-2 昆虫的第二代进化形态 图6-2-3 昆虫的第三代进化形态 第6章 复杂系统的人工生命模型分析215 总之,通过个体表达使人工生命的传感器/效果器具有可变性,使个体的行为、形态受到较小的,是人工生命都面临的一个难题。 图6-2-4 昆虫的进化形态 2.搜索策略问题 在进化搜索空间内,如何设定搜索点的“转移规划”,是人工生命搜索策略的一个重要问题。在GA中,有“淘汰・增殖”“交叉”、“、突然变异”“反馈”、等遗传操作,这些遗传操作的实用形态(或方式)直接影响搜索能力。在人工生命中,与个体的表达相关联,其基准仍然是:搜索策略的制定决定其操作能力与淘汰值曲面形状的组合,是否能使系统脱离局部解决定了它是否具有进化能力。 下面仍然以昆虫捕食系统来说明。在昆虫捕食的搜索空间内,图6-2-5(a)所示的昆虫总是向食物(细菌)浓度高的地方行进。 昆虫的基因由图6-2-6所示的F,R,HR,RV,HL,L移动方向表达。假如(F,R,HR,RV,HL,L)=(2,1,1,1,3,2),昆虫将可能选择向对应较大的数值方向移动。昆虫在移动过程中(见图6-2-5),其年龄、能量、基因码随之发生变化,即在移动过程中成熟、生殖、死亡。由于这些变化,假如对于某些昆虫,其染色体中(F,R,HR,RV,HL,L)的移动方向值没有明显的较大值,可能会出现如图6-2-7(a)所示的移动方向犹豫虫。犹豫虫将自己周围的细菌食完后,因不能广域搜索最终饿死。如图6-2-7(b)所示的直行虫,在集团中具有优势,可得到充分的进化。典型的直行虫(例如,其染色体为(F,R,HR,RV,HL,L)=(9,6, 216复杂系统的分析与建模 0,2,4,1),其基因具有以下特征: (1)向前(F)移动的基因值大(F=9)。 图6-2-5 捕食昆虫的搜索与表达 (a)食细菌的虫群 (b)无性生殖 (c)有性生殖 第6章 复杂系统的人工生命模型分析217 (2)向后退(RV)的基因值小(RV+2)。 (3)向右(R)、左(L)、右后(HR)、左后(HL)的基因值不大不小(R=6)。 图6-2-6 捕食昆虫的移动方向图6-2-7 昆虫的移动方向性 (a)犹豫虫 (b)直行虫 (c)回转虫 图6-2-8 昆虫登山搜索图6-2-9 GA搜索的初始阶段 第(2)个特征是极其重要的。因为持有大RV基因的虫,易于出现回转现象(见图6-2-7(c))的回转虫,其极易死去。其次,虫到达搜索边界,如果不能反方向行进,也易于饿死;为此第(3)个特征可能使虫具有回转捕食的聪明行为。 假如我们以山的高度对应细菌浓度的表达,那么,此昆虫捕食系统将成为一个最优化问题。考虑图6-2-5的虫的信息、有性生殖和无性生殖等,描述昆虫染色体可用以下三个参数来表达: 位置:Xi(t)=(x1i(t),…,xni(t))方向:DXi(t)=(dx1(t),…,dxn(t)) i i 218复杂系统的分析与建模 能量:ei(t) 图6-2-8是昆虫登山搜索问题的形象化表达,其进化过程如图6-2-9、图6-2-10、图6-2-11所示。 图6-2-10 GA搜索的中期阶段图6-2-11 GA搜索的后期阶段 可见,人工生命的进化搜索策略,除恰当地利用遗传操作外,需要凭借操作者的经验和直觉“自行搜索”,或者引入新的操作,提高搜索效率。 3.淘汰与评价问题 在人工生命系统进化的淘汰过程中,集团个体数是可变的。这不同于一般的遗传算法中的淘汰操作。其原因在于,人工生命的淘汰过程,为了反映“自然淘汰”,为了反映个体间相互作用的“局部控制”,希望能够通过局部规划来调整个体密度。 人工生命系统进化的评价,与进化过程的适应度计算方法具有相似性。即人工生命系统的评价没有固定的格式,必须根据实际问题适当地设定。一般地讲,求解问题比较复杂,其适应度的计算方法也将会较复杂。再者,某个体的适应度,并非一定是同其他个体无关而进行简单计算得来的。有时也需要考虑同其他个体的关系而设定适当的计算方法。总之,为了在生物集团进化中反映自然淘汰的原理,适应度从各个体生存的可能性角度,给出了评价个体,表现个体的一个定量的、动态的尺度。 例如,图6-2-8所示的昆虫登山的搜索问题,可以按照式(6-2-3)的细菌浓度最大化来评价。 n f(x1,x2,…,xn)= ∑ i=1 x2i(6-2-3) 总之,评价函数是通过个体局部相互作用动态地产生的,并且事先不明确地予以设定。即在自然界的捕食者与被食者环境中,不能说某种动物是绝对的捕食者,另一种动物是绝对的被食者。 6.2.2 L系统与形态生成模型 L系统是由美国数学家Lindenmyer于1968年提出的。它当时是用来描述 第6章 复杂系统的人工生命模型分析219 红藻(一种植物)生长的一种算法。现在它是用来描述人工生命中生命行为的形态生成原理的算法。 人工生命的范畴是很广泛的。L系统以自动机理论为基础,用符号空间的一个符号序列来表示细胞的状态,把自动机的状态描述为符号序列的状态空间模型。用状态表中的符号序列来表示状态空间中的状态,通过符号序列的变化来描述人工生命的形态生成过程。从模型学角度讲,L系统则是解析、模拟生物体内程序化自组织、自增殖的行为的表达模型,是一种按语法规则来生成图形的数理模型。把它与图形学结合起来则是1984年由A.R.Smith、1986年由P.Prusinkiewicz提出的。从其本质来讲,L系统是一种形式语言,它最基本的元素是字符与字符串,当然它们可以表示各种各样的物理意义,最基本的操作是循环字符重写,所以又称字符重写系统。 令初始字符为F,重写的规则(Rozenberg,1986年)为: F→F[+F][-F] 假定初始字符为F,按重写规则逐次生成字符串为: (1)F[+F][-F] (2)F[+F][-F][+F[+F][-F]][-F[+F][-F]] (3)F[+F][-F][+F[+F][-F]][-F[+F][-F]][+F[+F] [-F][+F[+F][-F]][-F[+F][-F]]][-F[+F][-F][+F[+F][-F]][-F[+F][-F]]] 其中,F表示枝,[和]表示枝的分叉;+表示向顺时针旋转(+36°)成长;-表示向逆顺时针旋转(-36°)成长。于是,式(6-2-4)的(1)、(2)、(3)可以分别表达为图6-2-12(a)、(b)、(c)。 (6-2-4) 图6-2-12 树的成长过程 (a)(1)的结果 (b)(2)的结果 (c)(3)的结果 假如附加更加复杂的重写规则,可以得到如图6-2-13所示的更真实的树形态。图6-2-13(b)的重写规则(+和-的回转角度为25°)为(Wagon,1991年): F→FF+[+F-F+F]-[-F+F-F] (6-2-5) 这样不仅植物可以生长得高大茂盛,而且在各次迭代阶段也有相同的复杂 220复杂系统的分析与建模 图6-2-13 基于L系统的树形态 (a)人工灌木的形态 (b)人工树的形态 度和相似度。需要强调的是,替换只是针对串中的变量(F)进行的,而对标识符(+,-,[,])则不作任何替换,直接保留。我们一般把下式 【基本结构,分枝类型,单位长度,单位角度】 图6-2-12(a)、(b)、(c)分别为由基因 【“1”,F[+F][-F],1,36°】 (6-2-7) 繁殖1代、2代、3代的结果,其具有数据量很小的特点。综上所述,我们可以 (6-2-6) 称作该植物的基因。它决定了一个特定植物的概念形态,与最终的图形比起来, 图6-2-14 L系统模拟植物与树的流程图 第6章 复杂系统的人工生命模型分析221 得到一个由L系统产生植物与树的流程图,如图6-2-14所示。这里,没有考虑树的花、果实、叶子等等,也没有引入任何植物学中的名词,它确实很简单。但是这种模型对植物的形态生成,以及在工程中的模型表达方法上具有重要的意义。 图6-2-15 各种各样的“生物形态” 可以肯定,如果将L系统的各种参数作为基因进行进化,将得到更为复杂的仿真形态。其基本操作与6.2.1节中Smith模型相同,进化后可以得到如图6-2-15的“生物形态”(Dawkins,19年)。 6.2.3 人工生命的研究内容归纳[40] 从近年来关于人工生命的研究内容大致可以归纳为以下几个方面:1.数字生命的研究 所谓数字生命专指以计算机为工具和媒体、计算机程序为生命个体的人工 222复杂系统的分析与建模 生命研究,这方面以T.Ray的数字生命世界Tierra为代表。托马斯(ThomasS.Ray)是一位生物学家、进化论学者,他把生物学上有机体进化的概念引入计算机领域,用数字计算机所提供的资源为他的数字生命提供一个生存环境。他设计的数字生命以数字为载体,探索进化过程中所出现的各种现象、规律以及复杂系统的突现行为。数字生命利用CPU时间来组织其在存储单元中的行为。数字生命以一定的计算机程序形式存在于RAM环境中,它为占据CPU运行时间、存储空间而通过响应的竞争策略相互竞争。一个“生命”必须被设计为适合在这样的环境中生存的某种数字代码程序。这个程序能够自我复制,并且直接被CPU运行。这些机器代码能够直接触发CPU的指令系统以及操作系统的服务程序,通过对资源的占有来体现它在进化过程中的优势地位。 在Tierra的运行中,随着世代的推移,生命体呈现出复杂的现象,种类日益增多,同时单细胞向多细胞进化,形成自己的生态环境。在生命的进化过程中,曾经出现过物种大爆炸的情况。如今,Tierra运行于全球150个网络环境之中,其复杂程度还在不断增大。 数字生命的研究中一个重要的模型就是元胞自动机,元胞自动机被认为具有突现计算(e-mergentcomputation)功能。由于人工生命研究的重要内容是进化现象,遗传算法是研究进化现象的重要方法之一。 2.数字社会的研究 JoshuaM.Epstein和RobertAxlell在计算机上创立了一个数字社会Sug-arscape。这个人工社会用来研究文化和经济的进化过程。他们认为一个人工社会是这样的计算机模型,它包含:一群具有自治能力的行为者;一个的环境;管理行为者之间、行为者与环境之间以及环境各个不同要素之间相互作用的规则。人工社会的行为者是一个能够随着时间发生变化或者具有适应性的数据结构。每个行为者具有遗传特性、文化特性,以及管理它与环境和其他行为者之间的规则。其中,行为者的遗传特性在其生命周期内是固定的。在Sugarscape中行为者的性别、新陈代谢以及视野是其遗传特性;而文化特性是由父母传给子女,并通过与其他行为者的联系而横向地发生改变。其环境里含有可更新的能源———糖,行为者依赖糖组织自己的新陈代谢。人工社会是由各个行为者自我组织形成的,由各个行为者在简单规则的支配下,与人工环境交互作用突现形成的。 3.虚拟生态环境 挪威的凯斯(KeithDowning)提出了名为EUZONE的一个进化的水中虚拟生态环境,目的是提供一个观察生态系统是如何从原始状态进化以及复杂生态系统突现行为的实验手段。它利用具体的物理和化学模型,结合进化规划建构以碳元素为基础的水中生态环境,可以观察到低等动物形体的进化及生存竞 第6章 复杂系统的人工生命模型分析223 争。EUZONE具有两个基本过程:环境模拟和生物的进化,前者尽量反映真实世界的物理、化学以及生物之间的相互作用。生物进化由遗传程序设计和遗传算法来实现。 4.人工脑(ArtificialBrain) 日本的ATR的进化系统部(evolutionarysystemdepartment)致力于开发新的信息处理系统/这种系统具有自治能力和创造性,他们将这样的系统称为“人工脑”。人工脑不仅能自发地形成新的功能,而且能够自主地形成自身的结构。其研制者并不想单纯地再现生物大脑的功能和结构,而是要得到在某些方面优于生物大脑的信息处理系统。 人工脑采取两方面的实现方式:类似生命的模型(life-likemodeling)和社会模型(socialmodeling),包括传统的用于神经系统的学习模型(如人工神经网络)。在类似生命的模型中系统有一个类似于生命系统胚胎发育的功能,使得系统的结构和组成单元能够发生变化,形成复杂系统。在社会系统中系统被视为动态过程,在这个过程中,局部的、各个单元之间的连接使得整体的、全局的功能及次序、状态发生突现。反过来,各个单元也受到全局状态的影响。因此两个方向的相互连接,影响系统发生变化。为使系统具备自治和创造性,系统本身需要一些机制在功能和结构上的自发变化。研制者在系统设计中引入“进化和突现”的极值。 ATR对于人工脑的建构正在从硬件和软件设计两方面来推进,这个项目在数字计算机上通过自然选择的简化来产生复杂和智能化的软件。进化的基本因素是带有可遗传变异的自我繁殖。为了在硬件上实现进化计算,需要一种特殊的硬件平台,可进化的硬件目前处于开发初期阶段。大规模的神经网络和极高速度要求,需要高容量的存储器以及高速的电子器件,CAM—Brain项目运用“进化工程”(evolutionaryengineering)技术来建构、发展、进化出以RAM和元胞自动机为基础的人工脑。 5.进化机器人(evolutionaryrobotics) 生物系统给人们提供了分布式控制的思路,其脑神经系统、遗传系统、免疫系统的功能启发了人们把生物学上的一些现象工程化,并且运用于机器人的设计上。目前正在发展的第三代机器人要求具有人的简单智力和学习能力。 洛德列(RodneyA.Brooks)提出了基于行为的设计方法。此方法在20世纪80年代中期开始使用,设计出比传统设计方法行动更快和更灵活的机器人。进化机器人的操作方式是自律型的,其位置、移动等是突现形成的,其智能也是由各个并行执行的小过程自组织突现形成的,并且这样的小过程分散在整个系统中。进化机器人具有比传统机器人更快的速度和更好的灵活性、鲁棒性,进化计算可以比较容易地植入到这样的系统中,其硬件和软件的设计以及测试费用 224复杂系统的分析与建模 比以前要少。 6.进化软件代理(evoluablemultiagent) 人工智能的研究人员长期以来一直在研究一种复杂的建构软件代理的方法。例如,一个具有人工智能的电子邮件Agent可能知道有行政助理人员,知道某位用户有一名叫George的助理,知道助理必须掌握老板的会议日程,还知道“会议”这个词的信息可能含有日程信息。有了这些知识,这个Agent就可以推导出它应当转送此信息的复制件。 以知识为基础的软件代理要求包括所有常识信息的知识库,但一般软件工程师只能系统地整理比较狭窄领域的知识。采用人工生命的方法进化软件Agent可能是最有发展前途的方法。“人工进化”可以随着时间的推移整理出一个系统中的最有效的代理人(由其主人评定)的行为,并把这些行为结合起来以培养出适应能力更强的群体。可以设计这样的电子邮件Agent,它们能够连续观察一个人的行动,并把他们所发现的任何有规律的行为实现自动化。电子邮件代理观察到用户总是把含有“会议”的信息的复制件转交给行政助理,由此便可领悟到其规律,然后自动做这项工作。此外,Agent可以向执行同一任务的Agent学习,例如,一个电子邮件代理在遇到一份陌生的信件时可以询问它的同伴,从而得知人们通常是看了私人递交给他们的电子邮件后,再看按邮送名单递交的电子邮件。这类合作可以使一群代理以复杂的、明显智能的方式行动。 将人工生命Agent置于新一代计算机网络中,形成一个电子生态系统。对用户有用的或对其他Agent有用的Agent将运行比较频繁,从而得以生存下来并繁殖后代,那些用处不大的Agent将被清除掉。随着时间的推移,这些数字化生命形式将占据不同的生态环境。有的Agent可能进化成优秀的数据库编制者,其他的Agent则是使用它们的索引来找到某一用户感兴趣的文章。可能会出现寄生、共生、免疫以及生物世界中常见的其他现象在计算机网络中的实例。随着外部对信息的要求发生变化,这个软件生态系统将连续地更新自身。 IBM公司目前正在开发一种被称为计算机空间免疫系统的软件,正如脊椎动物的免疫系统在一种新病原侵入机体后几天之内就会产生出对付它的免疫细胞一样,计算机免疫系统可在几分钟内就能产生出识别并消除新遇到的计算机病毒的方法。 6.3 人工生命在工程系统中的分析与建模 人工生命为解决问题提供了新的思想与工具,其研究开发有重大的科学意义和广泛的应用价值。人工生命的研究与开发有助于创作、研制、设计和制造新的工程技术系统,如人工脑、智能机器人、计算机动画的新方法。数字生命、软件 第6章 复杂系统的人工生命模型分析225 生命、虚拟生物可为自然生命活动机理和进化规律的研究探索提供更高效、更灵活的软件模型和先进的计算机网络支持环境。利用人工生命,研究人类的遗传、繁殖、进化、优选的机理和方法,有助于人类的计划生育、优生优育。利用人工生命,研究动物的遗传变异,杂交进化的机理和方法,用于发展动物的新品种、新种群。利用人工生命,研究植物的生长,杂交、嫁接、移植的机理和方法,用于发展植物的新品种、新种群。“人工生命”的研究开发及应用将进一步激发和促进生命科学、信息科学、系统科学等学科的更深层的、更广泛的交流和新的发展。 6.3.1 金融证券市场分析决策中的应用[8][9] 国际上目前运用人工生命算法进行金融证券市场分析决策研究处于蓬勃发展的阶段,有效的运用拟生态技术进行复杂金融市场分析是一个大课题。 人脑自生命诞生以来,经过数十亿年漫长岁月的进化,形成了具有高度智能的复杂系统。人脑不必采用复杂的书籍计算和逻辑运算,却能灵活处理各种复杂的、不精确的和模糊的信息,善于理解、发现、创新、决策和具有直觉感知等功能。大脑在结构上是由140亿个神经细胞组成的大规模网络,它的各种智能功能都是这个大规模网络处理的结果。人工生命算法以大脑细胞的生理机能为研究对象,运用计算机对大脑的基本单元———神经元进行数学模拟,建立的一种由神经元组成的“大脑模型”,这就是人工生命算法雏形。 在证券市场里,千千万万个持有资金大小不等、投资理念各异、投资方法多样的投资者面对一千多只股票分别作出各自的决策,再加上各种政经信息、上市公司经营表现、市场传闻等等因素的影响作用,导致了金融证券市场是一个内部规律极端复杂、较难预测把握的大系统。要想在一个复杂的、每天都推陈出新的系统当中立于不败之地,只有用手中的方法、工具很好地表述这个市场,真正从本质上抓住运作规律,实现所谓的无招胜有招。运用简单的统计运算方法对市场的基本数据进行处理,从而希望揭开蒙在市场规律上的面纱,哪怕是揭开一个小角找到一点点规律就是成功的。比较典型的有均线系统、各种技术经济分析指标、猜想性筹码分析理论等。 光揭开市场规律的一角是远远不够的,因为这个被揭开的角是片面的,是局部规律,它往往会让你做出错误的决策,因为它不是全局把握的规律。人们一直有一个梦想,就是希望拥有叮当猫的知识面包,只要把知识面包放在书上,书上的知识就印在面包上,吃下这个知识面包你就学会了书上的知识,多省力啊。我们就是在打造这样一个知识面包型的人工生命体,因为要解开市场运作的规律光靠人有限的精力是不行的,就算一个非常成功的职业投资者,几十年的投资经历所积攒的经验可能就是那么一两条,光靠这么一两条经验或投资方法就可以很成功了,但代价就是几十年如一日的在失败中学习教训、在成功中积累经验。 226复杂系统的分析与建模 我们的人工生命算法造就的活性生命体不仅能把给它的知识、规律学会,更重要的是它能不知疲倦地主动去寻找没有学过的规律,就像一个不仅会印知识,还会到处主动找书来印的知识面包。这样我们的生命体就能不知疲倦地在海量的股市数据中不断发掘其中的运作规律,成为一个靠增长知识、规律来生长的人工生命活体。 人工生命算法用于证券分析有以下优势: (1)自学习、具有生长能力。人工生命体不仅能把目前绝大部分有限的操盘手法、定势完全学会,同时能每天不知疲倦地在海量的股市数据中不断发掘其中的运作规律,不断发现各种变化的手法和规律,成为一个靠增长知识、规律来生长的人工生命活体。如当政经等大环境及上市公司内部环境因素发生变化时,不少庄家会改变其操作手法以蒙骗股民,人工生命体经过对历史上所有股票相关信息的人工生命矩阵的训练、学习,达到紧跟潮流,永不落伍的目的。 (2)自适应及推广能力强。人工生命体学习生成后,由于人工生命的抗干扰性和自学习能力,在一只股票中形成的生命矩阵能够用于其他股票。比如,同一庄家在不同股票的操盘手法进行发现和跟踪。即使只有几只股票的信息都能够用于分析预测其他股票的走势甚至用于推测大盘的变化趋势,所谓“落叶知秋”,同理,即使只有某一时段的股价信息,也能够预测分析出走势规律。 (3)容错能力强。人工生命有人脑的多细胞容错能力强的特点,在追踪同一种操盘手法规律时,如果庄家有意采取短期的打压或强行拉升股价等手法以迷惑其他投资者时,人工生命体能有效地识别这种某阶段的操盘手法的变异。 (4)抗干扰能力强。人工生命能够全面分辨规律的细节,能从本质上把握操盘手法的规律,从而使庄家表现在价量关系上的干扰性操作手法被区分出去,对有意拉长、缩短操盘手法周期或少量减少部分操盘进程等手段能有效包容,达到抗干扰的目的。 (5)可并行计算、速度快,可处理海量数据。人工生命的特点使之能够同时处理大量数据,人脑比计算机慢得多,但在识别复杂事物的能力方面却比当今最快的计算机还快。现在不同了,人工生命矩阵具备了人脑这方面的优点,同时克服了人脑速度慢、容易疲劳的缺点,对海量数据并行处理分析,得到令人满意的答案。 (6)宏观把握能力强,微观探索时细致、周密、信号量大。人工生命算法能够解决传统算法的单一性和简单性,能够从全局的角度把握股票市场的规律,达到规律自动发掘和规律全面发现的目标,能够同时发现同一或类似操盘手法在不同股票和不同市场的表现规律。这样既能够把握市场的重大机遇,也不放过细小机会。 第6章 复杂系统的人工生命模型分析227 6.3.2 计算机动画[10] 生活在自然界的动物群体是动画创作者们面临的“挑战性”难题。而“人工生命”方法,可以逼真地体现自然生态系统中动物群体的复杂运动和行为,并且可显著地降低动画创作者的劳动强度。其基本方法是构建“人工动物”,创作自激励的自主智能体,去模拟动物个体的真实外观、运动和行为,及动物群体的社会行为表现模式。用计算机模型描述这些人工动物共有的基本特征———生物力学、运动、感知和行为。在虚拟海洋世界栖息着的各式各样的人工鱼群证实了“人工生命”的有效性。每一条人工鱼就是一个自主智能体,它有基于物理的、可变形的、由内部肌肉驱动的肌体;有感觉器官,例如眼睛;有感知、运动和行为控制中枢的鱼脑。每条人工鱼通过肌肉运动的协制,可在虚拟的水流中游动。这些人工鱼展现出一系列的自然行为:在栖息地寻觅食物,绕过障碍物,与捕食者斗争,纵情于求爱仪式以获得配偶。类似于自然鱼群,人工鱼群的行为也是基于它们对外部动态环境的感知和内部动机和习性的。 由于人工鱼的行为能自动适应虚拟的水中环境,它们的运动细节无须动画师的详细刻画或规定。用传统动画制作方法,动画中的动物只是没有任何自主性的三维几何图形,好像没有生命的木偶,动画师在动画制作过程中的角色类似木偶戏的表演者;在计算机图形学中,大多数动物动画的制作是采用传统的、花费大量劳动的“关键帧”方法,计算机只是用来制作“关键帧”之间的中间帧。相反地,采用“人工生命”的动画制作方法,动画中的人工动物是自激励的自主智能体,好像是有生命的真实动物,动画师扮演的是动物世界电影摄影师的角色。通过建立人工动物和它们的生存环境模型来生成动画,将自然生态系统的动画生成看作是动物在栖息地生活的可视化仿真过程已经跨越了“计算机图形学”和“人工生命”两个领域。然而,要将自然生态系统在屏幕上表现得和真实世界一样逼真和迷人是很困难的,主要原因是它本身的复杂性。在一个动画系统中,可能会有许多动物,每个动物都表现出不同的行为。理想情况下,动画师希望以最少的劳动获得丰富的自然景观。如果不仅要表现栩栩如生的动物形态,而且要表现每个动物的运动和它们的行为,其困难程度可想而知。生态系统是由动物和它们生活的环境组成的,动物的行为和它们生存的动态环境是息息相关的,尤其是和其他动物之间的关系。因此,人们在评价动画系统的效果时,有非常严格的标准,即使是一点点小的缺陷,都很容易被看出来。逼真的视觉效果并不是这类动画的惟一要求,要想用在娱乐和教育领域,动画师还应能控制动画的各个方面,尤其是要能够方便地修改动画;例如,改变虚拟环境,变换人工动物的数目、种类及分布的位置、改变动物的性格与它们的相互关系。 传统的计算机动画方法,如“关键帧”方法,制作了不少出色的动画,包括一 228复杂系统的分析与建模 些动物的动画。但是,它存在一些问题: (1)动画角色缺乏自主性。由“关键帧”方法制作的动物角色缺乏自主性,因此降低了动画系统的灵活性和交互能力。由于动物的真实行为受它所处环境状态(如不可动的和可动的物体,树木、岩石和其他动物)的影响,轻微地修改动画剧本,如移动一棵树或添加另一个动物,都需要将整幅动画重新制作,图形中的角色是不能与它所处的周围环境自动协调的,因此,在制作虚拟现实、计算机游戏和交互式教学工具时,采用“关键帧”方法是很困难的。 (2)自然真实性难以保证。采用传统的“关键帧”方法,动画的真实性只能依赖动画师的技巧,除非动画师有很高的技艺水平,否则可能会出现糟糕的视觉效果。特别是由于通常的几何模型不具备力学特性,因此,动画中动物运动的物理正确性是没有保证的,动画中的角色也不会真实地响应外力的作用,动物之间及其周围环境的关系显得很不协调,缺乏自然真实感。 (3)低水平的动作细节控制。采用传统的动画方法,动画角色的每一个动作都要由动画师一一规划。也就是说,动画师要完全控制动画的每一个细节,如制作卡通片;但是,许多应用系统对这种低水平的细节控制并不感兴趣。如创作一个虚拟现实的动物园:某个动物是否在某个时间、以某种姿态出现是不重要的,重要的是狮子和猴子要看起来像真的,它们的运动和行为要逼真。在这种情况下,我们并不希望动画师花费大量劳动去控制动画的每一个细节,因为这意味着动画中的角色只有很少的或根本没有自主性。因此,应当放弃这种低水平的动画控制,去寻求一种高水平的动画控制的方法。 (4)需要动画师的大量劳动。传统动画方法最为成功的应用是在一部很卖座的影片“侏罗纪公园”中制作了恐龙。这些恐龙尽管看起来像真的,但它们只是些图片。它们的每个动作和移动细节,都是有高超技巧的动画师们一步一步设计的。这也就显出了“关键帧”方法的缺陷:随着动画的加长、复杂程度和真实性要求的提高,动画师们的劳动量将显著地增加。 计算机动画的“人工动物”方法的优点: (1)动画角色的外观、形态、运动和行为在视觉上令人信服。 (2)动画角色具有很高的自主性,不必花费动画师的大量劳动进行干预,可以自行完成动画的生成过程。 (3)动画角色应接受高水平的控制。动画师可以在高水平上控制或指挥动画角色的行为。例如,更改动画的初始条件,虚拟环境中不可动的和可动的物体的数目、位置等。 6.3.3 提速因特网[11] 清华大学复杂工程系统实验室是我国人工生命理论研究的基地,他们新近 第6章 复杂系统的人工生命模型分析229 成功地研发了“蚂蚁路由算法在因特网上的应用技术”,建立了一个“蚂蚁路由算法”的仿真网络。仿真的网络节点很多,一如大“网”,当点击源节点后,向很远的目标节点发出一个数据包。模拟开始后,屏幕上许多显示成黑色小方块的“小蚂蚁”背着数据包开始传输,一开始它们显得有点乱,四处乱窜,但几秒钟后“,小蚂蚁”们就在众多的节点中找到了最优路径,并把数据很快有序地传输到目标节点。如果这个最优路径阻断“,小蚂蚁”们又很快找到阻断后的最优路径,完成传输任务。“蚂蚁路由”(Ant-Ronting)算法使网络的扩充无限升级,也不会出现环路、重发和阻塞等问题,邮件都能迅速地发送接收,而信息也不会无端丢失。那么,究竟蚂蚁是如何提速因特网呢? 在生物界,蚂蚁是一种头脑简单、视力也很不好的小东西,然而它却有着非凡的辨别复杂路径的能力。每个工作日,单个蚂蚁爬出洞窝时并没有自己明确的目的或该往哪里去找食,更不明白整个蚁群的活动范围。但是一旦发现食物源,它就会存储特定的画面,并利用连续的画面来帮助自己在走远后能重新找回来(蚂蚁在路径上留下气味),并寻找最短的路径搬回食物。对蚂蚁找路现象有着深刻研究的清华大学复杂工程系统实验室,把人工生命中“蚂蚁路由原理”具体应用到因特网技术上。不久前,清华的研究人员在实验室里开发了一种奇特程序,在这种程序控制下,互联网上的信息会自动精确计算路由的长短,寻找捷径,这也是针对网络规模的无限升级、传统的Internet体系结构中出现的“路由问题”而设计的。现在的每一个路由器都记录了其他路由器的信息,而信息量就会随着网络中子网络数目的增加而迅速增加,直到路由器不能承受。于是产生了速度太慢和带宽不够等诸多问题,由此环路、阻塞、重发和邮件丢失就不可避免。如在网络上发一个数据包到美国东海岸某城,邮路先由日本再经夏威夷,再到西海岸,才到美国东海岸。若日本的节点链接断线或堵塞时,每个信息包寻找 图6-3-1 “蚂蚁路由” 230复杂系统的分析与建模 另外的最优路径,而不会全部堵在一条邮路上。也许“信息蚁”还会立即选择一条从澳大利亚通过的路径。这种随机应变、不盲从、不死等的方法有效地提高了网络的利用率和传输速度,然而这一切都有赖于小蚂蚁们对路由长短的精确计算。“蚂蚁路由”原理是人工生命最典型的例子,它的用途还远不止于此。 第6章 复杂系统的人工生命模型分析231 参考文献 [1] 钱学森,于景元,戴汝为.一个科学新领域———开放复杂巨系统及其方.自然 杂志,1990,13(1):3~10 [2] 戴汝为.从定性到定量的综合集成技术.模式识别与人工智能,1991,4(1):5~10[3] 戴汝为.关于智能系统的综合集成.科学通报,1993,38(14):1249~1256[4] 戴汝为,王珏,田捷.智能系统的综合集成.杭州:浙江科学技术出版社,1995[5] 王寿云,于景元,戴妆为等.开放的复杂巨系统.杭州:浙江科学技术出版社,1998[6] 李厦,戴汝为.系统科学与复杂性.自动化学报,1998,24(2):200~207[7] 周登勇,戴汝为.人工生命.模式识别与人工智能,1998,11(4):412~419[8] Coolsun.人工生命技术的技术理念和优势.金融人工生命论坛[9] 张永光.人工生命的研究进展.中国科学院院刊,2000.3 [10] 涂晓媛,陈泓娟,涂序彦.计算机动画的人工生命方法.软件世界,2000.4[11] 陈祥.神奇人工生命提速因特网.北京青年报,2000.4[12] Langton,C.G.(ed.).ArtificialLift,AddisonWesley,19 [13] Langton,C.G..etal(eds).ArtificialLifeⅡ,AddisonWesley,1990[14] Langton,C.G..etal.(eds).ArtificialLifeⅢ,AddisonWesley,1992 [15] Meyer,J-A.andWilson,S.W.(eds).FromanimalstoanimalsProc.1stInt. Conf.onSimulationofAdaptiveBehavior(SAB91),MITPress,1991 [16] Ackley.D.andLittman.M..Interactionsbetweenlearningandevolution,Artifi-cialLifeⅡ,alsoVideoProceedings,AddisonWesley,1990 [17] Booker,L.Improvingsearchingeneticalgorithms,Geneticalgorithmsandsimu-latedannealing,Davis,L.(ed.),MorganKaufmann,1987.61~73 [18] Cariani,P.EmergenceandArtificialLife,ArtificialLifeⅡLangton,C.G..et al.(eds.),AddisonWesley,1991 [19] Casti.J.L.ParadigmsLost,19 [20] Crow,J.F.GeneticsNotes.SeventhEdition.Dawkins,1976 [21] Dawkins,R.TheBlindWatchmaker,LongmanScientific&Technical,1987[22] Dawkins,R.TheEvolutionofEvolvabilityArtificialLife,Langton,D.G.(ed), AddisonWesley,19 [23] Dewdney,A.K.Computerrecreations,simulatedevolution:whereinbugslearn tohuntbacteria,ScientificAmerican,104~107,19 [24] Gould,S.J.AnurchinintheStrom,EssaysaboutBooksandIdeas,1987[25] Iha,H.,Akiba,S.,Higuchi,TandSato,TBUGS:Abug-basedsearchstrate-gyusinggeneticalgorithms,ETL-TR92-8,alsoProc2ndWorkshoponParallelProblemSolvingfromNature(PPSN92),North-Holland,1992 [26] Iba,H,Higuchi,T,deGaris,HandSato.T.Abugbasedsearchstrategyfor 232复杂系统的分析与建模 problemsolving,ETL-TR92-24.alsoProc.l3thInt.JointConfonArtificialIntel-ligence(IJCA193),1993 [27] Langton,C.G.ArtificiallifeArtificialLife,AddisonWesley,19 [28] Ray,T.S.AnApproachtotheSynthesisofLife,ArtificialLifeⅡ,Langton,C. G..etal(eds.),AddisonWesley,1991 [29] Razenberg,G.(ed.).TheBookofL,SpringerVerlag,1986 [30] Sims,Ketal.Panspermia,ArtificialLiftⅡ,alsoVideoProceedings,Addison Wesley,1992 [31] Smith.J.R.BUGS:Anon-technicalreport,Dept.ofComputerScience,Wil-liamsCollege,1990.8.14 [32] Smith,JR.DesigningBiomorphswithanInteractiveGeneticAlgorithms,Proc. 4thInt.JointConf.onGeneticAlgorithms(ICGA91),1991 [33] Wagon,S.MathematicalinAction,FreemanandCompany,1991[34] Wilson,E.O.Theinsectsocieties,BelknapPress,Harvard,1971 [35] Wilson,S.W.Classifiersystemsandtheanimatproblem.MachineLearning, 1987,2(3) [36] Wright.AH.GeneticalgorithmsforrealparameteroptimizationFoundationsof geneticalgorithms,RawlinsJ.E.(ed),MorganKaufmann,1991.205~218 [37] 中尾智晴.最適化アルゴリズム.株式会社昭晃堂出版,2000[38] 伊庭斉志.遺伝的アルゴリズムの基礎.オーム社出版,1994[39] 陈国良等.遗传算法及其应用.北京:人民邮电出版社,1996[40] 王小平.遗传算法.西安:西安交通大学出版社,2000              
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务
