9 迁移系统
9.1 迁移系统基本概念
9.1.1 直观理解
迁移系统(transition system, TS) 是一个反应式的系统,直觉上它由一个所有可能状态的集合以及一些迁移(transition)——或者说状态转换(state change)——的集合组成。
比如说,对于交通信号灯来说,当前信号灯的颜色就是这个系统的状态,信号灯颜色的改变就是这个系统的迁移。
再比如说,对于一个程序来说,这个程序中所有变量的值以及 PC 的值就是这个程序的状态,一个程序语句的执行会导致这个程序状态的改变。
当一个状态转换是由于一个外部的事件或者是由于系统的某个行为产生的,那么我们就使用那个事件或者行为来标记这个迁移。
迁移系统是一种描述系统行为的模型,我们可以用有向图来表示,图中的结点表示状态,边表示迁移行为(状态转换)。
下图是一个饮料自动售货机的迁移系统:
9.1.2 形式化定义
定义9.1
迁移系统是一个五元组 A=⟨S,S0,T,α,β⟩ ,其中
S 是一个有限的或者无限的状态(states)集合;
S0⊆S 是初始状态集;
T 是一个有限的或者无限的转移(transitions)集合;
α 和 β 是两个从 T 到 S 的映射,对于任意的迁移 t∈T , α(t) 表示迁移 t 的 源(source) 状态, β(t) 表示迁移 t 的 目标(target) 状态。
源状态为 s ,目标状态为 s′ 的迁移 t 写作 t:s→s′ 。多个迁移可以有相同的源状态或者目标状态。
如果 S 和 T 都是有限的,那么这个迁移系统也是有限的。
定义9.2
一个迁移系统 A=⟨S,S0,T,α,β⟩ 中长度为 n(n>0) 的 路径(path) 是一个迁移的序列 t1,t2,⋯,tn ,使得
∀i,1≤i<n,β(ti)=α(ti+1)∧α(t1)∈S0 类似的,一个无限的路径是一个无限的迁移序列 t1,t2,t3,⋯ ,使得
∀i≥1,β(ti)=α(ti+1)∧α(t1)∈S0 如果 ∃t∈T,α(t)=s∧β(t)=s′ ,则称 s→s′ ,基于此,我们定义一种更加泛化的关系 ↠⊆S×S 使得
令 A=⟨S,S0,T,α,β⟩ 是一个迁移系统,我们称一个状态 s 是可达(reachable)的,如果 s∈S,s0∈S0,s0↠s ;称一个状态 s 是终结状态(terminal state),如果不存在状态 s′ 使得 s→s′ 。
如果一个状态 s 是可达的,并且是一个终结状态,那么我们称 s 是一个死锁状态(deadlock state)。
记 T+ 是所有有限路径的集合, Tω 是所有无限路径的集合。我们可以将原本定义在 S×S 上的 α 和 β 拓展到 T+×S 上。
α(t1⋯tn)=α(t1),β(t1⋯tn)=β(tn)
一个有限的路径 c 代表了一个迁移系统从状态 α(c) 到状态 β(c) 的一个有限的演化过程。
类似地,定义 α(t1⋯)=α(t1) 可以将 α 拓展到 Tω×S 上。
- 一个无限的路径 c 代表了一个迁移系统从状态 α(c) 开始的一个无限的演化过程。
一种 T+ 上的偏积可以如下定义:
若 c=t1t2⋯tn 是一个长度为 n 的路径, c′=t1′t2′⋯tm′ 是一个长度为 m 的路径,且 β(c)=α(c′) ;
则 c⋅c′=t1⋯tnt1′⋯tm′ 是一个有限的路径,长度为 n+m ,且 α(c⋅c′)=α(c),β(c⋅c′)=β(c′) 。
类似的,我们也可以定义 T+×Tω :如果 c 是一个有限路径, c′ 是一个无限路径,使得 β(c)=α(c′) ,则 c⋅c′ 也是一个无穷路径,且 α(c⋅c′)=α(c) 。
对于每个状态 s∈S ,定义空路径 εs 的长度为 0 ,且 α(εs)=β(εs)=s 。
若 c 是一个有穷路径且 s=α(c),s′=β(c) ,则 εs⋅c=c=c⋅εs′ ;如果 c 是一个无穷路径且 s=α(c) ,那么 εs⋅c=c 。
9.1.3 带标签的迁移系统
定义 9.3
一个被字母表 A 标记的,带标签的迁移系统(labeled transition system) 是一个 6 元组 A=⟨S,S0,T,α,β,λ⟩ ,其中
⟨S,S0,T,α,β⟩ 是一个迁移系统;
λ 是一个从 T 到 A 的映射,将 T 中的每一个迁移映射成 A 中的标签 λ(t) 。
直觉上,一个迁移的标签意味着触发这个迁移的行为或者事件。
我们假设两个不同的迁移不可以具有相同的源状态、目标状态和标签,这是符合逻辑的。因为我们没有必要去区分两个由同样的行为 λ(t)=λ(t′) 触发的使得迁移系统从同样的源状态 α(t)=α(t′) 跳转到同样的目标状态 β(t)=β(t′) 的两个迁移 t 和 t′ 。
这就意味着 ⟨α,λ,β⟩:T→S×A×S 是一个单射(单射意味着每个不同的输入会有不同的输出)。
不过对于一个给定的状态,同样的行为或者事件可以引起两个不同的迁移,从而导向不同的状态,也就是说: α(t)=α(t′) 且 λ(t)=λ(t′) 并不一定能够导出 t=t′ 。
之前的自动售货机模型的带标签的迁移系统版本如下:
其中 τ 表示不需要事件驱动的内部行为或者观察不到的行为。
定义9.3
如果 c=t1,t2,⋯ 是一个带标签的迁移系统中的路径,那么触发这些迁移的行为的序列 trace(c)=λ(t1),λ(t2),⋯ 称作这个路径的 踪迹(trace) 。
9.2 迁移系统的等价性
首先回忆一下严格的等价关系的定义:
一个关系 R⊆X×X 是一个等价关系,当且仅当其满足:
自反性(reflexive): ∀x∈X,(x,x)∈R ;
对称性(symmetric): ∀x,y∈X,(x,y)∈R→(y,x)∈R ;
传递性(transitive): ∀x,y,z∈X,(x,y)∈R∧(y,z)∈R→(x,z)∈R 。
不过在迁移系统当中,存在多种对于等价性的表示方法,它们所表示的“等价”的程度是有所区别的,具体地,我们下面会考虑三种等价:
强同构等价(strong isomorphism equivalence)
弱同构等价(weak isomorphism equivalence)
双模拟等价(bisimulation equivalence)
9.2.1 强同构等价
在介绍强同构之前,我们先介绍一下迁移系统同态概念,因为同构是一种特殊的同态。
定义9.4
令 A=⟨S,S0,T,α,β⟩ 和 A′=⟨S′,S0′,T′,α′,β′⟩ 是两个迁移系统。从 A 到 A′ 的一个 迁移系统同态(transition system homomorphism) h 是一个映射的二元组 (hσ,hτ) ,其中
hσ:S→S′,hτ:T→T′ 满足对于 T 中的每一个转移 t ,都有
α′(hτ(t))=hσ(α(t)),β′(hτ(t))=hσ(β(t)) 定义9.5
令 A=⟨S,S0,T,α,β,λ⟩ 和 A′=⟨S′,S0′,T′,α′,β′,λ′⟩ 是两个带标签的迁移系统。从 A 到 A′ 的一个 带标签的迁移系统同态(labeled transition system homomorphism) h 是一个迁移系统同态,并且还满足条件:
λ′(hτ(t))=λ(t) 我们称一个同态 h 是满射的(surjective),如果两个映射 hσ 和 hτ 都是满射。如果 h 是一个从 A 到 A′ 的满射同态,迁移系统 A′ 就称为 A 在 h 下的商。
定义9.6
一个 迁移系统强同构(TS strong isomorphism) h 是一个迁移系统同态,并且 hσ 和 hτ 都是双射。强同构简称同构。
如果存在一个从迁移系统 A 到迁移系统 A′ 的强同构,我们称这 A 与 A′ 是 强同构的(strong isomorphic) 。
一个同构 h=(hσ,hτ) 的逆同态 g=(gσ,gτ),gσ=hσ−1,gτ=hτ−1 依旧是一个同构。
同构是一种等价关系,并且是一种很强的等价关系。如果两个迁移系统是同构的,那么它们唯一的区别就只能是状态和迁移的命名不同了。
考虑如下的两个迁移系统,它们同构吗?
它们其实是不同构的,但这两个迁移系统的行为其实是肉眼可见地等价的。因此,同构这个等价性的要求有些过于高了,必须除了名字以外一摸一样才行,这往往是不必要的。
9.2.2 弱同构等价
对于一个迁移系统的状态 s ,如果 s0∈S0∧s0↠s ,则称这个状态是可达的。
考虑两个迁移系统中可达的状态,以及定义在这些状态上的迁移,我们可以得到两个可达子迁移系统。如果这两个可达子迁移系统是同构的,我们称原来的两个迁移系统是 弱同构(weak isomorphic) 的。
因此,下面两个系统是弱同构的。
弱同构也是一种等价关系。
如果两个系统是同构的,那么它们一定也是弱同构的。
9.2.3 双模拟等价
在实际应用当中,我们更多的用的是这种等价。
定义9.7
令 A=⟨S,S0,T,α,β⟩ 和 A′=⟨S′,S0′,T′,α′,β′⟩ 是两个迁移系统,在 A 和 A′ 之间的一个 双模拟(bisimulation)
是一个二元关系 B⊆S×S′ ,使得
B(S0,S0′) ;
如果 B(s1,s1′) 且 s1→s2 ,则存在一个 s2′∈S′ ,使得 s1′→s2′ 且 B(s2,s2′) ;
如果 B(s1,s1′) 且 s1′→s2′ ,则存在一个 s2∈S ,使得 s1→s2 且 B(s2,s2′) 。
称 A 和 A′ 是 双模拟等价的(bisimulation equivalent) ,当且仅当存在一个 A 和 A′ 之间的双模拟。
双模拟的含义就是两个迁移系统可以相互模拟对方的运行。下面是一个双模拟的例子。
两个同构或者弱同构的迁移系统一定是可以双模拟的,但是两个可以双模拟的迁移系统不一定具有同构或者弱同构的关系。
此外,一些看似行为等价的迁移系统也不一定会满足双模拟关系。比如说下面的这个例子。
9.2.4 简单总结
迁移系统等价性的一个应用是,比如说我想要证明两个建模语言是等价的,我们可以用迁移系统来刻画它们的行为,然后通过证明迁移系统的等价性来证明建模语言行为的等价性。
9.3 迁移系统的运算
9.3.1 迁移系统的自由积
定义9.8
考虑 n 个迁移系统,记为 Ai=⟨Si,S0i,Ti,αi,βi⟩ ,这 n 个系统的 自由积(free product) 是一个迁移系统 A=⟨S,S0,T,α,β⟩ 定义为
S=S1×S2×⋯×Sn T=T1×T2×⋯×Tn α(t1,⋯,tn)=⟨α1(t1),⋯,αn(tn)⟩ β(t1,⋯,tn)=⟨β1(t1),⋯,βn(tn)⟩ 此外,若每个 Ai 都被一个字母表 Ai 标记了,则自由积被 A1×A2×⋯×An 标记,标记方式为:
λ(t1,⋯,tn)=⟨λ1(t1),⋯,λn(tn)⟩ 下面是一个自由积的例子,左侧是两个迁移系统,右侧是他们的自由积。
从自由积的定义中,我们可以看出,自由积假设在一个全局系统当中,所有的子系统都是同时执行它们的转移的。我们可以将时间分成一系列的时刻,在每个时刻,每个子迁移系统都恰好执行一次迁移。换句话说,我们相当于是使用同一个“时钟”来驱动了多个迁移系统,从而形成了自由积这样的全局系统。
具体地,如果迁移系统 A 处于全局状态 s=⟨s1,⋯,sn⟩ ,每个子迁移系统 Ai 处于状态 si 。那么每个 Ai 都可以独立地选择 ti ,从而改变成状态 si′ 。在每个子迁移系统都同时完成一次迁移之后,自由积就相当于完成了一次全局迁移 t=⟨t1,⋯,tn⟩ ,A 的全局状态变成了 s′=⟨s1′,⋯,sn′⟩ 。如果是带标签的迁移系统的话,向量 λ(t) 就是触发全局迁移 t 的全局行为。
9.3.2 迁移系统的同步积
当进程之间进行交互的时候,并不是所有可能的全局行为都是有用的,因为这些交互会受到进程通信和同步的限制。
因此,描述多进程系统的迁移系统一定是各个进程对应的各自迁移系统的自由积的一个子系统,我们可以用同步积来表达这种受到通信和同步约束的全局系统。
定义9.9
如果 Ai,i=1,2,⋯,n 这 n 个迁移系统分别带有字母表 Ai,i=1,2,⋯,n 所定义的标签,并且 I⊆A1×A2×⋯×An 是一个 同步约束(synchronous product) ,那么 Ai,i=1,2,⋯,n 再 I 约束下的 同步积(synchronous product) ,写作 ⟨A1,⋯,An,I⟩ ,是 Ai,i=1,2,⋯,n 的自由积,但是只包含满足 ⟨λ1(t1),⋯,λn(tn)⟩∈I 的全局迁移 ⟨t1,⋯,tn⟩ 。
换句话说,同步积只允许标签向量在同步约束中的全局迁移发生。
比如说,下图中,右侧迁移系统是左侧两个迁移系统的自由积。
如果加上标签,但是不加同步限制的话,带标签的自由积如下图所示。
但如果我们加上 {⟨a,b⟩} 作为同步限制,那么其同步积则如下图所示。
其实,同步限制当中的每个元素,就是一个可以同时发生的迁移所组成的向量。
9.3.3 τ 迁移和共享标签
自由积的定义本身有一个同步时钟的限制在里面,即所有的子迁移系统必须“共同进退”,我们可以引入 τ 迁移的方式来消解这种限制。具体来说,假设所有状态都具有一个自环转移,记为 τ,这样的话,每个子系统就可以独立的选择是否要进行一个实质性的迁移,还是说作一个 τ 迁移以保持当前状态不变了。
下图的右侧就是左侧两个迁移系统引入 τ 迁移情况下的自由积。
除了显示的将所有可能同时发生的迁移列出来作为同步限制以外,我们也可以使用共享标签来表示两个迁移必须同时发生,这样在表达上面会更加简洁。不过这并没有拓展同步积的表达能力就是了,只是换了一种更简便的表达方式而已。
比如说下图的左侧是三个具有共享标签的迁移系统,右侧是它们的同步积。
9.4 利用迁移系统建模
9.4.1 建模时序电路
例如,对于具有输入变量 x ,输出变量 y ,寄存器 r ,输出函数 ¬(x⊕r) ,寄存器评测函数 x∨r 的时序电路,可以用迁移系统进行如下建模(其中状态结点上放的集合中存放的是值为1的信号):
9.4.2 一个互斥协议
Process 1:
while (true) {
out: a := true; turn := true;
wait: await (!b or !turn);
cs: a := false;
}
||
Process 2:
while (true) {
out: b := true; turn := false;
wait: await (!a or turn);
cs: b := false;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
两个并发执行的进程正在尝试在不违反互斥规定的情况下进入一个临界区(critical section)。
一个程序的状态可以通过其中变量的值以及程序计数器(program counters, pc)的值来捕捉。再我们上面的例子中,有
两个程序计数器: pc1 和 pc2 ,程序计数的域为 {out,wait,cs} ;
三个布尔变量: turn , a 和 b ,布尔域为 {True,False} 。
程序的每个状态就是所有的这些变量的值组成的元组,可以写作 (pc1,pc2,turn,a,b)。
于是这个程序可能的初始状态有 {(o,o,F,F,F),(o,o,F,F,T),(o,o,F,T,F),(o,o,F,T,T),(o,o,T,F,F),(o,o,T,F,T),(o,o,T,T,F),(o,o,T,T,T)} 。假设初始时刻 pc1=pc2=o 。为了书写方便,状态名称我们就用首字母代替了。
那么这个程序可能的所有状态有多少个呢? 3×3×2×2×2=72 个,这其实是变量数量以及并发部分数量的指数函数了。因此现代对于程序建模的一个很大的挑战难题就是状态空间的爆炸,因为一个程序的状态实在是太多太多了。
我们以初始状态 (o,o,F,F,F) 为例,
如果进程1执行了 out: a := true; turn := true;
,则程序的下一个状态是 (w,o,T,T,F) ;
如果进程2执行了 out: b := true; turn := false;
,则程序的下一个状态是 (o,w,F,F,T) ;
因此,我们的迁移系统中会有 (o,o,F,F,F)→(w,o,T,T,F) 和 (o,o,F,F,F)→(o,w,F,F,T) 这两个迁移。依此类推,我们会得到类似下图的一个迁移系统(未画完全)。
再比如对于如下的程序片段:
其迁移系统为:
9.4.3 时序性质
像如下一些性质我们称之为 时序性质(temporal properties) :
时序逻辑(temporal logic)是一种描述一个反应式系统中状态之间迁移序列的形式化方法。像“最终”、“从不”这样的性质可以使用特殊的时序操作符来规定,下面我们来学习一种描述时序逻辑的形式化方法—— 计算树逻辑(computation tree logic, CTL) ,具体地,我们会学习 CTL∗ 。
9.5 计算树逻辑
9.5.1 基本概念
计算树展示了从初始状态开始所有可能的执行路径,CTL∗ 公式描述了计算树的性质。
CTL∗ 逻辑公式由路径量词和时序操作符组成。
路径量词有两个:
时序操作符有五个:
X : Xp 表示性质 p 在路径的第二个(next)状态下成立;
F : Fp 表示性质 p 会在路径将来的的某个状态下成立;
G : Gp 表示性质 p 会在路径的全部(globally)状态下都成立;
U : pUq 表示 q 成立的状态的前驱状态下 p 一定会成立,也就是说 p 成立,直到(until) q 成立为止。
R : pRq 表示 q 沿着路径一直保持,直到第一个 p 成立的状态(含这个状态)为止,即 p 释放(release)了 q ,p 不需要一直保持。
在 CTL∗ 中有两种类型的逻辑公式:状态公式(在某个特定的状态下成立)、路径公式(沿着某个路径成立)。
状态公式(state formula)规则的语法如下:
如果 p∈AP ,那么 p 是一个状态公式,其中 AP 表示原子命题(atomic propsitions) ;
如果 f 和 g 是状态公式,那么 ¬f,f∧g,f∨g 也是状态公式。
如果 f 是一个路径公式,那么 Ef 和 Af 是状态公式。
路径公式(path formula)的语法如下:
如果 f 是一个状态公式,那么 f 也是一个路径公式;
如果 f 和 g 是路径公式,那么 ¬f,f∧g,f∨g,Xf,Ff,Gf,Gf,fUg,fRg 都是路径公式。
CTL∗ 是由上述规则产生的状态公式的集合。
CTL∗ 的语意:
9.5.2 CTL和LTL
CTL 和 LTL 是 CTL∗ 的两个子逻辑:
CTL 是 CTL∗ 的一个严格的子集,只允许分时逻辑(branching-time logic)——每个线性时间的操作符 G,F,X,U,R 都必须立即被一个路径量词修饰。
- 例如 AG(EF p),A(FG p)
LTL是线性时序逻辑逻辑(linear temporal logic),组成LTL的逻辑公式都形如 A f ,其中 f 是一个路径公式,其中的子状态公式只能是原子命题。
CTL有10个基本的操作符:
AX 和 EX
AF 和 EF
AG 和 EG
AU 和 EU
AR 和 ER
并且这10个基本操作都可以用 EX,EG,EU 来表达:
AX(f)=¬EX(¬f)
EF(f)=E(1 U f)
AG(f)=¬EF(¬f)
AF(f)=¬EG(¬f)
A[f U g]=¬E[(¬g) U (¬f∧¬g)]∧¬EG(¬g)
A[f R g]=¬E[(¬f) U (¬g)]
E[f R g]=¬A[(¬f) U (¬g)]
下面我们来看一些例子,令 P 表示”我喜欢巧克力”, Q 表示“外面天气暖和”。
AG.P :从现在开始我喜欢巧克力,无论发生什么。
EF.P :我有可能在未来的某一天喜欢吃巧克力,喜欢至少一天。
AF.EG.P :我总是会在未来的某一天,有可能开始喜欢巧克力,并且会一直喜欢下去。
EG.AF.P :这是我生命中关键的一天,基于接下来会发生什么(E),有可能在我的余生当中(G),总是会存在某个未来的时刻(AF),我会喜欢巧克力,不过如果后续发生了什么,我不保证我会一直喜欢下去。
A(P U Q) :从现在开始,直到外面软和为止,我每一天都会喜欢巧克力。一旦外面软和了,我就不保证我会喜欢巧克力了。并且,未来外面一定会暖和的,哪怕只有一天。
E((EX.P)U(AG.Q)) :有可能:最终会有一天,从那一天开始外面会永远暖和(AG.Q),并且在那之前,总是存在某种方式让我在第二天喜欢巧克力(EX.P)。
9.5.3 表达性质
CTL和LTL的表达能力是不可比的,实践中会根据应用场景和个人偏好来选择。