本页使用了标题或全文手工转换

Icon (编程语言)

维基百科,自由的百科全书
跳到导航 跳到搜索
Icon
Icon logo.png
编程范型多范型结构化, 面向文本
設計者Ralph Griswold英语Ralph Griswold
发行时间1977年,​44年前​(1977
穩定版本
9.5.20
( 2020年8月13日,​14個月前​(2020-08-13[1]
型態系統动态
許可證公有领域
網站www.cs.arizona.edu/icon
主要實作產品
Icon, Jcon
衍生副語言
Unicon
啟發語言
SNOBOL[2], SL5[3], ALGOL
影響語言
Unicon, Python[4], Goaldi

Icon是一门领域特定高级编程语言,有着“目的(goal)导向执行”特征和管理字符串和文本模式的很多设施。它与SNOBOL和SL5字符串处理语言有关[5]。Icon不是面向对象的,但在1996年开发了叫做Idol的面向对象扩展并最终变成了Unicon

基本语法[编辑]

Icon语言是衍生自ALGOL类的结构化编程语言,因而有着类似CPascal的语法。Icon最类似于Pascal的是,使用了:=语法的赋值,procedure关键字和类似的语法。在另一方面,Icon使用C风格的花括号来结构化执行分组,并且程序开始于运行叫做main的过程。

Icon还在很多方面分享了多数脚本语言(还有SNOBOL及SL5)的特征:变量不需要声明,类型是自动转换的,就说数字和字符串可以自动来回转换。另一个常见于很多而非全部的脚本语言的特征是,缺少行终止字符;在Icon中,不结束于分号的行由暗含的分号来终结,如果确有必要的话。

过程是Icon程序的基本建造块。尽管它们使用Pascal名称,但工效上更像C函数并可以返回值;在Icon中没有function关键字。

procedure doSomething(aString)
    write(aString)
end

目的导向执行[编辑]

Icon的关键概念之一就是其控制结构基于表达式的“成功”或“失败”,而非大多数其他编程语言中的布尔逻辑。这个特征直接派生自SNOBOL,在其中任何模式匹配和/或替换操作,都可以跟随着成功和/或失败子句,它指定在这个必备条件下要分支到一个语句标签。在这种目的导向分支模型下,一个简单的比较如if a < b不意味着:“如果对右侧的操作运算的求值为真”,就像在多数语言中那样;转而它的意味更像是:“如果对右侧的操作运算成功了”。在这种情况下, < 算子成功,如果这个比较为真,所以结束结果是相同的。此外, < 算子如果成功返回它的第二个实际参数,允许像if a < b < c这样的事情,在多数语言中平常类型的比较下必须写为两个不等式的结合比如if (a < b) && (b < c)

Icon对所有流程控制使用成功或失败,所以如下这个简单代码:

if a := read() then write(a)

将复制一行标准输入到标准输入。即使read()导致一个错误它都会工作,例如,如果文件不存在。在这种情况下语句a := read()会失败,而写操作简单的不调用。

成功和失败将通过函数“向上”传递,意味着在嵌套函数英语nested function内的失败将导致调用它的函数也失败。例如,下面是复制整个文件的一个程序:

while write(read())

read()命令失败的时候,比如在文件结束之处,失败将沿着调用链上传,而write()也会失败。while作为一个控制结构,在失败时停止。类型的例子可以用伪代码写成(使用类似Java的语法):

try {
    while ((a = read()) != EOF) {
        write(a);
    }
} catch (Exception e) {
    // do nothing, exit the loop
}

这种情况需要两个比较:一个用于文件结束(EOF)而另一个用于所有其他错误。因为Java不允许异常作为逻辑元素来比较,就像Icon中那样,转而必须使用冗长的try/catch语法。try块还强加了性能上的惩罚,即使没有异常抛出,Icon避免了这种分布代价英语Distributed cost

Icon称谓这个概念为“目的导向执行”,指称这种只要某个目的达到执行就继续的方式。在上面的例子中目的是读整个文件;读命令在有信息读到的时候成功,而在没有的时候失败。目的因此直接编码于语言中,不用再去检查返回码或类似的构造。

生成器[编辑]

在Icon中表达式经常返回一个单一的值,例如x < 5,将求值并且如果x的值小于5则成功,否则失败。但是,很多表达式在返回值的同时,不“立即”返回成功或失败。下面用everyto来驱动例子;every导致to继续返回值,直到失败。

这是Icon中的一个关键概念,叫做生成器。生成器驱动了在语言中多数的循环功能,但是不需要在每次迭代都显式循环比较值。

在Icon的用语中,一个表达式活函数的求值产生一个“结果序列”。结果序列包含这个表达式或函数生成的所有可能的值。在结果序列被耗尽的时候,这个表达式或函数失败。完成在结果序列上的迭代,要么隐式的通过Icon的目的导向求值,要么显式的通过every子句。

Icon包括一些生成器建造器。“轮选器”(alternator)语法允许一系列项目被生成于一个序列中,直到其中一个失败:

1 | "hello" | x < 5

可以生成1hello5如果x小于5的话。轮选器在很多情况下可以读作“或”,例如:

if y < (x | 5) then write("y=", y)

将写出y的值,如果它小于x5。Icon在内部从左至右的检查所有的值,直到一个成功,或列表成空从而它返回一个失败。函数将不被调用,除非求值它们的形式参数成功,所以这个例子可以简写成:

write("y=", (x | 5) > y)

另一个简单的生成器是to,它生成整数的列表;every write(1 to 10)将调用write()10次。“叹号语法”生成一个列表的所有项目;every write(!aString)将输出aString的每个字符于一个新行上。

这个概念对于字符串操作是很强大的。多数语言包含一个函数叫做findindexOf,返回一个字符串在另一个字符串中的位置。例如:

s = "All the world's a stage. And all the men and women merely players";
i = indexOf("the", s)

这将返回4,这是单词"the"的首次出现位置(假定索引起始于0)。要得到"the"的下一个实例,必须使用替代的形式:

i = indexOf("the", s, 5)

在结束处的5应当从位置5可是查找。所以要提取出"the"的所有出现,必须使用循环:

s = "All the world's a stage. And all the men and women merely players";
i = indexOf("the", s)
while i != -1 {
    write(i);
    i =  indexOf("the", s, i+1);
}

在Icon中,find函数是个生成器,在每次被恢复(resume)的时候,它将返回这个字符串的下一个实例,直到它达到字符串结束处而失败。相同的代码可以写为:

s := "All the world's a stage. And all the men and women merely players"
every write(find("the", s))

find在每次被every恢复的时候,将返回"the"的下一个实例的索引,最终达到字符串结束处并失败。

当然人们有时会想要找到在输入中某点之后的一个字符串,例如,扫描包含多列数据的一个文本文件。目的导向执行也能起效:

write(5 < find("the", s))

只返回"the"出现在位置5之后的那些位置;否则比较会失败。成功的比较返回右手侧的结果,所以把find放置到这个比较的右手侧是重要的。如果写成了:

write(find("the", s) > 5)

则写出来的是5而不是find的结果。

Icon增加了一些循环经过生成器的控制结构。every类似于while,循环经过一个生成器的所有项目,在失败时退出:

every k := i to j do
    write(someFunction(k))

while重新求值第一个结果,而every产生所有结果。every语法实际上以类似于在Smalltalk下的块的风格,将值注入函数中。例如,上面的循环可以用这种方式重新写为:

every write(someFunction(i to j))

生成器可以定义为使用suspend关键字的过程:

procedure findOnlyOdd(pattern, theString)
    every i := find(pattern, theString) do
        if i % 2 = 1 then suspend i
end

这个例子在theString上循环,使用find来查找pattern。当找到一个位置并且它是奇数的时候,用suspend从这个函数返回这个位置。不同于returnsuspend记住这个生成器的状态,允许在下次迭代时在上次中止的地方恢复。

字符串[编辑]

Icon有个特征使得处理字符串更加容易。“扫描”系统重复的在一个字符串上调用函数:

s ? write(find("the"))

是前面例子的简短形式。在这个情况下,find函数的“主语”被放置在形式参数之外,就是问号之前。Icon函数签名标识主语形式参数,所以它可以用这种方式提升起来。

子字符串可以使用在方括号内的一个范围规定从字符串中提取出来。范围规定可以返回到一个单一字符的一个点,或字符串的一个分片(slice)。字符串可以从左或从右索引。在一个字符串内的位置被定义为在字符之间:1A2B3C4,也可以从右规定:−3A−2B−1C0。例如:

"Wikipedia"[1]     == "W"
"Wikipedia"[3]     == "k"
"Wikipedia"[0]     == "a"
"Wikipedia"[1:3]   == "Wi"
"Wikipedia"[-2:0]  == "ia"
"Wikipedia"[2+:3]  == "iki"

这里的最后的例子展示了使用长度而非结束位置。

子字符串规定可以用作字符串内的左值。这可以被用来把字符串插入到另一个字符串,或删除字符串的某部份。例如:

s := "abc"
s[2] := "123"
#s现在的值是"a123c"
s := "abcdefg"
s[3:5] := "ABCD"
#s现在的值是"abABCDefg"
s := "abcdefg"
s[3:5] := ""
#s现在的值是"abefg"

Icon的下标索引是在元素之间的。给定字符串s := "ABCDEFG",索引是1A2B3C4D5E6F7G8。分片s[3:5]是在索引35之间的字符串,它是字符串"CD"

其他结构[编辑]

Icon还有建造列表(或数组)的结构:

aCat := ["muffins", "tabby", 2002, 8]

在列表内的项目可以具有任何类型,包括其他结构。为了建造更大的列表,Icon包括了list生成器;i := list(10, "word")生成包含"wold"10个复本的一个列表。

就像其他语言中的数组,Icon允许项目按位置来查找,比如weight := aCat[4]。就像字符串那样,索引是在元素之间的,可以通过指定范围来获得列表的分片,比如aCat[2:4]产生列表["tabby",2002]。不同于字符串,列表的分片不是左值

“叹号语法”列举一个范围。例如every write(!aCat)将打印出4行,每行一个元素。

Icon包括堆栈类函数,pushpop允许用数组形成堆栈队列的基础。

Icon还通过“表格”包括了集合和关联数组的功能:

symbols := table(0)
symbols["there"] := 1
symbols["here"] := 2

这个代码建立使用的0作为任何未知键的缺省值的一个table。接着向它增加了两个项目,具有键"there""here",和分别的值12

字符串扫描[编辑]

Icon的强力特征之一是字符串扫描。扫描算子?,保存当前的字符串扫描环境并建立一个新的字符串扫描环境。字符串扫描环境构成自两个关键字变量,&subject&pos,这里的&subject是要扫描的字符串,而&pos是在这个主语字符串内的“游标”或当前位置。例如:

s := "this is a string"
s ? write("subject=[",&subject,"] pos=[",&pos,"]")

将产生:

subject=[this is a string] pos=[1]

内建和用户定义的函数可以被用来在要扫描的字符串上移动起来。很多内建函数缺省采用&subject&pos(例如find函数)。下列例子将写出在一个字符串内所有空白界定出的word

s := "this is a string"
s ? {                               # 建立字符串扫描环境
    while not pos(0) do {           # 测试字串结束
        tab(many(' '))              # 跃过任何空白
        word := tab(upto(' ') | 0)  # 下一个word是直到下一个空白或行结束
        write(word)                 # 写这个word
    }
}

一个更复杂的例子演示了在这个语言内生成器和字符串扫描的集成:

procedure main()
    s := "Mon Dec 8"
    s ? write(Mdate() | "not a valid date")
end
# 定义一个匹配函数
# 它返回匹配day month dayofmonth的一个字符串
procedure Mdate()
# 定义一些初始值
static dates
static days
initial {
    days := ["Mon","Tue","Wed","Thr","Fri","Sat","Sun"]
    dates := ["Jan","Feb","Mar","Apr","May","Jun",
              "Jul","Aug","Sep","Oct","Nov","Dec"]
}
every suspend (retval <- tab(match(!days)) ||  # 匹配一个day
                  =" " ||                      # 跟随着一个空白
                  tab(match(!dates)) ||        # 跟随着一个month
                  =" " ||                      # 跟随着一个空白
                  matchdigits(2)) &            # 跟随着至少2位数字
              (=" " | pos(0)) &                # 要么是空白要么是字符串结束
              retval                           # 最终返回这个字符串
end
# 返回n位数字的一个字符串的匹配函数
procedure matchdigits(n)
    suspend (v := tab(many(&digits)) & *v <= n) & v
end

惯用法expr1 & expr2 & expr3返回最后的表达式的值。

参见[编辑]

引用[编辑]

  1. ^ Update version to 9.5.20i. 
  2. ^ Griswold, Ralph E.; Poage, J.F.; Polonsky, Ivan P. The SNOBOL 4 Programming Language 2nd. Englewood Cliffs NJ: Prentice-Hall. 1971. ISBN 0-13-815373-6. 
  3. ^ Ralph E. Griswold, David R. Hanson, "An Overview of SL5", SIGPLAN Notices 12:4:40-50 (April 1977)
  4. ^ Schemenauer, Neil; Peters, Tim; Hetland, Magnus. PEP 255 -- Simple Generators. 2001-12-21 [2008-09-05]. (原始内容存档于2020-06-05). 
  5. ^ Griswold, Ralph E.; Griswold, Madge T. History of the Icon programming language. Bergin, Thomas J.; Gibson, Richard G. (编). History of Programming Languages II. New York NY: ACM Press. 1996. 

延伸阅读[编辑]

  • 权威著作是《The Icon Programming Language》(第三版),Griswold和Griswold著,ISBN 1-57398-001-3。可以下载为PDF文件页面存档备份,存于互联网档案馆)。

外部链接[编辑]