本页使用了标题或全文手工转换

SNOBOL

维基百科,自由的百科全书
跳到导航 跳到搜索
SNOBOL
编程范型 指令式, 非结构化, 符号式
設計者 David J. Farber, Ralph E. GriswoldIvan P. Polonsky
實作者 David J. Farber, Ralph E. Griswold, Ivan P. Polonsky, 贝尔实验室
发行时间 1962年,​58年前​(1962
穩定版本
SNOBOL4
(1967年,​53年前​(1967
網站 www.snobol4.org 編輯維基數據鏈接
主要實作產品
SNOBOL, SPITBOL
啟發語言
COMIT
影響語言
AWK, bs, Icon, SL5, 采用关联数组的语言

SNOBOLStriNg Oriented and symBOlic Language),即“面向字符串符号式的语言”,是AT&T贝尔实验室David J. FarberRalph E. Griswold和Ivan P. Polonsky,在1962年至1967年间开发的,以SNOBOL4告终的一系列编程语言。在1950年代和1960年代,开发了一些面向文本字符串的语言,它是其中之一,其他语言包括COMITTRAC

概述[编辑]

SNOBOL4超脱于同时代的多数编程语言的是将模式(pattern)作为第一类数据类型(这种数据类型的值可以被编程语言中的任何其他数据类型以所有允许的方式操纵),并提供算符(operator)用于模式串接轮选英语Alternation (formal language theory)。SNOBOL4模式是某一种类型的对象并允许各种操纵,非常类似于后来的面向对象语言比如JavaScript的那种叫做正则表达式的模式。此外SNOBOL4在执行期间生成的字符串可以被当作程序,并要么解释要么编译而执行(如同其他语言的eval函数那样)。

在1960年代后期和1970年代前期,SNOBOL4在美国大学中被广泛教授,并在1970年代和1980年代,在人文学科中作为文本操纵语言被广泛使用。

在1980年代和1990年代,随着新的语言比如AWKPerl使得通过正则表达式方式的字符串操纵成为时尚,对SNOBOL4的使用逐渐衰竭了。SNOBOL4模式归类为BNF文法,它等价于上下文无关文法而比正则表达式更强力[1]。不同于SNOBOL4模式,纯粹的正则表达式是不递归的,这带给SNOBOL4模式以明确的计算上的优势[2];当前版本的AWK和Perl的“正则表达式”,实际上是正则语言意义上的正则表达式的扩展(递归表达式于2007年十二月发行的Perl 5.10中仍未出现[3][4])。

SNOBOL的设计者之一Ralph Griswold,设计了SNOBOL4的后继者,叫做SL5和Icon,它们将SNOBOL4模式匹配的回溯算法与更标准的类ALGOL结构结合起来,同时增加了它们自己的一些特征。

特征[编辑]

SNOBOL4支持很多内置数据类型,比如整数、有限精度的实数字符串模式英语pattern matching数组,和首创的叫做“表格”的关联数组,并允许编程者定义额外的数据类型和新函数。SNOBOL4的编程者定义数据类型的设施在当时是先进的,它类似于更早的COBOL和更晚的Pascal编程语言中的记录

所有SNOBOL的命令行语句都是如下形式的:

label subject pattern = object :transfer

这五种元素每个都是可选项。“标号”(label)位于行首用来标识语句,没有标号的语句开始于一个空白字符,特例的单一标号END表示程序结束。有四种基本类型的运算操作(operation):基础、赋值、模式匹配和模式匹配替换,所有运算操作都有“主语”(subject)。基础操作运算只有一个主语,构成主语的表达式被求值。赋值运算操作有“宾语”(object),等号右侧的值被赋予左侧的变量,如果对主语或宾语的求值失败,则不发生赋值。在模式匹配时,针对“模式”(pattern)对主语进行匹配;如果这时存在宾语,则经由替换规则将其中任何匹配部份替换为宾语。“转移”(transfer)可以是绝对分支,即:(标号);或依赖于前面运算操作的成功(success)或失败(failure)的条件分支,即:S(标号1) F(标号2)。还可以转移到在运行期间程序自身所建立并编译的代码。

SNOBOL模式可以非常简单也可以非常复杂。一个简单模式可以是已知的文本字符串(比如"ABCD"),或对未知字符串的种类的指定(比如模式函数LEN(1));而一个复杂模式可以是一个大型的结构描述,例如一个计算机语言的完整文法。有可能在SNOBOL中实现一个语言的解释器,几乎直接源自它的巴科斯-诺尔范式表达式,加上一些改变即可。

SNOBOL采用了隐式的输入输出机制,分别用特殊标识符INPUT指示标准输入OUTPUT指示标准输出

SNOBOL4模式匹配使用了回溯算法,这类似于逻辑编程语言Prolog所用的算法,它通过确定子句文法英语Definite clause grammar提供了类似模式的构造。这个算法使得利用SNOBOL作为逻辑编程语言比大多数其他语言都要容易。

SNOBOL在一个单一的有垃圾回收的堆中存储变量、字符串和数据结构。

SNOBOL在格式和编程风格的鲜明性上匹敌于APL,不同于更“标准”的过程式语言如BASICFortranC语言,二者都是很激进的。

例子程序[编辑]

Hello, World!程序

          OUTPUT = "Hello, World!"
END

向用户要求输入名字并把它填入输出句子中的简单程序:

          OUTPUT = "What is your name?"
          Username = INPUT
          OUTPUT = "Thank you, " Username
END

根据用户输入与二个模式的匹配情况在三种不同语气的输出中进行选择:

          OUTPUT = "What is your name?"
          Username = INPUT
          Username "J"                                             :S(LOVE)
          Username "K"                                             :S(HATE)
MEH       OUTPUT = "Hi, " Username                                 :(END)
LOVE      OUTPUT = "How nice to meet you, " Username               :(END)
HATE      OUTPUT = "Oh. It's you, " Username
END

持续要求用户一次一个输入自己所有的名字,直到只按Enter键表示再无后续者为止,最后告知用户一共输入了几个名字:

          OUTPUT = "This program will ask you for personal names"
          OUTPUT = "until you press return without giving it one"
          NameCount = 0                                            :(GETINPUT)
AGAIN     NameCount = NameCount + 1
          OUTPUT = "Name " NameCount ": " PersonalName
GETINPUT  OUTPUT = "Please give me name " NameCount + 1 
          PersonalName = INPUT
          PersonalName LEN(1)                                      :S(AGAIN)
          OUTPUT = "Finished. " NameCount " names requested."
END

当前实现[编辑]

目前有一些实现能够获得。Macro SNOBOL4 in C是Phil Budne写的自由开源实现,能够在几乎所有平台上运行[5]。 Catspaw公司提供了对很多计算机平台的SNOBOL4语言商业实现,现在有可以免费获得的版本。Viktors Berstis的Minnesota SNOBOL4是最接近IBM大型主机版本的PC实现,也是免费的[6]

尽管SNOBOL自身没有结构化编程特征,有叫做Snostorm的SNOBOL预处理器,由Fred G. Swartz于1970年代设计和实现,提供了IF、ELSEIF、ELSE、LOOP、CASE和PROCEDURE语句,并用于密歇根大学密歇根终端系统英语Michigan Terminal System(MTS)[7]

Andrew Koenig的Snocone向SNOBOL4增加了块结构构造。Snocone是自包含的编程语言,而非SNOBOL4的真超集[8]

SPITBOL编译器实现也介入了一些特征,尽管不使用传统的结构化编程关键字,却可以用来提供很多通常被认作“结构化编程”的等价能力,最显著的是嵌套if/then/else类型的构造。这些特征已经被增加到最新近的SNOBOL4实现中。经过了很多年作为商业产品之后,在2009年四月,SPITBOL成为了在GNU通用公共许可证下发行的自由软件[9]

参见[编辑]

引用[编辑]

  1. ^ Gimpel, J. F. 1973. A theory of discrete patterns and their implementation in SNOBOL4. Commun. ACM 16, 2 (Feb. 1973), 91-100. DOI=http://doi.acm.org/10.1145/361952.361960
  2. ^ Dr. Dobb's: Programs That Transform Their Own Source Code; or: the Snobol Foot Joke. Dobbscodetalk.com. [2011-12-04]. 
  3. ^ Contact details. perlre. perldoc.perl.org. [2011-12-04]. 
  4. ^ Recursive Regex Tutorial. [2017-03-19]. 
  5. ^ http://www.snobol4.org/
  6. ^ http://www.berstis.com/snobol4.htm
  7. ^ "SNOSTORM", MTS Volume 9: SNOBOL4 in MTS, Computing Center, University of Michigan, June 1979, pages 99-120. Retrieved 1 September 2014.
  8. ^ "The Snocone Programming Language", Andrew Koenig, USENIX (Portland, Oregon), June 1985. Retrieved 2 September 2014. software download link.
  9. ^ spitbol: Raw power and speed for non-numeric computation.

延伸阅读[编辑]

  • Emmer, Mark B. SNOBOL4+: The SNOBOL4 Language for the Personal Computer User. Englewood Cliffs, NJ: Prentice Hall, 1985 (ISBN 0-13-815119-9).
  • Gimpel, James F. Algorithms in SNOBOL4. New York: Wiley, 1976 (ISBN 0-471-30213-9); republished Salida, CO: Catspaw, 1986 (ISBN 0-939793-00-8).
  • Griswold, Ralph E. The Macro Implementation of SNOBOL4. San Francisco, CA: W. H. Freeman and Company, 1972 (ISBN 0-7167-0447-1).
  • Griswold, Ralph E., J. F. Poage, and I. P. Polonsky. The SNOBOL4 Programming Language. Englewood Cliffs, NJ: Prentice Hall, 1968 (ISBN 0-13-815373-6).
  • Griswold, Ralph E. String and List Processing in SNOBOL4: Techniques and Applications. Englewood Cliffs, NJ: Prentice Hall, 1975 (ISBN 0-13-853010-6).
  • Hockey, Susan M. Snobol Programming for the Humanities. New York: Clarendon Press; Oxford: Oxford University Press, 1985 (ISBN 0-19-824676-5).

外部链接[编辑]