介绍
通用标言是1986年国际标準化组织出版发布的一个信息管理方面的国际标準(ISO 8879:1986 信息处理)。ISO/ANSI/ECMA的一个共同标準,一种用来注解文本文档,提供文档片断的类型信息的规範。该标準定义独立于平台和套用的文本文档的格式、索引和连结信息,为使用者提供一种类似于文法的机製,用来定义文档的结构和指示文档结构的标签。其中标记的含义是指插入到文档中的标记。
标记分为两种:一种称为程式性的标记,用来描述文档显示的样式;另一种称为描述性标记,用来描述文档中的文字的用途。製定通用标言的基本思想是把文档的内容与样式分开。
通用标言的先驱和基础是IBM通用标记语言,通用标言是当今建立结构化文档描述语言规则的战略集合。很多网路页面是用超级文本标记表示出的,就是使用IBM通用标记语言概念建立文档的例子。可扩展标记语言也根源于IBM通用标记语言。
除了通用标言的标準套之外,最终还将包括:通用标言档案交换格式、文档样式语义和规範语言、标準页面描述语言、文字描述和处理语言的一个参考模型、字型和字元信息交换标準、以及一套标準字型。
其它俗称
标準通用置标语言、标準通用标注语言、标準通用标志语言、标準通用标识(或标示)语言、标準通用化标记语言。
优劣点
通用标言的ISO 8879是国际标準规範,所以可信度相当高,其规範结构也相当的严谨,此外通用标言已使用二十几年了,且自1996以来通用标言的规範几乎是未曾变更过,所以通用标言是相当成熟的一种通用性标记语言。
通用标言的档案可以跨平台使用,如可以在不同的电脑硬体或作业系统上被使用,甚至可以被不同的套用软体来使用,因为通用标言是一种高稳定性的国际标準,加上已使用二十几年,所以支持其格式的套用软体与相关资料转换技术就多,所以通用标言的档案可以在各套用领域中被广泛採用,当然其可携性相对就可以提高。
製定通用标言时就考虑须满足广泛的使用者,所以其规範製定得相当完整,可以满足不同套用领域使用者的需求,且与通用标言搭配使用的家族如HyTime与文档样式语义和规範语言也都是国际标準,如HyTime符合ISO/IEC 10744的标準,主要功能是描述动态档案的一种语言,而文档样式语义和规範语言符合ISO/IEC 10179的标準,其製定目标有两个,一为製定通用标言档案显示时的样本形式,另一个是有转换语言的功能。
二、劣点
以上所述提到的通用标言有高稳定性与完整性的优点,这可使得通用标言可以适用在各类套用领域,但这相对的也是通用标言致命的缺点。
由于通用标言的高度完整性与稳定性,相对的其复杂性也高,这一点可以说是通用标言的主要缺陷,如果使用通用标言文法规範来製定DTD中的元素、属性与内容实体,可能需要花上数年的时间才能完全了解其中的标準,可见整个通用标言系统是过于完善而变成复杂。
不止通用标言本身复杂,连同要开发通用标言相关软体也变得复杂,就开发通用标言剖析器而言,用来检查通用标言档案中的控製标记与格式,使用C++(一套利用更基础的程式语言开发的面向对象的高级程式语言)来撰写都得发上几万行以上。
从通用标言的高复杂性,其相对衍生出来的就是高费用,先前也提过通用标言通常被大企业套用在大量的资料上,在通用标言被套用之前必需先製定其档案格式定义DTD,以供使用者能遵循这个DTD中定义的档案结构,但其套用的档案资料通常是复杂的,所以製定该DTD也需花长时间才能完成,所以开发能适用的DTD的费用足相当昂贵的。
其次,由于通用标言的独立性,使得通用标言在许多场合都有用武之地。同可扩展标记语言相比,定义的功能很强大,缺点是通用标言不适用于全球资讯网资料描述,而且通用标言的软体价格非常昂贵。
版本情况
通用标言最标準的三个版本如下:
观点
有观点建议通用标言的注解应如何格式化,而不是作为一种语言。
于是提出如下设计:
百度百科 词条=标準通用标记语言;
百度百科/ 词条=标準通用标记语言;
百度百科(词条=标準通用标记语言)
语言特点
通用标言是一种描述语言的语言,通用标言定义了以电子形式表示文本的方法。它的特
点有:
文档的生产管理和分配的技术方案。通用标言规定了在文档中嵌入描述标记的标準格式,指定了描述文档结构的标準方法,目前在全球资讯网上使用的超级文本标记语言格式便是使用固定标签集的一种通用标言文档。用于通用标言可以支持无数的文档结构类型,并且可以建立与特定的软硬体无关的文档,因此很容易与使用不同电脑系统的使用者交换文档。
样式
通用标言本身正在定义样式的设定标準,即文档样式语义学和规範语言。
使用通用标言对多媒体的创作将带来许多好处。首先,由于其规範性,通用标言可以使创作人员更集中于内容的创作,可提高作品的重复使用性能、可移植性能以及共享性能。例如,可使创作人员更集中于内容的创作,可提高作品的重复使用性能、可移植性能以及共享性能等;通用标言的使用範围很广,除了传统的电子出版物之外,通用标言还可用在其他许多场合。例如,前面介绍的超媒体和超文本文档、全球资讯网页面的製作、资料库、电子邮件、专家系统、雷射唱片-唯读存储器出版物、互动式电子技术手册等方面都大有用武之地。
档案描述
有效性
以下为与有效性检查的定义
组成
一个典型的文档可被分成三个层次:文档类型结构、实例本身和样式。
通用标言主要是处理结构和内容之间的关系,通用标言的文档是由许多实体(文档类型定义加通用标言声明它们都为离散的文本块)来组成。
一份通用标言文档可能有三部分组成:
一、通用标言声明:定义字元集分隔设定集和关键字(以下在本文裏头简称声明)。
二、文档类型序言:定义一般实体和元素类型;包含一个!文档类型(外语全称加缩写:!DOCTYPE)声明与各种标记声明,它们一起组成了一个文档类型定义(外语首字母缩略词:DTD)。
三、某实例本身:包含一个顶级元素和实例的内容。
标记类型
描述性
描述性标记解放了档案用于多种用途。并分为结构化描述性标记与名义上的描述性标记。描述性结构化的标记标识文档组件和它们的逻辑关系。
程式性
程式性的标记的特点通过进一步的限製,到目前为止所有程式标记一直是专有的。例如,WordPerfect、WPS上建立的文档无法在Microsoft Word、OpenOffice完美处理。
声明
声明是由以下八部分组成:
七、特点使用:这是一项可选的特徵用于修改标记,典型的特点比如省略标签、短引用等,接下文中会提到;(汉语名:特点、外语代码:FEATURES)。
八、套用程式特定信息:特定于某应用程式的信息(用双引号来描述),通用标言解析器要把双引号裏头的资料传递给某应用程式;(汉语缩写:程式信息、外语全称加缩写代码:APPINFO)。
範例一:
範例二:
补充档案
补充档案是指通用标言的头信息,优先使用外部的通用标言标记放在一个辅助输出档案;就像AMD的电脑中央处理器裏头的任务优先权暂存器八号控製暂存器(外语首字母缩略词:CR8)来传递参数时优先使用外部中断。
终端变数
终端变数表示常见的字元类至所有实例文档。
文法:(和现代众多作业系统都在使用的核心模式、从硬体上支持了虚拟记忆体储管理和多任务的电脑中央处理器模式、保护其他程式段的模式保护模式中的记忆体储器空间分段边界单位颗粒度标记类似,指明数量,确定数量内容及多与少。)
变数名[生产数量]{定位器}{定位器}
百度百科词条裏头的实体{6.2, 296:5}
终端常量
和上述终端变数使用同样的製式,其作用基本等同。
文法
元素文法
实际例子:
以下必须啓用声明裏头的相关功能。如果在有些版本的通用标言裏头没有相关的功能命令(比如没有短引用),那麽就不能实现文中所提到的短引用。
短引用(引用短实体分隔设定)标签可以被替换为定界符字元串。
短引用外语全称加缩写代码:(SHORTREF)。
例如在Creole裏头它就是借用了短引用的概念,它裏头的标题开始标签和标题结束标签都是(==)、加粗标签都是(**)。
二、短标记
实际例子:
一个特点:自以为是的空标签。 例如空结束标记>在<元素><附属元素>逢二进一>元素>裏头。继承它的值是从最近的完整开始标记起。在本例中,是<附属元素>(也可以说它会关闭离它最近开启的项目)。这样的表达是等价于<元素><附属元素>逢二进一附属元素>元素>。外语代码:(SHORTTAG)。
三、没得结束标签
实际例子:
它的结构相当于
外语缩写:(NET)。
四、话的结尾不打尾标记
如果要利用此功能要将声明裏头的省略标签处于是的开启状态。外语代码(全部):OMITTAG YES;当然再结合文档类型定义裏头的!元素表示开始或结束标签是不是允许被忽略(- -、- O、O O)。连字元指示标记是必需的存在的、外国语O大写或小写均可。直译为中文(- 略、- -、略 略)。而且目标元素在文档类型定义裏没带(#必要)外国语#REQUIRED属性(该属性表示在文档实例中必须为目标元素的属性提供一个值)所以综合上述被定义的标签可以明确上下文。
将档案类型定义裏头写如下:
那麽则表示为如下所述:
注意,若像这样:
加个与省略标签不相关的空(外语代码:EMPTY)时(其声明它的内容是空的),而且结束标记被忽略,那麽在通用标言裏头此句话就是一条无效标记。在这方面文法不同于可扩展标记语言裏头的空元素。
注解文法
以下一、二、注解的效果同高级程式语言C语言注解一样,利用开始标记/*和结束标记*/来进行多行注解。
比如:
三、空注解,建设是被忽略的,可用于各种不同的目的(比如机器指令中无或隐含运算元的零地址指令用于其它的目的)。
其它文法特点
短标记、空结束标记啓用(外语全称加缩写:NETENABL)、即时空结束标记(外语全称加缩写:IMMEDNET),特徵允许缩短标签但需围绕一个空的文本值,但禁止缩短完整的标签:
<表示法>表示法>可以写为:<表示法//
其中,第一个斜杠代表空结束标记啓用的关闭开始标记;第二个斜杠代表空结束标记。
注意:可扩展标记语言定义空结束标记啓用的关闭开始标记需带一个/(左斜杠),空结束标记需带一个>(尖括弧)。因此同等的结构在可扩展标记语言裏头则显示为<表示法/>。
文本在同一行之上:
允许一个标记项目不需尾标记在行结束(特别适用于标题等)。当然需要最小化标签无论是短引用或资料标记。
然后第三个特征是,在同一行上的文本: 要麽使用短引用(外国语缩写代码SHORTREF)或资料标签(外语代码DATATAG)来达到最小化的目的:
如果文档类型定义包含以下:
在具体的的文法裏头,引;短;是一个短参考分隔设定。
等同于:
定义
本国际标準(通用标言)套用以下定义:
标準体系
标準体系相关
实际套用
以下简要说明通用标言的结构化信息处理与资料交换在一般行业的套用:
1985年牛津英语词典电子版

















