您现在的位置:佛教导航>> 五明研究>> 佛学杂论>>正文内容

汉文电子佛典制作与运用之研究

       

发布时间:2009年04月23日
来源:不详   作者:惠敏法师
人关注  打印  转发  投稿

汉文电子佛典制作与运用之研究
  ──以《瑜伽师地论》为例
  释惠敏[*]、维习安、杜正民、郭丽娟、周邦信
  *台北艺术大学教授
  中华佛学学报
  第十四期(2001.09)
  页43-53
  --------------------------------------------------------------------------------
  页43
  提要
  本研究以《瑜伽师地论》之异译本及其纲要书为例,规划其电子数据之制作(create)与标志(markup)流程。尝试采用 TEI 的卷标集(tag sets),标志文件(document)之(1)研究背景特色(contextual features,例如:〈monogr〉、〈series〉、〈analytic〉),(2)结构特色(structural features,例如:〈div〉),(3)非结构特色(non-structural features,例如:〈item〉)等。
  其次,将以述已制作与标志的电子数据之结构特色(structural features)作互参(cross-reference)标志(例如:〈linkGrp〉〈link targets="A1 B1 C1"/〉〈link targets="A2 B2 C2"/〉〈/linkGrp〉,〈link targets="T1579DD065 T1581DB002 T1582DB001"/〉),并且研发界面(将 XML 经文文件借着程序 xml2dir.bat,同时用 IE5, xml parser 和 DHTML,javascript 呈现目录栏。以联结栏(link)借着程序 html.bat 呈现对照栏),以便作异译本之比对、纲要书之对照的运用。
  关键词:1. 电子佛典 2. 《瑜伽师地论》 3. SGML 4. XML 5. TEI
  目次
  一、研究目的
  二、结果与讨论
  (一)汉文电子佛典制作流程之实例化
  1.制作与标志(markup)文件(document)之研究背景特色(contextual features)
  2.制作与标志文件(document)之结构特色(structural features)
  3.制作与标志文件(document)之非结构特色(non-structural features)
  (二)汉文电子佛典运用之实例:异译本之比对、纲要书之对照
  1.依相关文件之结构特色(structural features)作互参(cross-reference)标志
  2.研发界面
  3.电子文件上网
  三、结语
  页44
  一、研究目的[1]
  佛学典籍是人类共有的文化宝藏,但其相关的资料浩瀚如海,令人望洋兴叹。因此,若能运用信息科技之数字化、电子化的媒体与工具,运用「多价」(multivalent)[2] 文献模式的特性,与标准化的标志(markup)语言(例如:SGML、HTML、XML),[3] 有效地管理佛学信息,进而改善其教学、研究、服务等层面,不仅是佛学界的创举,也将是人文科学界的新潮流。
  玄奘(602~664)的传记说明他赴印留学目的之一是学习与翻译《瑜伽师地论》(简称《瑜伽论》)。它记载着瑜伽师(修行者,禅师)的修行阶位与境界,也是一部大乘佛教的百科全书,它能够呈现出心理学、哲学、宗教学等,精致精神生活的追求者之丰富经验。因此,本研究以《瑜伽论》为主题,其研究目的如下:
  1.以《瑜伽师地论》、其纲要书及异译本为例,研究电子佛典之输入与缺字处理、校对、标志、全文检索、网络系统等制作方面的问题与解决方案。
  2.以此数字化的数据为例,考察其在使用接口、研究方法、教学活动等各种应用上的可能性。
  --------------------------------------------------------------------------------
  1. 本论文是行政院国科会委员会专题研究计划(NSC 89-2411-H-119-004)成果之一。
  2. 传统的文献与数字化文献的差异是:前者是单块式(monolithic),后者是多价式(multivalent)。传统的文献观念,与「书」同义。书是独立式、互不连结,查询费时,互参也麻烦,只提供给人「读」的功能。由于数字化文献基本单位可以是字、笔划、乃至图素(pixel),所以重组、连结都很简易快速;而且同时可提供给机器(processor)与人(human mind)「读」的功能。因此,数字化文献具有「多价」(multivalent)文献模式的特性,所谓多种价值(values)、意义(meanings)、运用(appeals)。"Multivalent Documents: Anytime, Anywhere, Any Type, Every Way User-Improvable Digital Documents and Systems", Thomas A. Phelps, A dissertation for Ph. D, University of California, Berkeley (1998).
  3. 1986年 SGML(Standard Generalized Markup Language,标准通用标记语言),其所用的标签(tag)可以扩张、检查;后来为了 World Wide Web(全球信息网)的需求,HTML(Hyper Text Markup Language,超文件标记语言)是 SGML 的一项运用,具有指定连结、指定格式的功能。1998年,为了 Web 最佳运用,开始从 SGML 推演成 XML(Extensible Markup Language,可扩展性标记语言),它可以与 HTML 整合,以处理数据的显示。XML 是可以与 SGML 互补,可以对 Web 上的数据作结构化与描述用,而且也可广泛支持不同种类的应用程序。详参 Charles Goldfarb The SGML Handbook Oxford 1990. SGML。XML(Extended Markup Language)是由 W3C(World Wide Web Consortium)所制定,XML 1.0版规格书已由 W3C 核准,可参 http://www.w3.org/XML。
  页45
  二、结果与讨论
  (一)汉文电子佛典制作流程之实例化
  以《瑜伽师地论》之异译本及其纲要书为例,运用电子数据的特点,经过一年的实作,其制作(create)与标志(markup)流程可依如下三个步骤进行:
  1. 制作与标志(markup)文件(document)之研究背景特色(contextual features)
  以参考书目(bibliography)为例。采用 TEI 的卷标集(tag sets)标志《瑜伽论》的各类(单一书藉〈monogr〉,论著收于丛书〈series〉,论文〈analytic〉收于期刊杂志)参考数据,同时可联结到解题、《瑜伽师地论》全文及工具书。如下所示:
  (1)以参考书目(bibliography)为例
  〈biblStruct〉
  〈monogr lang="zh" id="ISSN1017-7132-11"〉〈!-- 11=期号 --〉
  〈editor〉释惠敏〈/editor〉
  〈title〉中华佛学学报〈/title〉
  〈imprint〉
  〈pubPlace〉台北〈/pubPlace〉
  〈publisher〉中华佛学学报〈/publisher〉
  〈date〉1998〈/date〉
  〈/imprint〉
  〈/monogr〉
  〈/biblStruct〉
  〈biblStruct xrefs= "http://ccbs.ntu.edu.tw/FULLTEXT/JR-BJ001/11_02.htm
  http://humanity.nia.edu.tw/~huimin/paper/yogasila/yogasila.htm"〉
  〈analytic lang="zh"〉
  〈author〉释惠敏〈/author〉
  〈title level="a"〉瑜伽菩萨戒本之心理与伦理观〈/title〉
  〈/analytic〉
  〈monogr lang="zh" idref="ISSN1017-7132-09"〉
  〈!-- In --〉〈!-- 中华佛学学报 --〉
  〈imprint〉
  〈biblScope type="pages"〉9-48〈/biblScope〉
  〈/imprint〉
  〈/monogr〉
  〈monogr〉
  〈!-- Rpt. in --〉〈!-- 法鼓文化 --〉
  〈title level="m"〉戒律与禅法〈/title〉
  〈editor〉中华佛学研究所论丛〈/editor〉
  〈imprint〉
  页46
  〈pubPlace〉台北市〈/pubPlace〉
  〈publisher〉法鼓文化〈/publisher〉
  〈date〉1999〈/date〉
  〈/imprint〉
  〈/monogr〉
  〈series〉
  〈title level="s"〉中华佛学研究所论丛〈/title〉
  〈respStmt〉
  〈name type="person"〉释果毅〈/name〉
  〈resp〉编〈/resp〉
  〈name type="org"〉法鼓文化事业有限公司〈/name〉
  〈/respStmt〉
  〈biblScope type="volume"〉20〈/biblScope〉
  〈/series〉
  〈/biblStruct〉
  (2)以解题、导读为例
  〈div1 n="1" type="entry"〉〈div2 n="1" id="jie1579DB001" type="解题之summary"〉〈head〉瑜伽师地论导读〈/head〉
  〈pb n="121"/〉
  〈lb n="121_01"/〉〈p id="jie1579p0001"〉本论与玄奘法师的渊源甚深,如《大慈恩寺三藏法师传》卷
  〈lb n="121_02"/〉一所说:「(玄奘)法师既遍谒(国内)众师,备 其说,详考
  〈lb n="121_03"/〉其理,各擅宗涂,验之圣典,亦隐显有异,莫知适从,乃誓游西
  〈lb n="121_04"/〉方,以问所惑,并取十七地论以释众疑,即今瑜伽师地论也。」
  〈lb n="121_05"/〉而《大唐故三藏法师行状》又说:「(玄奘)请戒贤法讲师瑜伽
  〈lb n="121_06"/〉论,同听者数千人,如是听瑜伽三遍」。回国后,何时开始翻译
  〈lb n="121_07"/〉?根据史料是有异说,日本加藤精神认为贞观二十年是正确〈note type="foot" n="01"〉加藤精神:《国译一切经》「瑜伽师地论解题」,十~十一页。〈/note〉,
  〈lb n="121_08"/〉到二十二年完成。当时译场之坚强阵容于《瑜伽论后序》有详细
  〈lb n="121_09"/〉记载〈note type="foot" n="02"〉大正藏三十、二八三下。〈/note〉。〈/p〉
  〈lb n="121_10"/〉〈p id="jie1579p0002"〉有关这部论,我们打算分三部份来介绍:
  〈lb n="121_11"/〉一、大乘瑜伽师与瑜伽行派。
  〈lb n="121_12"/〉二、历史与文献。
  〈lb n="121_13"/〉三、研读指南。〈/p〉
  2. 制作与标志文件(document)之结构特色(structural features)
  将《瑜伽论》之异译本及其纲要书的内容(content)视为条理化阶层(ordered hierarchy),不只是线性的。所以,将其章节结构分为二十层,如下以〈div〉标志,再用以 HTMLHelp 检查。
  页47
  〈div1 n="1" type="fen"〉〈head type="added"〉1分〈/head〉
  〈div2 n="1" type="di"〉〈head type="added"〉1地〈/head〉
  〈div3 n="1" type="zhang"〉〈head type="added"〉1章〈/head〉
  〈div4 n="1" type="jie"〉〈head type="added"〉1节〈/head〉
  〈div5 n="1" type="xiang"〉〈head type="added"〉1项〈/head〉
  〈div6 n="1" type="mu"〉〈head type="added"〉1目〈/head〉
  〈div7 n="1" type="L1"〉〈head type="added"〉1〈/head〉
  〈div8 n="1" type="L2"〉〈head type="added"〉1〈/head〉
  〈div9 n="1" type="L3"〉〈head type="added"〉1〈/head〉
  〈div10 n="1" type="L4"〉〈head type="added"〉1〈/head〉
  〈div11 n="1" type="L5"〉〈head type="added"〉1〈/head〉
  〈div12 n="1" type="L6"〉〈head type="added"〉1〈/head〉
  〈div13 n="1" type="L7"〉〈head type="added"〉1〈/head〉
  〈div14 n="1" type="L8"〉〈head type="added"〉1〈/head〉
  〈div15 n="1" type="L9"〉〈head type="added"〉1〈/head〉
  〈div16 n="1" type="L10"〉〈head type="added"〉1〈/head〉
  〈div17 n="1" type="L11"〉〈head type="added"〉1〈/head〉
  〈div18 n="1" type="L12"〉〈head type="added"〉1〈/head〉
  〈div19 n="1" type="L13"〉〈head type="added"〉1〈/head〉
  〈div20 n="1" type="L14"〉〈head type="added"〉1〈/head〉
  3. 制作与标志文件(document)之非结构特色(non-structural features)
  以《法相辞典》的词条作为检索《瑜伽论》之相关词汇(proper nouns, keywords)用,以〈item〉标志。如下所示:
  〈div1 type="glossary"〉
  〈head〉法相辞典通检〈/head〉
  〈pb n="001a"/〉
  〈list〉〈head〉一画〈/head〉
  〈item n="1"〉一苦〈/item〉
  〈item n="1"〉一趣〈/item〉
  〈item n="2"〉一切施〈/item〉
  〈item n="2"〉一切戒〈/item〉
  〈item n="2"〉一切忍〈/item〉
  〈item n="2"〉一切智〈/item〉
  〈item n="2"〉一切慧〈/item〉
  页48
  (二)汉文电子佛典运用之实例:异译本之比对、纲要书之对照
  将上述已制作与标志的电子数据作异译本之比对、纲要书之对照的运用,可依如下二个步骤进行:
  1. 依相关文件之结构特色(structural features)作互参(cross-reference)标志
  将《瑜伽师地论》(T1579)之异译本(T1581-4)及其纲要书(T1602)的各个 div(以div1=DA、div2=DB、div3=DC、div4=DD……表示)。加上联结 id(例如:div1=T1579DA, div2= T1579DB……),其号码(number)可用程序依流水号码加入。
  〈div1 n="1" id="T1579DA001" type="fen"〉〈head type="added"〉1本地分〈/head〉
  〈div2 n="1" id="T1579DB001" type="di"〉〈head type="added"〉1五识身相应地〈/head〉
  〈div3 n="1" id="T1579DC001" type="zhang"〉〈head type="added"〉1章 十七地总说〈/head〉
  〈lb n="0279a08"/〉〈p id="T1579p0001"〉云何瑜伽师地?谓十七地。何等十七?
  〈lb n="0279a09"/〉嗢&M011960;南曰:〈/p〉
  〈lb n="0279a10"/〉〈lg〉〈l〉五识相应、意,〈/l〉〈l〉有寻伺等三,〈/l〉
  〈lb n="0279a11"/〉〈l〉三摩地俱、非,〈/l〉〈l〉有心、无心地,〈/l〉
  〈lb n="0279a12"/〉〈l〉闻、思、修、所立,〈/l〉〈l〉如是具三乘,〈/l〉
  〈lb n="0279a13"/〉〈l〉有依、及无依,〈/l〉〈l〉是名十七地。〈/l〉〈/lg〉
  〈lb n="0279a14"/〉〈p id="T1579p0002"〉一者、五识身相应地。二者、意地。三者、有寻有
  〈lb n="0279a15"/〉伺地。四者、无寻唯伺地。五者、无寻无伺地。六
  〈lb n="0279a16"/〉者、三摩呬多地。七者、非三摩呬多地。八者、有
  〈lb n="0279a17"/〉心地。九者、无心地。十者、闻所成地。十一者、思
  〈lb n="0279a18"/〉所成地。十二者、修所成地。十三者、声闻地。十
  〈lb n="0279a19"/〉四者、独觉地。十五者、菩萨地。十六者、有余依
  〈lb n="0279a20"/〉地。十七者、无余依地。如是略说十七、名为瑜
  〈lb n="0279a21"/〉伽师地。〈/p〉〈/div3〉
  〈div3 n="2" id="T1579DC002" type="zhang"〉〈head type="added"〉2章 五识身地总说〈/head〉
  〈lb n="0279a22"/〉〈p id="T1579p0003"〉〈app n="027905"〉〈lem〉&lac;〈/lem〉〈rdg wit="【元】【明】【宫】"〉本地分中五识身相应地第一〈/rdg〉〈/app〉云何五识身相应地?谓五识身自性、彼所依、
  〈lb n="0279a23"/〉彼所缘、彼助伴、彼作业、如是总名五识身相
  〈lb n="0279a24"/〉应地。何等名为五识身耶?所谓眼识、耳识、
  〈lb n="0279a25"/〉鼻识、舌识、身识。〈/p〉〈/div3〉
  〈div3 n="3" id="T1579DC003" type="zhang"〉〈head type="added"〉3章 五识身地别释〈/head〉
  〈div4 n="1" id="T1579DD001" type="jie"〉〈head type="added"〉1节 眼识之五相〈/head〉
  〈div5 n="1" id="T1579DE001" type="xiang"〉〈head type="added"〉1项 自性〈/head〉
  〈p id="T1579p0004" type="inline"〉云何眼识自性?谓依眼、了别
  〈lb n="0279a26"/〉色。〈/p〉〈/div5〉
  页49
  写联结标志(参考 TEI, 14.4.3:A Three-way Alignment, pp. 433):
  〈linkGrp〉
  〈link targets="A1 B1 C1"/〉
  〈link targets="A2 B2 C2"/〉
  〈/linkGrp〉
  依照 id 联结相对的异译本及其纲要书(例如:〈link targets="T1579DD065 T1581DB002 T1582DB001"/〉)。
  依照id联结相对的经文。
  〈linkGrp〉
  〈link targets="T1579DD064 T1581DB001 T1582DE005"/〉
  〈link targets="T1579DD065 T1581DB002 T1582DB001"/〉
  〈link targets="T1579DE125 T1581DC001 T1582DC002"/〉
  〈link targets="T1579DF167 T1581DD001 T1582DD002"/〉
  〈link targets="T1579DG164 T1581DE001 T1582DE006"/〉
  〈link targets="T1579DG165 T1581DE002 T1582DE007"/〉
  〈link targets="T1579DH184 T1581DF001 T1582DF009"/〉
  〈link targets="T1579DI167 T1581DG001 T1582DG051"/〉
  〈link targets="T1579DI168 T1581DG002 T1582DG052"/〉
  〈link targets="T1579DI169 T1581DG003 T1582DG053"/〉
  〈link targets="T1579DI170 T1581DG004 T1582DG054"/〉
  〈link targets="T1579DH185 T1581DF002 T1582DF010"/〉
  〈link targets="T1579DI171 T1581DG005 T1582DG055"/〉
  〈link targets="T1579DI172 T1581DG006 T1582DG056"/〉
  〈link targets="T1579DJ236 T1581DH001 T1582DH012 T1602DI155"/〉
  〈link targets="T1579DJ237 T1581DH002 T1582DH013 T1602DI156"/〉
  〈link targets="T1579DJ238 T1581DH003 T1582DH014 T1602DI157"/〉
  〈link targets="T1579DJ239 T1581DH004 T1582DH015 T1602DI158"/〉
  〈link targets="T1579DJ240 T1581DH005 T1582DH016 T1602DI159"/〉
  〈link targets="T1579DJ241 T1581DH006 T1582DH017 T1602DI160"/〉
  ……
  〈/linkGrp〉
  2. 研发界面
  将 XML 经文文件借着程序 xml2dir.bat,同时用 IE5, xml parser 和 DHTML,javascript 呈现目录栏。以联结栏(link)借着程序 html.bat, 呈现多种异译本之比对栏及纲要书之对照栏。
  页50
  3. 电子文件上网
  利用标志完成之经文档案,产生网络版之经文文件,上网提供大众使用。
  页51
  可作异译本之比对、纲要书之对照的运用
  三、结语
  已完成制作与标志(markup)《瑜伽论》之异译本及其纲要书的电子数据的背景特色、结构特色、非结构特色。也以互参(cross-reference)标志将此电子佛典运用于异译本之比对及纲要书之对照,并研发界面,可以在网络上提供学界使用。
  虽然也完成全文检索的功能,但是尚未提供词条检索的功能,有待努力。
  (本论文曾口头发表于华梵大学所主办的「觉之教育」学术论文研讨会,2000年10月28日)
  页52
  【参考文献】
  横山纮一、广泽隆之
  《汉梵藏对照瑜伽师地论总索引》(东京:山喜房)1996
  韩清净科记
  《瑜伽师地论科句披寻记汇编》(台北市:新文丰出版社)1983
  Wittern, Christian
  "Minimal Markup and More──Some Requirements for Public Texts", Conference talk held at the 3rd EBTI meeting on April 7th 1996 in Taipei, Taiwan.
  Barnard, David, Ron Hayter, Maria Karaba, George Logan and John McFadden
  "SGML-Based Markup for Literary Texts: Two Problems and Some Solutions", Computers and The Humanities vol. 22, pp. 256~276.
  Calzolari, Nicola and Zampolli, Antonio
  "Lexical Databases and Textual Corpora: A Trend of Convergence between Computational Linguistics and Literary and Linguistic Computing", in: Cole R.A., J.Mariani, H.Uszkoreit, A. Zaenen, V.Zue (Hrsg.)Survey of the State of the Art in Human Language Technology, Cambridge 1996.
  Faure, Bernard
  La volonte’ d’orthodoxie dans le bouddhisme chinois, Paris 1998.
  Giordano, Richard, Goble, Carole and Kiillgren, Gunnel
  "Problems of Multidatabase Construction for Literary and Linguistic Research", Research in Humanities Computing vol. 5, Oxford 1995, pp. 143~164.
  Lancashire, Ian(Ed.)
  The Humanities Computing Yearbook 1989-90 A Comprehensive Guide to Sotware and other Resources, Oxford: Clarendon Press, 1991.
  Latz, Hans-Walter
  Entwurf eines Modells der Verarbeitung von SGML──Dokumenten in versionsorientierten Hypertext──Systemen Das HyperSGMI, Konzept, Diss. Berlin 1992.
  Simons, Gary F.
  "Implementing the TEI’s Feature-Structure Markup by Direct Mapping to the Objects and Attributes of an Object──Oriented Database System", Research in Humanities Computing vol. 5, Oxford 1995, pp. 220~242.
  Sperberg-McQueen, C. Michael and Burnard, Lou (Eds.)
  Guidelines for Electronic Text Encoding and Interchange, Chicago and Oxford, 1994.
  页53
  A Study on Creation and Application of Electronic Chinese Buddhist
  Texts: With the Yogaacaarabhuumi as a Case Study
  Hui-min Bhikkhu[*], Christian Wittern, Aming Tu, Lijuan Guo, Ray Chou,
  *Professor, Taipei National University of the Arts
  Summary
  This research is an attempt to create and markup electronic data. We try to use tag sets of TEI and markup the documents (including contextual features such as , , ; structural features such as

, and nonstructural features such as ) based on the various translations and outlines of Yogaacaarabhuumi.
  Second, the project described above will be cross-referenced with structural features of the electronic data, providing, for example , ). Intefaces will be developed, such as using the xm12dir.bat program on Sutra XML with IE5, xml parser, and DHTML and javascript to provide menus. The Link will provide cross references through html.bat. This will be useful for comparing different translations and outlines.
  Key words: 1. Electronic Chinese Buddhist Texts 2. Yogaacaabhuumi 3. SGML
  4. XML 5. TEI

没有相关内容

欢迎投稿:lianxiwo@fjdh.cn


            在线投稿

------------------------------ 权 益 申 明 -----------------------------
1.所有在佛教导航转载的第三方来源稿件,均符合国家相关法律/政策、各级佛教主管部门规定以及和谐社会公序良俗,除了注明其来源和原始作者外,佛教导航会高度重视和尊重其原始来源的知识产权和著作权诉求。但是,佛教导航不对其关键事实的真实性负责,读者如有疑问请自行核实。另外,佛教导航对其观点的正确性持有审慎和保留态度,同时欢迎读者对第三方来源稿件的观点正确性提出批评;
2.佛教导航欢迎广大读者踊跃投稿,佛教导航将优先发布高质量的稿件,如果有必要,在不破坏关键事实和中心思想的前提下,佛教导航将会对原始稿件做适当润色和修饰,并主动联系作者确认修改稿后,才会正式发布。如果作者希望披露自己的联系方式和个人简单背景资料,佛教导航会尽量满足您的需求;
3.文章来源注明“佛教导航”的文章,为本站编辑组原创文章,其版权归佛教导航所有。欢迎非营利性电子刊物、网站转载,但须清楚注明来源“佛教导航”或作者“佛教导航”。