当前位置:大学毕业论文> 专科论文>材料浏览

关于蒙太古语义学论文范文写作 基于蒙太古语义学和受控自然语言文献信息系统实现相关论文写作资料

主题:蒙太古语义学论文写作 时间:2024-04-07

基于蒙太古语义学和受控自然语言文献信息系统实现,本论文为您写蒙太古语义学毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

蒙太古语义学论文参考文献:

蒙太古语义学论文参考文献 自然辩证法结课论文自然指数期刊自然杂志人和自然杂志

摘 要:基于蒙太古语义学(MS)和受控自然语言(CNL)的文献信息系统,兼具传统文献检索分类法的“符号化”和主题法的“规范词”的特点,并带有复杂的语法和语义功能;从而可以大大提高文献信息的检索和利用效率,还能自动生成规范的文献摘 要,并完成不同语言之间的自动翻译.尝试实现这种文献信息系统的结构,其中包括构建语词的范畴分类和语句的函数表达式,以及自然语言-形式语言、中文-英文之间的映射(翻译)等;最后设计一个应用程序以验证该系统的若干功能.本研究表明:这种全新概念的信息组织和管理系统是可行的.

关键词:蒙太古语义学; 受控自然语言; 机器翻译; 文献信息检索

中图分类号: H 085.4; TP 312 文献标志码: A 文章编号: 1000-5137(2015)05-0466-07

1 研究背景

1.1 传统文献检索语言的特点和局限性

众所周知,传统文献(情报)检索的人工语言主要有两种:分类检索语言(分类法)和主题检索语言(主题法)[1].分类法早先用于图书的排架和查找.如国际著名的《杜威十进分类法》(Dewey Decimal Classification,DC)、《美国国会图书馆分类法》(Library of Congress Classification,LC),国内则有《中国图书馆分类法》[2]等.分类法现在也常用于主题(学科)文献的检索,如检索国际数学文献一般用美国数学会制订的《数学主题分类法》(Mathematics Subject Classification),检索国际专利则有德温特的《国际专利分类法》(International Patent Classification,IPC)等.分类法作为检索语言的一大特点是符号化:用字母和数字来表示各类学科及其分支,便于人们克服语言障碍找到所需要的专业文献.分类法的主要缺点是:其线性化的封闭式结构体系虽然适用于图书馆的书架管理,但难以容纳新兴学科和跨学科领域的信息,因而检索效率低下[3-4].如在《中图法》中,“计算机科学”这一其影响几乎遍及人类所有活动领域的重要学科,竟只被列为“工业技术”之下的 类目(TP3).诺贝尔经济学奖自设立以来,获奖者几乎都是数理经济学家;但由于横跨了数学和经济学这两个不同的研究领域,使得《中图法》无法设立“数理经济学”类目.

主题法主要用于各种文献数据库的组织和检索;其一大特点是:使用受控制的规范词语(称为“主题词”或“叙词”)并结合初等逻辑运算(“和”、“或”、“非”)来表达文献的研究主题,并以此来检索文献[5].在一定程度上,主题法克服了分类法的线性和封闭结构的局限性.但由于人类知识的错综复杂性,远非初等逻辑所能概括;而且维护一个文献数据库的规范词体系的成本十分高昂,所以主题法的使用效率很低:事实上,只有相关的情报专家才能掌握一些特定文献数据库的主题词表及其使用方法;而对于文献数据库的主要生产者和使用者——作者和读者来说,他们大都不懂,因而也不会使用这些主题词语言.

近几十年,出现了一些对新型检索语言的探讨,如“概念检索”和“语义检索”等[6-9],但它们均无法令人满意地处理自然语言的歧义性和复杂性,因而未显示出多大实用价值.

1.2 基于蒙太古语义学和受控自然语言的文献信息系统

为克服传统检索方法的局限性,文献[10]提出了“基于蒙太古语义学和受控自然语言的文献信息系统”(简称MS-CNL系统)的全新的解决方案.

“蒙太古语义学”(Montague Semantics,简记MS)早期也被称为“蒙太古语法”(Montague Grammar),是由美国数理逻辑学家、哲学家蒙太古(R.M.Montague,1930~1971)创立的,用形式化内涵逻辑的方法研究自然语言的理论[11-12]:它把自然语词映射为形式符号,词语之间的关联映射为集合论的关系,语法规则映射为函数;从而能消除自然语言的歧义性.把自然语言转化为形式符号的内涵逻辑后,用(同样是符号逻辑产物的)计算机来处理就很方便.在1980年代曾掀起将MS应用于机器翻译的研究热潮[14-16].这些以及其他相关的研究和实践表明,利用MS确实能使计算机处理相当一部分自然语言,尽管尚无法处理诸如俗语、隐喻、省略语等缺乏明确规则的语言现象.

“受控自然语言”(Controlled Natural Language,简记CNL)的概念出现于1990年代末[17],是指为了某种应用目的而建立,其语法和词汇都受控制的简化自然语言体系;它去除了自然语言中大量存在的一词多义、一义多词、语句表达极不规则等缺陷,同时保留其容易理解、方便使用的优点,因而能成为人和计算机交流的理想媒介.CNL目前已有较广泛的应用[18-19].CNL也可看作是主题法检索语言的推广.

文献[10]对MS-CNL文献信息系统的原理和特点做了较详细的阐述,其基本思想概括如下:用适当的方法(如从现有的文献分类表和主题词表出发,并按规范的程序不断地从新文献中提取)形成一个能反映人类知识结构的概念集合,包括这些概念之间的种种基本关系,以及表示这些概念之间相互作用的语法规则和句型;然后运用MS方法,为这些概念、关系、语法规则和句型构造一个形式化符号语言系统(也是形式内涵逻辑系统),并建立其和不同语种的(受控)自然语言系统之间的对应关系;根据文献主题表达的实际需要,在这个形式系统中还可以加入各种数学公式、化学符号、图表参数等的表示方法.在提交论文时,要求作者用受控的词汇、语法和句型来描述文章的研究主题、方法、参数、公式、图表等,这些描述集中在一起,就成为一篇规范、严谨的文章摘 要;这些描述还可以通过形式语言的 ,映射为其他语种的自然语言,从而能让学者们轻松共享不同语种文献的信息.读者用户则用受控的自然语句来检索所需要的文献;这些查询语句被映射为形式语言并分解成概念及其之间关系和作用的组合后,就能通过各种比初等逻辑强大得多的关系逻辑的运算,以很高的准确度为其找到所有匹配的文献.

结论:关于蒙太古语义学方面的论文题目、论文提纲、什么是蒙太古语法论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

一带一路背景下的蒙古语媒体传播
【内容提要】蒙古语媒体作为内蒙古自治区对蒙古族进行母语传播的阵地,一方面有进行本民族经济、文化等信息传播的任务,另一方面有为本民族与其他民族之间。

面向自然语言处理情感标注回顾和展望
摘 要:语料库标注是发现语料库潜在价值的重要方法。本文回顾已有语料库标注,总结分析语料库标注的作用及标准化趋势,综述国内外重要情感标注资源,针对。

在转型振兴中蒙古语广播发挥着不可替代作用
【摘 要】阜新市是一个少数民族聚集的城市,其中蒙古族人口在少数民族人口中所占比例最大。目前,阜新市正处于转型振兴的发展时期,阜新蒙古语广播电台作。

习水自然保护区森林生态系统现状
摘要:本文从自然度、健康度、森林景观、生态功能等方面分析习水自然保护区森林生态系统现状,虽然生态环境受到人为活动的干扰,但仍具有森林类型多样性的。

论文大全