当前位置:大学毕业论文> 硕士论文>材料浏览

关于维吾尔文论文范文写作 脱机手写维吾尔文单词的过拆分方法相关论文写作资料

主题:维吾尔文论文写作 时间:2024-03-26

脱机手写维吾尔文单词的过拆分方法,关于免费维吾尔文论文范文在这里免费下载与阅读,为您的维吾尔文相关论文写作提供资料。

维吾尔文论文参考文献:

维吾尔文论文参考文献 大学论文手写格式模板手写论文格式手写论文格式模板手写论文的格式

摘 要:脱机手写体维吾尔文切分是脱机手写体维吾尔文识别的基础,切分准确率直接影响识别的正确率,该问题的研究对提高识别的系统性能具有重要的意义.提出了一种脱机手写维吾尔文单过切分方法.该方法的基本过程是通过确定单词的主笔划找到单词的基线,再根据基线以上的部分过拆分单词,对该方案进行了实验,实验结果表明该文切分方案具有有效性和可行性.

关键词: 脱机手写;维吾尔文;过切分;投影;基线检测

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2018)12-0271-03

Abstract:Off-line handwriting Uyghur word segmentation is the basis of offl-ine Uyghur handwriting recognition. The segmentation accuracy directly affects the accuracy of recognition. The research on this issue is of great significance to improve the recognition system performance. An off-line handwritten Uyghur single-pass segmentation method is proposed. The basic process of this method is to find the baseline of the word by determining the main stroke of the word, then to split the word according to the part above the baseline, and the experiment is carried out. The experimental results show that the proposed scheme is effective and feasible.

Key words:Off-line handwriting; Uyghur; over segmentation; projection; Baseline detection;

1 引言

維吾尔文的历史悠久,在中国的西北地区,广泛地被维吾尔族使用.基于维吾尔文的文字处理系统与输入方法的研究,在我国研究较少,同时起步也比较晚,现存的研究文献中,研究最多的就是键盘编码输入方式[1],关于识别方面的研究相对较少.关于维吾尔文字的识别技术,尤其是印刷体字符的研究,研究比较成熟的代表是清华大学与新疆大学[2-4].与其他语言文字相比,维吾尔文在书写规则,字母结构、书写习惯等方面更为复杂,难度较大,尤其是手写体识别,由于硬件因素的影响,对于脱机手写单词识别更少.基于此,本文主要的研究对象是脱机手写维吾尔文字符切分技术的.单词的识别主要分为两种,一种是基于分割的方法,第一种是整体性识别的方法.如果是通过分析字母的形状特征对字母进行识别,然后再对整个单词进行识别,则说明采用的是基于分割的方法;如果是通过单词的整体数字特征入手,再采用整体的模式对单词进行识别,则说明采用的是整体性识别方法.在维吾尔文中,如果是采用整体性识别的方法对其识别,是行不通的,因为这种语言的单词数量特别庞大,因此只能采用基于分割的方法.在单词图像中,单词中的字符切分是相对比较重要的一步,它是字符切分、单词识别等技术的基础.要进行正确地识别就要进行正确的区分,如果切分不当就容易造成识别错误,对于这种问题是不能忽视的.在维吾尔文的脱机手写中,两个因素给单词切分带来了较大的困难,第一个因素是手写的随意性,第二个因素是单词图像中字符的唯一性.

维吾尔文字书写时字母连续流畅,自右向左书写.维吾尔文与汉文有较大的不同,维吾尔文的一个词是由一个或多个字母组成的.根据维吾尔文的书写规则,,这些字母可能前后相连形成一个或几个连体字母段或称连体段.不管是维吾尔文的手写体,还是维吾尔文的印刷体,在连体字母段中,所有的字母都是沿着一条水平线相连的,这条水平线叫基线.一个单词包含一个或多个连体段.每个连体段也是由一组字母,或一个字母组成.

2 预处理

以采集到的单词图像为基本对象,对其进行相应的处理,这种处理就叫预处理.预处理的目的有两个,一个是减少噪声的影响,另一个是减少外界干扰,预处理的主要作用是对手写单词存在的变形进行矫正.预处理在所有的步骤中是不能缺少的关键性步骤,它是字符分割的基础与前提.主要内容包括图像二值化,倾斜矫正等.

2.1 二值化

在本方案中,实验的样本图像采用的是黑白图像,白色的是背景,黑色的是字体.如果从数字图像的像素值上对其分析,图中像素的灰度值从0到255均有分布,在图像上都有细微的表现,灰度差异较小的是字符像素点与背景像素点,在单词中,骨架部分呈现的是黑色,边缘部分呈现的是灰色.本文投影切分算法的实现就是要利用颜色差异,所以分割之前需要对图像进行二值化处理.充分结合最大类间方差法[5]可以找到图片的一个合适的阈值.对这个阈值加以利用,就可以更容易(与人为设定相比)地把一张灰度图像转换为二值图像.最大类间方差法(otsu)的公式推导:记[T]为前景与背景的分割阈值,前景点数占图像比例用[w0]表示,平均灰度用[u0]表示;背景点数占图像比例用w1表示,平均灰度用u1表示.则图像的总平均灰度,可以采用公式(1)对其表示;前景和背景图象的方差,则可以采用公式(2)对其表示:

在上述公式中,当方差最大时,就可以将其认定为此时前景与背景差异最大,换句话说,就是此时的灰度是最佳阈值.

2.2 倾斜矫正

结论:关于维吾尔文方面的的相关大学硕士和相关本科毕业论文以及相关维吾尔文论文开题报告范文和职称论文写作参考文献资料下载。

高校老师让200多名学生当堂手写家书
《楚天金报》消息,近日,武汉理工大学的季爱民老师布置的一次“爱的作业”感动朋友圈——她把买来的邮票、信封拿到课堂上,让200多名学生给父母写一封。

陕西师大手写通知书引关注
据《光明日报》报道,近日,陕西师范大学教授用毛笔手写录取通知书一事,受到广泛关注。据媒体报道,该校有的老教授已参与书写录取通知书10年,一些毕业。

小素材,多积累;灵活用,写佳文
黄小平,男,江西新余市作家协会副主席,长期致力于小品文创作,被微文网、《杂文报》等媒体和报道称为“中国小品文大王”。眼睛看不到自己一位年轻人趾。

读写结合文意兼得
成语是汉语中最璀璨的明珠,它浓缩了历史,融进了文化,用最少的文字表达出最丰富的情感和内涵。可以说,中华民族五千年文明史都反映在浩瀚的成语之中,是。

论文大全