基于Python实现的函数绘图语言解释器

基于Python实现的函数绘图语言解释器 一,实验目的 通过实验加深对编译器构造原理和方法的理解,巩固所学知识, 会用正规式设计简单语言的词法 会用产生式设计简单语言的语法 会用递归下降子程序编写语言的解释器 二

本文包含相关资料包-----> 点击直达获取<-------

基于Python实现的函数绘图语言解释器

一、实验目的

通过实验加深对编译器构造原理和方法的理解,巩固所学知识。

  • 会用正规式设计简单语言的词法

  • 会用产生式设计简单语言的语法

  • 会用递归下降子程序编写语言的解释器

二、实验环境

CPython 3.6.7

三、实验内容

因为对于这个函数绘图语言本身的设计已经很详细了,所以主要描述一下解释器程序的设计。

3.1 软件体系结构设计

3.1.1 技术选型

首先这个解释器是用 Python 编写的,考虑到程序编译是计算密集型应用,而 Python 又不是执行性能非常出色的语言,为什么我们还会选择 Python 作为该解释器的实现语言呢。我们主要有以下几点考虑

  • Python 对于字符串处理操作比较方便。因为解释器是需要与源代码交互的,源代码作为字符串输入,所以 Python 对字符串处理的便利性的优势就很明显

  • Python 的类型系统比较灵活。因为解释器实现上需要实现几种数据结构,而 Python 自带的类型就可以很方便地实现这些数据结构,比如 Python 的字典比起其他语言的结构体、Map、类都要方便,Python 的元组可以通过嵌套很方便地实现树形结构。Python 的列表可以很容易实现 栈、队列。这些类型为实现模块间交互的数据结构提供了非常多的便利

  • Python 本身就是一门解释型语言,有强大的运行时异常机制,这对于简化我们实现的解释器的异常处理非常有帮助

  • Python 有非常简单易用而且强大的图像处理和绘图库(PIL)

基于以上几点考虑,我们选择了 Python。而且考虑到重要的在于了解程序编译的原理,而不在于实现一个真正用于生产环境的解释器。

对于绘图工具,我们选择了 pillow,不同于 Python 其他的很多绘图库,比如 matplotlib,这些库主要是用于数据可视化的,而 pillow 就是一个纯粹的图像处理与绘图库,而且他绘图的方式可以很好地契合题目要求,即给出点坐标,逐点绘制。

3.1.2 模块设计

该解释器项目目录如下:

我们将程序按照功能分为 4 个模块,lexer 词法分析器,fml_parser 语法分析器,semantic 语义分析器和 actuator 执行器,和一个主程序 main.py。

  • dfa.py 定义了枚举类 Token 和每个 DFA 的状态迁移表、和 DFA 类

  • lexer.py 定义了词法分析器类 Lexer

  • grammar.py 定义了枚举类 Terminals 和 NonTerminals,表示终结符和非终结符

  • parser.py 定义了语法分析器类 Parser,该类对递归下降子程序做了简单封装

  • semantic.py 定义了语义分析器类 Semantic,和枚举类 Operation 表示 6 种操作(设置 origin、设置 rot、设置 scale、设置绘图颜色、设置背景颜色、画点)

  • actuator.py 定义执行器类 Actuator,负责维护 origin、rot、scale、color、background 五个属性的值,和计算记录要绘制的点的真实坐标,提供生成所绘制图片的方法

3.1.3 接口传递数据结构

由于有 4 个模块,他们由主程序逐一调用,前一模块的输出将作为后一模块的输入,因此需要设计一些统一的数据结构使各个模块能够正常交互

源代码

源代码是词法分析器的输入,直接以字符串的形式输入。但是为了能够实现缓冲输入,允许源代码任意截断,按顺序调用 lexer.append()方法分批或逐一输入,可以是字符串或字符串的列表的形式。

记号流

记号流是词法分析器的输出和语法分析器的输入。首先将记号表示为元组 (Token.TYPE, value) Token.TYPE 是枚举类 Token 的任一取值,value 是所识别的源码中的单词(字符串格式)。记号流表示为记号的列表。

语法树

语法树是语法分析器的输出和语义分析器的输入。为了表示树形结构,用嵌套的二元组表示。非终结符节点表示为 (NonTerminal.TYPE, (...)) ,第一个元素是非终结符类型,第二个元素是包含的子树的元组。终结符节点表示为 (Terminals.TYPE, token) ,第一个元素是终结符类型,第二个元素是表示记号的二元组(表示该终结符的值)。由此按照语法树逐层嵌套。

操作序列

操作序列是语义分析器的输出和执行器的输入。首先表示原子操作,原子操作被分为 5 类,表示为元组 (Operation.TYPE, arg1, arg2, ...) ,第一个元素是操作类型,可以是设置 origin、设置 rot、设置 scale、设置背景颜色、设置绘图颜色和绘点,根据操作类型不同,后面给出 1 - 3 个参数,参数都是整数或浮点数,比如点的坐标,缩放的值等。然后操作序列是按照操作次序排列的原子操作的列表。

3.2 词法分析器模块设计

词法分析器以源代码作为输入,输出记号流,识别记号的工具主要就是 DFA。我们实现的词法分析器是一种表驱动型的词法分析器。在初始化一个词法分析器时,他会初始化一个 DFA 集合,每个 DFA 对应一种记号,他们有 move() 成员方法。

词法分析器在运行时需要维护 2 个队列,和 3 个列表,分别是输入队列(字符串队列),输出队列(记号队列),已处理源码列表,已识别记号列表,已发现错误记号列表。列表是留作复查用的,实际与模块外部交互的主要是输入队列和输出队列。

主程序通过调用词法分析器的 append()方法向词法分析器输入一个或一批字符串(源码),词法分析器会将输入加入到输入队列的末尾,并且启动一次词法分析。

词法分析时,拷贝 DFA 集创建“活跃 DFA 集”,对活跃 DFA 集中的 DFA 逐一调用 move() 方法,若 move 失败则从活跃 DFA 集移除,若 move 进入接受状态集则做一次记录,当所有 DFA 都被移除出活跃集时,一次记号识别完成,将缓存的记号记录中最长的一个加入到输出队列尾部。循环执行上述过程,直到输入队列为空,将未识别完全的字符放回输入队列尾部,结束此次分析。

在最后一次 append 时,在参数中设置 eof 字段为 True,则词法分析器会将最终未能完整识别的字符放入错误记号中,并在输出队列尾部加入空记号表示程序结束。

主程序通过检查错误记号列表可以知道是否有词法错误,以决定下一步操作。

词法分析器部分输出如下:

3.3 语法分析器模块设计

语法分析器以记号流作为输入,输出语法树。为了简便起见,我们是用递归下降子程序实现的。由于简化的,消除左递归、左因子、二义性的文法的 EBNF 描述已经在文档给出了。所以这部分的实现只需要写出递归下降的子程序。

语法分析器部分输出结果如下:

3.4 语义分析器模块设计

语义分析器以语法树为输入,输出中间代码。所谓中间代码并没有确定的格式,所以结合该解释器的功能,我们设计了我们的中间代码。将程序划分为 6 种原子操作,设置 origin、设置 scale、设置 rot、设置背景颜色、设置绘图颜色,绘制点。其中前 5 种操作对应 5 种语句,最后一种操作是 for 语句的展开。

语义分析器遍历语法树,对表达式求值,展开 for 语句,得到原子操作的序列。

语义分析器部分输出如下:

3.5 执行器模块设计

执行器以操作序列为输入,执行绘图操作。前五种操作是对应 5 种属性的,属性通过成员变量维护。第 6 种操作,即绘制点,有两个参数,对应点的坐标。执行器首先会将该点坐标根据 origin、rot、scale 转换为绘图所用坐标系的坐标,然后记录在绘制点队列中。

当调用执行器的 create_image() 方法时,执行器会根据所有点的坐标的取值范围,生成一个能够容纳所有点的空白图像,然后给每个点加上一个坐标偏移,使其坐标为正(即能落在图片中),然后调用绘图库逐点绘制,保存并显示图片。

绘制图片效果展示:

四、心得体会

第一次写解释器还是十分有挑战的,期间主要遇到这么几个问题:

4.1 DFA 的表示方法

由于不想硬编码 DFA,所以期望将 DFA 作为一个类,通过“某些数据”实例化一个能够识别某种特定记号的 DFA。但是如何表示这些“数据”就是个问题。

首先考虑一个 DFA 至关重要的几个参数。首先 DFA 只有 1 个初态,所以不需要显式地指明初态,我们定义 0 状态为初态。然后是字典,由于我们可以在状态迁移表中隐含所接受的输入字符,所以这一部分也不需要指定,那么就只剩下状态迁移表和接受状态集了。接受状态集直接用 Python 的内建类型 set 表示。而状态迁移表就比较麻烦,首先可以用二维列表表示,但是二维列表就还需要额外的表头,而且每次顺序查找也很费时。所以我们考虑 DFA 工作时的情形,move()函数接受一个字符作为参数,然后查找当前状态下,该输入,应该跳转到什么状态。那么我们可以这么实现,将输入字符作为 map 的键,然后当前状态对应的下一状态存储在一个一维列表中。这样,一个是哈希、一个是直接寻址,就能定位到状态迁移表的某行某列,效率上不错。下面是我们实现的 DFA 初始化数据的表示的一个例子:

  • 'type' 是该DFA识别的记号类型

  • 'as_set' 是接受状态集(Access State Set)

  • 'stm' 是状态迁移矩阵

Python 灵活的内建类型也能很方便地支持我们的这个设计。

不足之处的话,一个在于对于比较复杂的 DFA 这样描述的状态转移矩阵看起来会非常庞大,实际上这个表绝大部分都是 None,所以应该考虑作为稀疏矩阵,或者树形结构存储的。

4.2 错误记号的处理

词法分析的时候遇到词法错误如何处理。首先先考虑要达到什么效果,我们希望的是,当遇到词法错误,就跳过若干字符,直到遇到一个空字符(空格或者换行),并且把跳过的字符记录为一个错误记号,然后继续进行词法分析。如何实现这种效果呢。

我们使用了一种比较有趣的方法,我们尽量不把错误记号特殊处理,像其他记号一样,我们为错误记号定义一个 DFA,这个 DFA 将会匹配从任意非空字符开始的任意非空符字符串,这个 DFA 会跟其他 DFA 一同对输入进行匹配。但是在选择最后识别成功的记号时,我们做一个差别对待,即非错误记号优于错误记号,长的记号优于短的。这样,当不能识别出任何一个正常记号时,就会被记录为错误记号。

好处在于编码简单,我们仅仅加了一个 DFA,和一两行判断,其余地方我们对正常和错误记号都一样处理。

考虑这样设计的不足的话,我觉得主要是,异常处理机制应该单独作为一个模块,并且能够有一种切实有效的方法在解释的全过程给出错误和定位。这样的话,我们现在的设计就与词法分析器的耦合过于紧密,不易于后期对这方面功能的完善。

4.3 中间代码的优化

基于多种考虑,我们没有使用语法制导的语义分析。所以我们有一个与语法分析器完全独立的语义分析器模块,并且他能够产生我们定义的中间代码。这原本就为优化提供了很多空间,但是由于时间限制,很可惜的是我们没有在这方面做任何工作。

事实上,现在再来考虑的话,可以优化的空间是很多的。

优化首先在于减少绘点的数量,我们实现的语义分析器是忠实地展开 for 语句生成绘点指令的,但是可能会有这么几种可能。一个是 for 语句的 step 设置过小,导致两个点的坐标在取整(因为像素不能有半个)后实际上是一个点,那么这种绘制就是没有必要的。这个是相对容易发现的,还有比较隐秘的在于,两个相交的曲线,或者两个重叠的曲线,他们属于不同的 for 语句,这里似乎可以节省不少。还有包括没有意义的反复设置属性,这些模式应该都被尽量发现,并且消除。

另一个优化方向是对于最终绘制效果的,比如适当增加点,或调整点的位置,使绘制的曲线的锯齿没那么明显,更圆润、清晰,而这方面其实也是字符渲染经常要面对的问题。

参考文献

  • 基于云计算模式的社会服务管理信息化平台项目设计与建设(吉林大学·杨刚)
  • 建筑设计院图档管理系统的设计与实现(吉林大学·时淮龙)
  • 网络流量统计分析系统(吉林大学·石景龙)
  • 基于.NET的表格组件研究与实现(长沙理工大学·袁圣江)
  • 建筑设计院图档管理系统的设计与实现(吉林大学·时淮龙)
  • 制造业数据交互式分析平台的设计与实现(西安电子科技大学·杨妍)
  • 建筑设计院图档管理系统的设计与实现(吉林大学·时淮龙)
  • InceptorPL/SQL解释器函数、游标和异常处理功能的设计与实现(南京大学·马玲)
  • 面向编程学习的知识图谱构建与应用研究——以C语言为例(华中师范大学·王宏超)
  • 基于.NET的煤矿施工图参数化绘制研究(河北工程大学·李晓东)
  • 基于B/S架构的工程图纸管理系统(辽宁科技大学·孔庆涛)
  • 数字图像与矢量数据在空间数据库中的存取分析与应用(山东科技大学·姜永阐)
  • 工程图纸管理系统的设计与实现(山东大学·陶星君)
  • 基于云计算模式的社会服务管理信息化平台项目设计与建设(吉林大学·杨刚)
  • 基于.net框架的数字图像处理算法研究(福州大学·李建飞)

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设小屋 ,原文地址:https://bishedaima.com/yuanma/35411.html

相关推荐

  • 基于springboot和vue实现的HS医院预约挂号管理系统

    基于springboot和vue实现的HS医院预约挂号管理系统 1,项目简介 1,1摘要 医院门诊信息管理系统是根据医院的门诊部分以及门诊部分配套的前台
    2024年05月14日
    3 1 1
  • 基于Python制作的热血足球小游戏

    基于 Python 制作的热血足球小游戏 导语 最近有读者说我发的文章太水了,都是炒冷饭的,那就带大家整点新鲜的东西吧,反正估计今年都得"坐牢"了,炒冷饭的机会有得是
    2024年05月14日
    6 1 2
  • 基于JAVA的酒店住宿管理系统

    基于Java的宾馆住宿管理系统 摘 要 随着信息技术的发展,计算机已被广泛的应用于社会的各个领域,成为推动社会发展的技术动力,而在计算机应用中,软件的作用十分突出
    2024年05月14日
    2 1 1
  • 基于Python和Mongodb实现的珠宝管理系统

    基于Python和Mongodb实现的珠宝管理系统 一,需求分析 为了能让非关系数据库在日常系统中应用,让更多用户体验到 Mongdb 带来的便利,并且 MongoDB 能在每秒上万条数据的并发写入
    2024年05月14日
    7 1 2
  • 基于Vue+SpringCloud博客的设计与实现

    基于Vue+SpringCloud博客的设计与实现 一,摘 要 博客是用来分享自己的心情和动态拉近人与人之间的距离,它改变了人们的在网上的交流方式
    2024年05月14日
    4 1 1
  • 基于SpringBoot框架的校园二手书交易平台

    这是一套采用Java编程语言,基于SpringBoot框架构建的📚📚校园二手书交易系统源代码,开发过程中,我们运用了SpringBoot和Vue技术栈,开发工具为Idea或Eclipse
    2024年05月23日
    20 1 3
  • 卓越导师双选系统

    这是一个🔥🔥基于SpringBoot框架的卓越导师双选系统设计与实现🔥🔥的项目源码,开发语言Java,框架使用的SpringBoot+vue技术,开发环境Idea/Eclipse
    2024年05月23日
    2 1 1
  • 构造正规式r1|r2

    近年来,随着计算机科学领域的迅速发展,正规式与自动机理论作为编译原理等诸多领域的基础,备受关注,在编写程序中,正规式的构造是一项常见而且关键的任务,特别是在涉及到复杂文本匹配与处理的场景下
    2024年05月07日
    8 1 3
  • 基于python实现的电梯调度

    基于python实现的电梯调度 1 项目说明 1,1 项目目的 通过实现电梯调度,体会操作系统调度过程 学习特定环境下多线程编程方法 学习调度算法 1
    2024年05月14日
    5 1 3
  • springboot旅游的网站

    旅游网 API 介绍 旅游网是一个基于 SpringBoot 框架设计的一个毕业设计,主要类似于一个电商系统,此项目是本人亲自开发, 博客: https://blog
    2024年05月14日
    7 1 3

发表回复

登录后才能评论