英语原文共 6 页，剩余内容已隐藏，支付完成后下载完整资料

基于Web的Java算法自动评测系统

Marcos Andreacute; Pinto, Student Member 92275550, IEEE

摘要：源代码自动评估是学习编程语言的重要机制。一些工具和系统通过使用输入/输出测试来自动评估源代码，但很少有工具和系统使用软件工程度量。考虑到目前工作的局限性，本文提出了一种源代码自动评估的四阶段方法：i）编译源代码并进行错误检查；i i）根据教员提供的一组JUnit（见IV-A）测试编译后的代码；i i i）一组软件工程度量标准。ICS用于将学生的解决方案与教师的解决方案进行比较；iv）最后，根据前几个阶段的结果，向学生提供自动反馈，以便他们确定需要进一步学习的领域。在论文的最后，我们给出了系统评估的结果，表明我们的方法可以在学习编程语言的同时促进学生的学习和知识获取过程。

关键词：学生反馈、自动评价、网络应用、Java代码。

引言

学习一门编程语言可能是一项具有挑战性的活动，尤其是对于从未接触过编程语言的一年级学生而言。

以前的主要编程概念。这个领域的成功通常与努力工作和频繁测试学生的编程技能（通过练习和测试）有关，以评估他们当前的知识，从而将重点放在他们尚未掌握的领域。学生评估现状的最合适时机是整个学期的评估期。在评估期间，教师提供编程练习，学生必须提出解决方案。之后，老师对这些测试进行单独评分，学生可以通过这个评分反馈自我评估并确定需要进一步学习的概念。

然而，由于这些评估期需要教师投入大量的时间和资源，因此在学期内，这些评估期的执行时间不足以作为学生自我评估的工具。有些工具可以帮助完成这些任务，但这些工具存在一些局限性（见II-F）。基于此，我们开发了一个自动的基于网络的系统来分析和评估学生在解决老师提出的问题时提供的源代码。在这个系统中，教师只需提供练习的文本、解决方案和一些评分参数（例如一些JUnit测试和与解决方案中某些指标重要性相关联的百分比）并且在学生提供解决方案后，系统自动向他们提供反馈。

我们的研究工作始于对源代码自动评估相关工作的分析，本文第二节介绍了这些方法。分析使我们能够确定这种方法的局限性，以及我们的工作如何有助于提高技术水平。第三节介绍了我们的方法体系结构、ACODE系统，第四节详细介绍了我们的方法，通过解释每个组件的功能以及它们如何结合成一个能够评估学生提交的源代码的统一系统。本文的第五部分专门介绍了在评估我们方法时所获得的结果。最后，第六节总结了本文，并概述了构成我们未来研究指导方针的目标。

ACode系统

考虑到目前方法的局限性和我们为工作设定的目标，我们开发了ACODE系统，能够对几个不同的主题进行自动评估。其目的是通过向学生提供自我评估工具来帮助他们评估某一特定学科的当前技能状态。

该系统设计用于支持几个不同的自动评估模块（见图1）。它的架构足够灵活，可以支持引入新的模块来处理其他课程的自动评估，而无需进行结构更改。在本文中，我们只关注负责Java源代码评估的模块。

图1 ACode系统架构

该模块允许学生通过解决编程问题和获得对结果的持续自动反馈来提高他们的编程技能，而无需等待教员进行手动评估。这样，学生就可以把他们的学习和工作集中在一门课程上，使他们有更高的能力。

技术方法

为了在自动评估提交学生解决方案的源代码时获得更真实的分数，ACODE系统中使用的模块使用两种不同但互补的策略：i）通过输入/输出测试（见4-A）评估解决方案；以及i i）通过软件工程M评估算法。ETRICS（见4-B）。

图2 Acode系统的flow-owchar

通过系统的Web界面，学生提交给定问题的解决方案，然后分四个阶段进行分析（见图2）：

bull;学生发送的源代码首先由系统编译，以确保不存在编译错误。如果存在错误，则系统返回最终等级0（零）。然后学生可以重新提交解决方案；

bull;如果代码编译没有任何错误，第二阶段将运行由教学人员提供的一组JUnit测试（见IV-A）。如果所有测试失败，则系统返回0级（零），否则继续；

bull;测试阶段结束后，系统将从编译的源代码（见IV-B）和教师的解决方案中检索重要数据，并使用简单的软件工程度量（见IV-C）比较两组数据；

bull;最后，系统收集之前阶段的所有信息，并使用一组公式（见IV-C）计算学生解决方案的最终等级。最终等级，

同时向学生提交一份详细的评估报告，以便他们评估自己的表现。

输入/输出测试

这一技术使用的冰自动评价模块的输入/输出的基于JUnit测试框架。为了测试的学生的解决方案，提供一ﬁle教师必须与所做的测试，应该在学生的源代码。图3显示一个测试实例配置为ﬁle大厦有一个一级因素的方法。

图3 最后测试

在这篇文章中，老师为学生解决方案中应该测试的所有方法编写测试。_标记只是将测试分离在同一文件中的一种方法，这样我们的系统就可以独立地对它们进行计数，并提供关于哪些测试成功与否的详细报告。

JUnit：JUnit框架（8）允许程序员在Java代码上执行自动测试。通过使用testcase类（它可以扩展以适应特定的测试环境），系统检查类的每个方法是否如预期的那样工作。每个测试都提供必要的输入参数，并调用正在测试的方法。然后，框架分析调用的行为，并将其与测试创建者提供的预期行为进行比较。assertEquals方法可以以多种不同的方式使用，但最常见的用法是将正在测试的方法的返回对象与预期返回的对象进行比较。如果这两个不匹配，则引发异常。这允许我们的系统记录特定测试是否成功，稍后提供测试阶段的完整报告。Acode系统使用这种技术来测试学生解决方案的每一个方法，并生成一个报告，报告有多少测试成功，有多少测试失败。

软件工程度量

评估模块使用的第二种技术是分析一些软件工程度量，例如循环复杂性[9]、行数、方法数、属性数和类数。

我们选择这组指标是因为足以评估简单的算法，这通常是第一年编程学生使用的算法。这些度量的分析是通过使用JavaParser框架完成的。

JavaParser:JavaParser[10]是处理Java源代码并生成相应数据结构的框架。此数据结构允许我们的评估模块从学生解决方案的每个类和方法中检索一些有用的属性，例如名称、类型、主体和参数）。通过使用voidVisitorAdapter类（可以扩展以从算法中获得更多具体信息），ACode系统可以获得必要的数据，以生成基于度量的信息，这些信息将被处理，以便为学生的解决方案分配等级（见IV-C）。通过这个过程提取的信息允许检索相关的基于度量的信息，稍后由评估模块进行分析。例如，一个方法的行数是由一个处理getbody方法返回的数据的辅助方法计算的（返回每个方法的内容以便以后分析）。每当这个过程查询一个方法时，它就存储在一个列表中，这样评估模块不仅可以知道有多少方法（通过列表的大小），还可以知道使用了哪些方法。系统中使用的其余度量也同样获得。

评价

ACODE系统是一个基于Web的系统，包括内部的自动评估模块。系统的评估分两个层次进行：分析整个系统的性能和可用性，测试评估模块的效率。

为了测试系统是否能同时承受多个连接，并且输出一个可接受的性能，我们使用Apachebench来模拟系统中的过载，就像几个学生决定同时连接一样。图5通过显示系统为每个学生生成自动反馈需要多长时间来描述这种行为。

图5 ACODE系统的性能

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[20259]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。

注册

找回密码

基于Web的Java算法自动评测系统外文翻译资料

引言

相关工作

1.Mooshak

UVa Judge

ProgTest

5.程序设计任务的自动评估

6.当前工作的局限性

ACode系统

技术方法

输入/输出测试

软件工程度量

评价

您可能感兴趣的文章

登录

引言

相关工作

1.Mooshak

UVa Judge

ProgTest

5.程序设计任务的自动评估

6.当前工作的局限性

ACode系统

技术方法

输入/输出测试

软件工程度量

评价

您可能感兴趣的文章