英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料
基于可用性视角的网站评价
摘要:可用性被公认为任何现代网站的一个重要的质量因素。本文提出了一种网站可用性评估技术,并对其使用进行了描述。这些技术的应用结果在一个门户网站的设计和评估的框架中讨论,服务于一个学术部门。文中还讨论了所开发的技术在广泛的基于Web的应用中的适用性及其在当今Web应用开发中的重要性。
- 引言
网站的评价是开发周期的一个重要阶段,在现代Web应用开发人员采用的快节奏开发过程中经常被忽视。当Web逐渐成为一个部署复杂交互应用的平台,数据库和企业信息系统的前端时,这一点就变得更加重要。这种新的介质使用增加了可用性的重要性,因为Web用于完成复杂的任务,如学习、检索信息、与对等体交互和协作。这些任务的有效实现必须在Web应用程序的设计过程中得到证实。根据象牙和赫斯特,今天许多网站的特点是可用性低,而数百万个新的网站预计将在未来几年内运行,进一步加剧了这个问题。
当今高度交互式的Web应用倾向于采用从传统软件中借用的交互方式。然而,这并不总是可以接受的,因为Web提出了需要考虑的特殊要求。例如,Web用户的特性通常不是事先知道的,或者可以有很大的变化。此外,计算平台、网络带宽和使用的访问设备可以是非常不同的。例如,用户可以通过WAP启用的设备访问某些应用程序,使用96kbps连接,通过典型的调制解调器33、6~56kbps或通过允许几百kbps或更高的高带宽连接。这些可以很大程度上影响用户交互特性。
本文高度引用的以用户为中心的设计方法被认为适用于这个新的上下文。这种方法的主要特征,如THEN ET.Al(5)所描述的那样:(i)交互系统设计应该基于系统用户需求捕获和记录用户与应用程序交互的可能方式。(ii)高度交互式应用程序的设计需要迭代过程。如果采用这种方法,则在设计过程的中心带来迭代可用性评估[6,7]。然而,用户参与和可用性测试实验的建立,以用户为中心的设计所倡导的,通常被认为是设计团队的负担。尽管如此,这种设计方法的需要被研究界广泛认可。此外,需要增加已建立的可用性测试技术[6 ](应用检查方法[4]、8]、观察方法[9 ]、问卷和访谈[10 ],以满足Web可用性评估的要求,并加速它们的冗长乏味的过程。OSE [11,12]。
在本文中,我们报告我们的经验与网站可用性测试。所讨论的案例研究涉及在过去几年中被设计和运行的门户网站,以服务于希腊佩特雷大学电气和计算机工程系的学术界(www. upATRAS。GR)。这一应用是许多类似大学部门的典型,它提供了有关部门对公众和部门成员的活动的信息,还包括一些交互式的组成部分,如支持学生建立个人学期表和考试。日程安排。
最近已经联系了这个应用程序的许多可用性测试。这些是基于在文献中提出的适应技术:(a)实验涉及由用户填写的在线问卷,(b)由实验室中的可用性专家进行启发式评价,以及(c)用户观察技术和使用日志文件的分析。介绍并讨论了接触实验。对这些发现进行了比较,并讨论了它们在Web应用程序设计中的作用。还简要介绍了门户网站的重新设计后,这些评估研究。在本文的最后一部分讨论了在Web应用程序设计中描述的多方面可用性评估框架的更广泛的含义。
二、2个案例:学术网站的可用性评价
佩特雷大学欧洲经委会系网站(www. upATRA.GR)是一个双语门户网站(英语和希腊语),其目的是促进该部门并提供有关其研究和教育活动的信息,同时提供SE。系系学生及教职工。后者需要使用一些交互组件,在可用性评估过程中需要特别注意。门户网站覆盖的八个领域涉及:
(a)有关部门历史和结构的信息
(b)学术事项(课程设置、课程内容等)
(c)研究活动(实验室、出版物、结果)
(d)人员(教师和研究人员信息、个人网页等);
(e)附加信息(地区);访问指令等)
(f)内部页面(密码控制服务)
(g)网站信息(联系人信息、站点地图等)。
其中一个提供的服务,一直是评估的重点,如下所讨论的,是站点的搜索引擎。搜索设备的用户可以选择四个信息区域中的一个(教师、研究生、人员、课程科目),并使用关键字搜索这些区域中的每一个信息。网站评估的另一项服务是个人时间表和考试时间表。用户可以从菜单中选择他们已经注册的课程或考试,并要求他们的个人课程时间表或考试时间表显示在屏幕上。在图1中示出了个人考试日程应用的典型交互屏幕。课程/考试可以从字母表列表中选择,附加到组合框中,如图1所示。
- 可用性评估实验
在网站运行两年后,进行了一系列可用性评价实验。实验在本节中给出。在论文的最后一节中,讨论了研究结果。
可用性评估实验已广泛应用问卷调查[10, 11 ]。在我们的情况下,使用这种技术已经接触了两个单独的实验。
在线问卷调查。第一个涉及在线问卷,特别是有用的Web可用性评估时,用户是遥远的,其中的提取物。问卷包含一些简单的问题,要求用户查看所提供的服务的质量和网站的效用。ZoMeLangon(www. ZoMangang.com)服务用于编制问卷和分析反应。
问卷由四部分组成。第一部分要求用户对应用程序的质量(易于导航、美观设计、内容质量和服务的有用性)的看法。第二部分要求使用频率和用户对特定站点部分和服务的看法(个人课程时间表、课程材料、教师/人员、部门信息、文凭论文信息、新闻服务)。在问卷的这两部分中所要求的答案是在一个多分点的范围内表达的,范围从1(不充分)到5(优秀)。在使用问题的频率上也使用了类似的比例。第三部分是关于使用环境的问题,如最常用的浏览器类型,屏幕分辨率,带宽等。没有要求个人数据。最后,问卷的第四部分对所遇到的三个更严重的问题和三个更有用的服务提出了开放的问题。在这部分问卷中没有对用户提出具体的建议。
在二十(20)天内,调查表通过一个可见的按钮链接到网站主页。在此期间,65名用户自愿响应。表1和表2显示了调查问卷前两部分的答复。根据这些表格,导航被认为是好的,而美观的设计、信息的内容和提供的服务的质量得到了平均的分数。
使用问卷的有用性/使用频率证明了个人时间表和考试时间表服务的高价值,而其他服务则得到了平均分数,可能没有被认为是有用和充分设计的。问卷的第三部分显示了关于站点用户的有用信息,比如浏览器的使用和连接的带宽。例如从这部分的答案是推断,超过60%的用户通过调制解调器连接到网站,因此应特别注意不包括重型web页面的网站,而所有的反应与屏幕分辨率计算设备使用同等或更高800 x600像素,显示网页设计应该充分调整更有效地利用屏幕空间。
最后回复的开放式问题第四部分的问卷,表3所示,确认需要等新的服务库的链接,当然是,学生杂志等,同时透露了一些可用性问题,如低能见度实验室,链接到web服务器的服务,尽管它已经提供,它提出了一个新的服务在表3。
WAMMI问卷。第二次实验涉及一份调查问卷,是针对参与第3.3节中描述的用户观察实验的用户。在这种情况下,用户(系统的6名经验丰富的用户)被要求填写Wammi启发的问卷[13]。请求的答复是在likert类型的范围内(强烈同意/同意/中立/不同意/强烈反对),尽管用户表达了他们对声明的态度。这类问卷,在可用性实验中被用户填写,可以用来检查他们的态度,可以作为可用性评价实验的补充。收到的响应的平均值如表4所示。将此问卷与上面的在线问卷进行比较,可以验证结果并不矛盾。但是重点是不同的,日志文件不提供用户的视图,同时提供一些额外的信息,比如在天/周/年的使用模式,引用域等等,这些可以作为用户分析的有用补充材料([14],[15])。开发利用自动技术对这些日志文件进行分析,并在评价中以互补的方式使用它们,这是一个有待进一步研究的问题。
第二种评估技术涉及11名评估人员,他们精通以用户为中心的设计,具有较高的web使用体验。他们采用了一种检验技术,称为启发式评价[4],使用启发式规则来管理良好的界面设计。这是一个众所周知的、高度评价的专家评估技术,已经在许多类似的实验中得到了成功的应用[16,8]。
这项研究的方法。在研究的第一阶段,我们鼓励评估人员浏览应用程序并仔细验证每个启发式规则的实现。评估人员被要求模拟在此阶段执行具有代表性的任务。当检测到违反规则的情况时,评估者识别违规发生的地方,并提出可能的解决方案。每个评估者填写一份描述他/她的发现的报告。评价者还提供了一个评估表,在评估表中,他们可以量化他们的主观判断,通过在5个标度量表中表示的分数,表明与每个特定规则一致的程度。所赋值的范围为1(不充分)到5(优秀)。根据专家的意见,每个规则也分配了相关权重(wi)。评价的定量结果见表5。因素加权得分u,根据公式(1)其中ri为规则等级,wi为每个启发式规则i的权重,总体可用性评分为平均值(3.38排除规则权重因子,3.42包含权重因子)。10个启发式规则中,有7个是相对较高的。规则h7、h9和h10获得了平均等级,说明了与以下所讨论的具体规则相关的可用性问题。
(灵活性和使用效率)系统一般不会提供方便用户任务的快捷方式,尤其是在搜索和个人时间表等复杂过程中。例如,经常搜索的术语不是以现成的链接形式提供的。此外,用户也不能在时间表的建设中选择多选课,比如一个特定学期的所有课程。此外,还不允许对研究生课程有特别的参考。
(支持用户识别、诊断和从错误中恢复)最严重的问题是,典型的404页面没有被替换为显示站点站点地图的页面,说明出现了系统错误(可能是由于URL错误),并提供了一个搜索链接。还有一些错误消息没有建设性地建议解决方案或说明问题发生的原因。
(帮助和文档)即使系统可以在没有大量在线文档的情况下使用,因为用户观察实验的结果,至少应该在高交互性任务(搜索引擎和个人时间表)中提供一些帮助。帮助应该很容易搜索,重点放在用户任务上,并显式列出要执行的步骤。
在本研究中,共有33个可用性缺陷被揭示。许多可用性问题都是由不止一个评估人员报告的,这证实了Nielsens和Landauers发现四到五名评估者通常会发现80%的可用性问题[17]。
第三种可用性评估技术是对典型用户的观察,因为他们与应用程序交互,执行典型任务。实验在可用性实验室进行。本系学生6名,本科4名,研究生2名,男5名,女1名,年龄23-28岁。他们都是有经验的互联网用户,他们每天都在他们的活动中使用。研究中使用的设备是个人电脑(奔腾III, 600mhz, 128 Ram, 17显示器,1024*768屏幕分辨率),通过高频带大学网络连接到网站。
在实验开始时,用户被告知他们并不是自我评价的主体。然而,他们对五项任务进行了仔细的描述(表6),虽然每项任务的目标明确,但并没有提供关于其执行的精确指示,以便不使使用者屈服。用户有足够的时间完成任务。观察员没有提供任何其他资料或支助。评估促进者制定了任务时间和对战略和使用模式的观察。第一句话是,任务T2、T3和T5在没有任何学生特别困难的情况下迅速完成。这证明了应用程序的结构非常好,可以支持用户识别特定的信息项。相反的任务T1和T4,被证明是耗时和认知要求的。
发展策略不同;经常使用多个浏览器窗口来完成任务。应用程序设计中的可用性问题显然出现了。在T1课程中,课程按字母顺序排列在个人时间表页上,没有为其他的陈述(例如每学年的集群)编列经费。同样,重做和撤消选项的幸运也阻碍了任务的执行。在同一页面中没有搜索选项。在时间表上的所有课程的所有课程的转让的单一按钮的可用性将大大加快这一进程。
该网站的搜索引擎隐藏在一个相关图标后,如图3所示。这个图标不容易被用户识别为一个按钮,因为没有相关的搜索文本框。如此多的用户在寻找站点的搜索引擎上遇到了困难。
为了完成任务T4,用户需要使用站点搜索引擎。在研究过程中发现了一些与使用该设施有关的误解。搜索引擎首先需要选择搜索类别,然后插入一个关键字。没有办法在所有类别中进行全球搜索(课程主题、教员、本科生、研究生等)。同样,搜索引擎所应用的逻辑也不清楚,也没有解释。(例如,计算机网络搜索计算机或网络或字符串计算机网络)。最后,后续的搜索还不清楚是在第一个搜索结果中还是在原始搜索空间中进行的。一些用户对搜索结果的有效性存在一些不安全性。
由于这个原因,一个用户没有完成任务T4。总之,30个任务中有29个已经成功完成,但是在任务T1和T4中遇到的困难,如本文所讨论的,以及完成任务所需要的意外的长时间,考虑到专家用户的参与,揭示了设计的许多限制。
学术部门的门户网站最近被重新设计,考虑到前一节中描述的可用性评估研究的结果。新设计的特点是网站外观美观,下载次数减少,多媒体内容减少,用户访问数据更紧凑,页面布局更紧凑,信息量更大。同时保留了网站原有的结构和内容。
根据用户的评论和在用户观察实验中所观察到的困难,对搜索设施和个人时间表和考试安排服务进行了相当大的修改。例如,个人时间表服务中的课程的选择屏幕,在新的门户中是通过所有可用的课程的列表完成的,按年分组,如图5所示,而不是在原始设计中通过一个组合框来排列字母列表。此屏幕提供所有课程的概览。用户可以从该视图中选择或取消选择课程,然后按照时间表进行。这个新设计解决课程选择任务中所观察到的问题,在第3节中讨论
新的门户设计最近被评估,使用第3.2节中讨论的改进的启发式评价方法,以便将评价结果与原设计的评价研究相比较,在第3节中讨论。本实验的评价者为17名(17名),均有使用的经验。评估技术和强大的web用户。与第3节所讨论的研究相比,这是一组不同的评价者。
应用的启发式规则是在第3.2节中提出的,而在最初的评价研究中特别注意观察评价协议,以便能够比较两项评价研究的结果。评估人员提出了许多有用的意见和建议。表7给出了评价结果的概述。
从表7和表5的分数中可以推断出,更新后的设计的总体可用性得分的平均值为3.78,而原始设计的总体可用性得分为3.38。这种差异被认为是显著的,根据一对
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[23922],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。