基于移动计算的模糊决策树算法在体育健身会员管理中的应用外文翻译资料

 2023-06-26 10:04:57

Application of Fuzzy Decision Tree Algorithm Based on Mobile Computing in Sports Fitness Member Management

Abstract

After the reform and the opening, the economy of our country has developed rapidly, and the living conditions of the people have become better and better. As a result, they have a lot of time to pay attention to their health, which has promoted the rapid development of the sports and fitness industry in my country. In response to the increasing development of the sports and fitness sector of my country, the current state of the administration of members of the sports fitness industry does not keep pace with the development of the sports and fitness industry of my country. Based on this, this article uses a fuzzy decision tree algorithm to establish a decision tree based on the characteristics of customer data and loses existing customers. Analyzing the situation is of strategic significance for improving the competitiveness of the club. This article selects the 7 most commonly used data sets from the UCI data set as the initial experimental data for model training in three different formats and then uses the data of a specific club member to conduct experiments, using these data files as training samples to construct a vague analysis of the decision tree to overturn the customer to analyze the main factors of customer change. Experiments show that the fuzzy decision tree ID3 algorithm based on mobile computing has the highest accuracy in the Iris data set, reaching 97.8%, and the accuracy rate in the Wine data set is the smallest, only 65.2%. The mobile computing-based fuzzy decision tree ID3 algorithm proposed in this paper obtained the highest correct rate (86.32%). This shows that, compared to traditional analysis methods, the blurred decision tree obtained for churn client analysis has the advantages of high classification accuracy and is understandable so that ideal classification accuracy can be achieved when the tree is small.

1. Introduction

With the rapid development of information, more and more data information will inevitably be created. This data not only has a particularly large amount of data but also contains a large amount of potentially valuable information. Gym clubsareincreasingly facingthequestionofhowtoeffectively manage and how to effectively use the useful data you need from these large amounts of data. Use the right methods to gather relevant data and information, be able to identify customer characteristics in the database in a timely manner, analyze key drivers of customer change to reduce customer turnover, and provide helpful information to managers in decision support.

The decision tree induction learning algorithm repre- sented by the ID3 algorithm is feasible when solving classifi- cation problems, but this algorithm does not take into account the ambiguity of customer data, so there are some limitations in expressing and understanding customer char- acteristics. The fuzzy decision algorithm ID3 based on the theory of fuzzy mathematics is a fuzzy extension of the clas- sical ID3 algorithm. Because it can deal with the uncertainty associated with human thought and emotion, it extends the scope of the ID3 algorithm, creating decision trees is more logical, and sorting speed Faster, can provide decision sup- port for various areas. Then, how to effectively use business intelligence technology to make strategic decisions requires companies to analyze these customer data.

Traditional analysis methods have great limitations in solving enterprise customer relationship management, which makes the results of analysis and prediction unsatisfactory.

In the past ten years, scholars at home and abroad have conducted a large number of pioneering and fruitful researches on the application of fuzzy decision tree algorithm in management and have accumulated rich research results and research experience. Chiu et al. tried to apply the fuzzy decision tree that combines the advantages of fuzzy theory and fuzzy tree into this field by analyzing the problems in the management of high school teachers. It briefly introduces the construction principle of fuzzy decision and the algo- rithm of fuzzy ID3 decision tree and applies it to the manage- ment of teachers in colleges and universities. Therefore, a preliminary analysis of the reasons for the loss of high school teachers is carried out. The research of several high schools shows that the results obtained by this method are in line with the facts and therefore provide a theoretical basis for high schools to solve the problem of faculty management. However, his research did not clearly put forward the rele- vant data on the loss of high school teachers [1]. In Yumirsquo;s business management, it is very important to analyze the cri- sis of customer confiscation to improve competitiveness, which is an important branch of business intelligence. Com- pared with decision trees, based on the advantages of fuzzy decision trees in solving the ambiguity of customer data, genetic algorithms are used to optimize two important parameters in the fuzzy decision trees. Then, a method based on optimized fuzzy decision-making to analyze the crisis of customer forfeiture is proposed. The experimental results show that the method is feasible and effective. It provides new ideas for analyzing and predicting customer confiscation crises and helps managers make better decisions in business strategies. However, the overall research lacks data support and needs more data support its conclusion [2]. Jang and Kim can identify different types of soil through these charac- teristics. Good soil classification is very important for better use of soil. The opinions of experts may be very different. It is not easy for experts to manually classify soil. In addition, different types of soil cannot be defined

剩余内容已隐藏,支付完成后下载完整资料


基于移动计算的模糊决策树算法在体育健身会员管理中的应用

摘要

改革开放后,我国经济迅速发展,人民生活条件越来越好。因此,他们有很多时间关注自己的健康,这促进了我国体育健身产业的快速发展。为了应对我国体育健身业的日益发展,目前体育健身业成员的管理状况与我国体育健身业的发展不相适应。基于此,本文利用模糊决策树算法,根据客户数据的特点和流失现有客户的情况,建立决策树。分析形势对提高俱乐部竞争力具有战略意义。本文从UCI数据集中选取7个最常用的数据集作为初始实验数据,以三种不同的格式进行模型训练,然后使用特定俱乐部会员的数据进行实验,以这些数据文件作为训练样本,构建模糊分析决策树,推翻客户,分析客户变化的主要因素。实验表明,基于移动计算的模糊决策树ID3算法在虹膜数据集中的准确率最高,达到97.8%,在葡萄酒数据集中的准确率最低,仅为65.2%。本文提出的基于移动计算的模糊决策树ID3算法获得了最高的正确率(86.32%)。这表明,与传统的分析方法相比,用于客户流失分析的模糊决策树具有分类精度高、易于理解的优点,因此,当树较小时,可以达到理想的分类精度。

1、简介

随着信息的快速发展,不可避免地会产生越来越多的数据信息。这些数据不仅具有特别大的数据量,而且还包含大量潜在有价值的信息。健身房俱乐部越来越面临如何有效管理以及如何有效利用这些大量数据中所需的有用数据的问题。使用正确的方法收集相关数据和信息,能够及时识别数据库中的客户特征,分析客户变化的关键驱动因素,减少客户流失,为管理者提供决策支持方面的有用信息。

ID3算法所代表的决策树归纳学习算法在解决分类问题时是可行的,但该算法没有考虑客户数据的模糊性,因此在表达和理解客户特征方面存在一定的局限性。基于模糊数学理论的模糊决策算法ID3是经典ID3算法的模糊扩展。由于它可以处理与人类思维和情感相关的不确定性,它扩展了ID3算法的范围,创建决策树更具逻辑性,排序速度更快,可以为各个领域提供决策支持。那么,如何有效地利用商业智能技术做出战略决策,需要公司分析这些客户数据。

传统的分析方法在解决企业客户关系管理问题时存在很大的局限性,使得分析和预测的结果不尽如人意。

近十年来,国内外学者对模糊决策树算法在管理中的应用进行了大量开拓性和富有成效的研究,积累了丰富的研究成果和研究经验。Chiu等人通过分析中学教师管理中存在的问题,尝试将模糊理论与模糊树相结合的模糊决策树应用到这一领域。简要介绍了模糊决策的构造原理和模糊ID3决策树的算法,并将其应用于高校教师管理中。因此,对高中教师流失的原因进行了初步分析。对几所高中的研究表明,该方法得出的结果与事实相符,从而为高中解决师资管理问题提供了理论依据。然而,他的研究没有明确提出高中教师流失的相关数据[1]。在Yumi的商业管理中,分析客户没收对提高竞争力的影响非常重要,这是商业智能的一个重要分支。与决策树相比,基于模糊决策树在解决客户数据模糊性方面的优势,采用遗传算法对模糊决策树中的两个重要参数进行优化。然后,提出了一种基于优化模糊决策的客户流失危机分析方法。实验结果表明,该方法是可行和有效的。它为分析和预测客户没收危机提供了新的思路,并帮助管理者在业务战略中做出更好的决策。然而,整体研究缺乏数据支持,需要更多的数据支持其结论[2]。Jang和Kim可以通过这些特征识别不同类型的土壤。良好的土壤分类对于更好地利用土壤非常重要。专家们的意见可能大相径庭。对于专家来说,手动分类土壤并不容易。此外,无法确定不同类型的土壤。为了探索解决这一问题的替代方法,研究了使用模糊决策树归纳算法从数据中自动生成土壤分类器的应用。为了比较模糊决策树分类器获得的结果,我们使用了两种著名的分类器生成方法:经典决策树诱导算法C4。5和模糊规则归纳算法FURIA。实验结果缺乏更多的数据支持。因此,模糊决策树分类器获得的结果仍然值得怀疑[3,4]。

本文在分析客户数据特征模糊性的基础上,比较了决策树和模糊决策树两种归纳学习算法,并利用移动计算对模糊决策树建立过程中涉及的两个重要参数进行了优化。并将优化后的模糊决策树用于客户流失分析。根据成员管理的相关数据元,选取样本区域的空间数据,将决策树算法中的ID3algorithmin与基于移动计算的模糊算法相结合,实现样本区域的程序建立,建立了成员管理中决策树的分类模型,并通过建立的分类预测模型,对用户是否会流失进行了分析和预测,同时对三种方案的正确性进行了评价。

2、模糊决策树算法在体育健身会员管理中的应用

2.1。决策树模型设计与算法

2.1.1。决策树构造。

在建立决策树的过程中,我们首先必须有数据样本。这是施工数据库。人们进行特性测试,并通过测试特性对这些数据进行排序,形成一个包含节点和分支的树结构。这是决策树的基本思想。决策树排序算法从上到下执行。在每个节点选择分类效果好的特征对样本进行分类。该过程继续执行,最后,所有培训集都被该树分类,或者所有属性都已被使用[5,6]。要构建决策树,首先选择最佳测试属性,然后使用所选属性划分样本集,同时构建下一级节点。最后,除法的结果只是相同的样本。这种划分是纯粹的。

以下描述是构建决策树的一般过程:样本集和空树构成初始状态。对于节点,使用该节点的test属性划分节点;如果该节点的所有样本都包含在同一类别中,则将创建一个具有该类别印记的叶节点,并停止创建;否则,使用最佳度量来计算每组的每个可能划分;如果测试是选择作为测试节点的最佳类别,则将建立一个子节点,该子节点的输出数量与分区不同的输出数量相同;在标记父节点和子节点之间的边界时,使用该分类的输出结果,最后将样本集划分为子节点。作为当前节点,子节点将在无法再次分类时停止分类[7–9]。

2.1.2。决策树的简化。

决策树的数据非常复杂,用户很难理解,因此该决策树的含义并不那么重要。因此,如果构成决策树的树枝和树叶较少,则分类过程相对简单,存储数据的空间相对较小,因此在构建树时,注意尽可能简单,不要将树的树枝和树叶建得太大【10–12】。因此,需要简化决策树。对于决策树,一种有效地针对噪声的技术称为修剪技术。这项技术使人们能够更好地理解和简化树。决策树相对简单而且很好,但修剪技术并不是万能的。如果数据太少,我们仍然使用修剪技术,那么树的信息将严重不足。因此,修剪技术不是绝对的技术。如果在适当的时间应用,可以取得更好的效果。当然,有必要防止在不需要时应用它。

2.1.3。预调整。

在构建树之前,请尽快修剪树数据以停止树的生长。关于预调整方法,何时停止是一个关键问题。有很多方法可以研究预调谐并选择合适的时间。一种更简洁的方法是指定树的高度,选择在树达到该高度时停止树的生长,并且不再继续使用属性测试数据【13,14】。这种方法是一把双刃剑。有时检查树的高度可以获得良好的结果,但过早停止树的生长将导致数据分类不完整,从而导致结果不准确。为数据属性设置适当的要素值。在对数据进行分类时,当节点的属性值为该操作值时,树不会停止增长,也不会分裂。这种方法可以很好地避免数据碎片化,也可以避免过度分类导致的数据冲突。

设置一个限制值,该值可以称为阈值。该值表示节点数。随着树的不断增长,当到达某个节点时,节点数小于该值;然后,树木的生长可以被完全停止【15,16】。该方法也是限制树木过度生长的重要手段,但其应用仅限于少量数据;使用此方法进行处理将影响结果的准确性。构建树时,它将影响模型的性能。太大的树将影响模型的速度,太小的树将无法完全分类数据。因此,模型的效益必须有一个值,随着树的生长,当效益值小于极限值时,生长将停止。

2.1.4 后期运行

  1. REP(减少错误修剪)方法。对于修剪,可以处理decisiontree上的每个点。因为决策树的构造是从上到下的,所以协调修剪过程也是这样一个连续的过程。此方法不会逐个处理每个节点。它是一种抽象而简洁的思维方式。将决策树T划分为多个子树,并将多个子树视为叶节点,因此首先形成一棵简单树[17,18]。它有S个叶节点。对于叶节点,它覆盖N个样本,并且有E个错误。然后,子树的误判率估计为:

我们假设子树中每个样本的误判服从二项分布,其中N表示子树中包含的所有样本数。因此,在修剪之前,错误判断的预期数量为:

如果新树的分类导致的错误率非常低,并且子树数量结构中子树的属性不同,则用叶节点替换S。这个过程是连续进行的,最后,决策树T的子节点数被叶节点替换。这种处理方法将得到理想的树[7,19]。这种方法的优点是可以得到精度更高的决策树,而且树不会太大。

  1. PEP(悲观错误修剪)方法。假设初始决策树为T,且某个子节点有一个数为n(T)的分支,则这些情况的结果中存在e(T)错误分类,数据集的错误率为:

错误率是有偏差的,因为训练数据用于生成树,同时也对树进行修剪,因此该方法的修剪程度不够准确。为了改进对该方法准确性的评估,可将错误率修正为:

树T的子树T(T)的数目设置为S;这棵树的叶子数是L(S);那么,T(T)的分类误差为:

当训练集中的样本发生冲突时,此结果将无效。PEP方法在误差估计中引入了连续校正机制。这种校正方法在数据更麻烦的情况下效果更好。如果数据仅仅引入了这种机制,结果将不准确[20,21]。如果分类方法用于对所有样本集的数据进行分类,则:

如果子树T1中用于纠正分类错误的叶节点足够大,则对其进行修剪。

2.1.5。决策树的性能评估。

对于决策树,高复杂性并不意味着准确。从这个意义上讲,准确性与树的复杂性无关。当然,复杂性不是衡量准确性的标准。对于决策树,人们通常有以下许多评估标准:

根据此规则,将处理未知数据。这样的过程可以帮助人们发现未知的知识信息。从数据中获得的信息的准确性可以决定员工决策的准确性。即使对模型进行了准确分类,对其的理解也很复杂,不能认为是一种好的方法。一个好的分类模型可以提供一种描述简单易懂的分类方法【22,23】。对于决策者来说,简洁的模型描述更有利于理解,更有利于广泛应用。模型所能承载的数据量也是人们是否使用该模型的一个因素。当数据量非常大时,一个好的模型仍然可以显示出良好的准确性,该模型值得应用。2.2。经典决策树算法2.2.1。ID3算法。ID3算法的特点是首先计算样本集属性的信息熵,然后通过比较这些值来选择用于分割的最佳属性。使用此属性划分节点以形成决策树【24,25】。如果成员管理Y中包含的元素是fx1、x2,⋯,xng,每个元素的发生概率为fp1,p2,⋯,png,则成员管理Y的熵定义如下:

实例可归类为i类的概率为:

此时,成员管理Y的熵为:

如果选择属性A作为拆分属性,则值为fa1、a2、,⋯,amg,数据集通过A划分为m类,其中条件信息熵表示为:

那么,属性A带来的信息增益是:

通过ID3算法建立决策模型时,需要遍历每个决策属性,并使用信息增益最大的属性来划分数据集,这样得到的决策树更准确。ID3算法如算法1所示。2.2.2。C4。5算法。为了计算成员管理的效率,其拆分信息的定义如下[26,27]:

拆分信息表示根据决策属性A的值将数据集Y划分为子集所生成的信息,因此有成员管理效率的定义:

2.2.3。决策树算法的比较与分析。

有许多决策树算法。在可伸缩性、执行速度、结果的可理解性以及分类和预测的准确性方面存在许多差异。这些算法的汇总比较如表1所示

3、模糊决策树算法在体育健身会员管理中的实验设计

3.1。模型实现。

为了完成三种决策树方案的对比实验,实现模糊决策模型,它具有数据导入、数据模糊化、生成决策树模型、模型测试和使用说明等功能。体育健身会员管理模型的主要业务流程图如图1所示。3.2。测试对象。为了获得准确可靠的实验结果来完成算法的分析,必须首先选择合适的实验数据集。本文从UCI数据集中选取7个最常用的数据集作为初始实验数据,对三种不同的方案进行模型训练。所用数据集的具体描述如表2所示。培训结束后,将该模型应用于客户流失分析,然后使用某俱乐部的数据进行实验。客户数据主要包括基本信息、地理分布信息和服务信息。使用统计抽样从给定年份的客户数据中提取1500条记录。数据库中客户的特征包括客户年龄、居住面积、盈利能力、服务期限和合同类型,客户分为是(客户流失)和否(无客户流失)两种类型。使用这些数据文件作为培训样本,创建用于客户分析的模糊决策树,并分析客户变化的关键因素【28】。

3.3 实验程序

实验比较了三种方案。第一种方案是使用传统的决策树ID3算法构建决策树;第二个方案是使用模糊决策树ID3算法构建决策树,第三个方案是基于移动计算的模糊决策树ID3算法构建决策树。图2显示了三个方案建立的决策树

3.4 统计处理。

使用SPSS 13.0统计软件进行统计分析。用单因素方差分析对差异进行显著性检验,用LSD-t对两组间的差异进行检验,用组t检验对模糊决策树算法在运动健身会员管理中的应用结果进行统计。Plt;0:05被认为是显著的,具有统计学意义。

4、模糊决策树算法在体育健身会员管理中的应用

4.1。数据集培训结果

4.1.1

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[603428],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。