Deleting a branch is permanent. It CANNOT be undone. Continue?
Deleting a branch is permanent. It CANNOT be undone. Continue?
Dear OpenI User
Thank you for your continuous support to the Openl Qizhi Community AI Collaboration Platform. In order to protect your usage rights and ensure network security, we updated the Openl Qizhi Community AI Collaboration Platform Usage Agreement in January 2024. The updated agreement specifies that users are prohibited from using intranet penetration tools. After you click "Agree and continue", you can continue to use our services. Thank you for your cooperation and understanding.
For more agreement content, please refer to the《Openl Qizhi Community AI Collaboration Platform Usage Agreement》
数据挖掘技术来自不同的学习领域,它们相互重叠,包括统计分析、机器学习(ML)和数学。下面给出了一些示例。
关联规则挖掘
关联规则挖掘是查找两个不同的、看似无关的数据集之间关系的过程。If-then 语句证明了两个数据点之间存在关系的可能性。数据科学家使用支持度和置信度标准来衡量结果的准确性。支持度衡量相关元素在数据集中出现的频率,而置信度表示 if-then 语句准确的次数。
例如,当顾客购买一件商品时,他们也经常会购买第二件相关的商品。零售商可以通过对过去购买数据的关联挖掘来识别新客户的兴趣。他们使用数据挖掘结果填充在线商店的推荐部分。
分类
分类是一种复杂的数据挖掘技术,它训练 ML 算法将数据分类为不同的类别。它使用决策树和最近邻等统计方法来识别类别。在所有这些方法中,算法都是用已知的数据分类进行预先编程,以猜测新数据元素的类型。
例如,分析师可以通过使用苹果和芒果的已标图像来训练数据挖掘软件。软件可以准确地预测新图片是苹果、芒果还是其他水果。
集群
集群是根据多个数据点的相似性将其分在一组。它不同于分类,因为它不能按特定类别区分数据,但可以从它们的相似性中找到模式。数据挖掘结果是一组集群,其中每个集合都不同于其他组,但每个集群中的对象在某些方面是相似的。
例如,在处理调查的多元数据时,集群分析可以帮助进行市场研究。市场研究人员使用集群分析将消费者划分为不同的细分市场,并更好地了解不同群体之间的关系。
序列和路径分析
数据挖掘软件还可以寻找导致后续事件的特定事件或值集的模式。它可以识别定期发生的数据变化或随时间起伏的数据点。
例如,一家企业可能会使用路径分析来发现某些产品的销售在节假日前猛增,或者注意到天气变暖会使更多人访问其网站。