Presentation is loading. Please wait.

Presentation is loading. Please wait.

数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。

Similar presentations


Presentation on theme: "数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。"— Presentation transcript:

1 数据挖掘实验 1 Apriori 算法编程实现

2 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。 对下面数据集进行挖掘:

3 数据挖掘实验一 对于数据集,取最小支持度 minsup=2 ,最小置信度 minconf=0.8 。得到的结果. 实验步骤: ① 首先单趟扫描数据集,计算各个一项集的支持度,根 据给定的最小支持度闵值,得到一项频繁集 L1 。 ② 然后通过连接运算,得到二项候选集,对每个候选集 再次扫描数据集,得出每个候选集的支持度,再与最小支 持度比较。得到二项频繁集 L2 。 ③ 如此进行下去,直到不能连接产生新的候选集为止。 ④ 对于找到的所有频繁集,用规则提取算法进行关联规 则的提取。 实验要求:可以用 JAVA 、 C++ 或 C 语言实现。

4 Apriori 算法的描述

5 Illustrating Apriori “How is the Apriori property used in the algorithm?" To understand this, we must look at how L k is used to find L k+1. A two step process is followed, consisting of join and prune actions.

6

7

8

9 Found to be Infrequent Illustrating Apriori Principle Pruned supersets

10

11 Join action L1={I1,I2,I3,I4} C2=L1∞L1 ={I1,I2,I3,I4} ∞{I1,I2,I3,I4} ={{I1,I2},{I1,I3},{I1,I4},{I2,I3},{I2,I4},{I3,I4}} 备注: L1∞L1 按定义要求两个连接项的共享 k-1=1-1=0 个项

12 Join action L2={{I1,I2}, {I2,I3},{I2,I4},{I3,I4}} C3=L2∞L2 ={{I1,I2}, {I2,I3},{I2,I4},{I3,I4}} ∞ {{I1,I2}, {I2,I3},{I2,I4},{I3,I4}} ={ {I2,I3,I4}} 备注: L2∞L2 按定义要求两个连接项的共享 k-1=2- 1=1 个项

13

14

15

16

17

18


Download ppt "数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。"

Similar presentations


Ads by Google