看书标记【数据科学：R语言实战 2】

本文介绍: 【数据科学：R语言实战 2】

【数据科学：R语言实战 2】

eclat：用于项集模式检测，常用购物车
arules：确定数据集中的项目共现
apriori：学习数据集中的关联规则
TraMineR：挖掘序列的R包

寻找行为相似的模式，通过数据中的交集来估算同时频繁出现事件候选项（购物车项目）的支持度，然后通过对频繁候选项进行测试来证实数据集中的模式。

Eclat可以使用arules包中的eclat()函数

library(“arules”)
data(“Adult”)
dim(Adult)
summary(Adult)

data(“Adult”)
itemsets <- eclat(Adult)
itemsets.sorted <- sort(itemsets)
itemsets.sorted[1:5]   #仅看前五个集合

未要求资本损失或资本利得、美国人、白种人

itemsets <- eclat(Adult, parameter=list(minlen=9))
inspect(itemsets)

data(Agrawal)
summary(Agrawal.db)
summary(Agrawal.pat)

mynbparameters <- NBMinerParameters(Agrawal.db)
mynbminer <- NBMiner(Agrawal.db, parameter = mynbparameters)
summary(mynbminer)

install.packages("arules")
library(arules)
tr <- read.transactions("http://fimi.ua.ac.be/data/retail.dat", format="basket")  #比利时杂货店数据
summary(tr)   ##结果表明成对项目很受欢迎，项目39有50675个
itemFrequencyPlot(tr, support=0.1)	#最频繁项目
rules <- apriori(tr, parameter=list(supp=0.5,conf=0.5))  #构建关联规则
summary(rules)  #规则摘要
inspect(rules)  ##具体规则 项目39加入购物篮率高
## interestMeasure(rules, c("support", "chiSquare", "confidence", "conviction", "cosine", "leverage", "lift", "oddsRatio"), tr)

install.packages("TraMineR")
library ("TraMineR")
data(mvad) ##mvad数据追踪了712个个体，自训练至工作的过程
summary(mvad)
myseq <- seqdef(mvad, 17:86)  ##截取序列数据，参照相关状态来获取所需的序列数据
seqiplot(myseq) ##指数图表：参照个人不同状态间界定的转换期
seqfplot(myseq) ## 频率图表：同一序列的人群集，经过一段时间训练后会有工作
seqdplot(myseq) ##分布图表：在上学或训练后开始工作
seqHtplot(myseq) ##序列的熵
##数据湍流：从数据中可见的某个特定事例可以推导出多少不同的后续序列。
##seqST函数将数据湍流可视化
myturbulence <- seqSt(myseq)
hist(myturbulence)

data(famform) 
seq <- seqdef(famform)  ##界定可用的序列对象
seq
seqLLCP(seq[3,],seq[4,])  #使用序列3、4的LCP，得到四个前置匹配即“S-U-M-MC”
seqLLCS(seq[1,],seq[2,])  #计算1、2的LCS度量
cost <- seqsubm(seq, method="CONSTANT", cval=2)  ##确定OMD=2
cost

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

序列用法

看书标记——R语言

Chapter 2 序列的数据挖掘

2.1 模式

2.1.1 Eclat 频繁项集的挖掘

用法

用eclat找到成年人行为的相似点

查找数据集中的频繁项目

集中于最高频率的示例

2.1.2 arulesNBMiner

用法

为频繁集挖掘Agrawal数据

2.1.3 Apriori

用法

评估购物篮中的关联

2.1.4 用TraMineR确定序列

用法

确定训练和职业中的序列

2.1.5 序列相似点

用法

示例

发表回复取消回复