本文介绍: c条件模式基为 {{e,a,b:1}, {e,a,d:1}, {e,b:1}, {d:1}, {a,b:1}},统计基于条件模式基的候选一项集:{a:3,b:3,e:3,d:2}。综上所述,根据 FP-Growth 算法确定的频繁项集为 {a},{b},{c},{d},{e},{ab},{ad},{ae},{be},{de},{ade}。建立 ba 条件 FP 树,需要从图。可以看出,频繁项集有 {a},{b},{c},{d},{e},{ab},{ad},{ae},{be},{de},{ade}。

2×3+2×5+4×40.924
显然,User 2 和 User 1、User 3、User 5 最相似。

  • 使用与 User 2 最相似的三个 User 预测 User 2 的 Product 2。

    r

    ˉ

    U

    s

    e

    r
      

    1

    =

    1

    4

    (

    1

    +

    1

    +

    5

    +

    3

    )

    =

    5

    2

    r

    ˉ

    U

    s

    e

    r
      

    2

    =

    1

    3

    (

    3

    +

    5

    +

    3

    )

    =

    4

    r

    ˉ

    U

    s

    e

    r
      

    3

    =

    1

    4

    (

    1

    +

    3

    +

    1

    +

    1

    )

    =

    3

    2

    r

    ˉ

    U

    s

    e

    r
      

    5

    =

    1

    4

    (

    2

    +

    2

    +

    2

    +

    4

    )

    =

    5

    2

    begin{align} bar r_{rm User ;1} &= frac{1}{4}(1+1+5+3) = frac{5}{2} \ bar r_{rm User ;2} &= frac{1}{3} (3+5+3) = 4 \ bar r_{rm User ;3} &= frac{1}{4} (1+3+1+1) = frac{3}{2} \ bar r_{rm User ;5} &= frac{1}{4}(2+2+2+4) = frac{5}{2} end{align}

    rˉUser1rˉUser2rˉUser3rˉUser5=41(1+1+5+3)=25=31(3+5+3)=4=41(1+3+1+1)=23=41(2+2+2+4)=25

    r

    U

    s

    e

    r
      

    2

    ,

    P

    r

    o

    d

    u

    c

    t
      

    2

    =

    r

    ˉ

    U

    s

    e

    r
      

    2

    +

    s

    i

    m

    (

    1

    ,

    2

    )

    (

    r

    U

    s

    e

    r
      

    1

    ,

    P

    r

    o

    d

    u

    c

    t
      

    2

    r

    ˉ

    U

    s

    e

    r
      

    1

    )

    +

    s

    i

    m

    (

    3

    ,

    2

    )

    (

    r

    U

    s

    e

    r
      

    3

    ,

    P

    r

    o

    d

    u

    c

    t
      

    2

    r

    ˉ

    U

    s

    e

    r
      

    3

    )

    +

    s

    i

    m

    (

    5

    ,

    2

    )

    (

    r

    U

    s

    e

    r
      

    5

    ,

    P

    r

    o

    d

    u

    c

    t
      

    2

    r

    ˉ

    U

    s

    e

    r
      

    5

    )

    s

    i

    m

    (

    1

    ,

    2

    )

    +

    s

    i

    m

    (

    3

    ,

    2

    )

    +

    s

    i

    m

    (

    5

    ,

    2

    )

    3.851

    begin{align} r_{rm User ;2, Product ;2} &= bar r_{rm User ;2} + frac{{{rm sim(1,2)}(r_{rm User; 1, Product;2}- bar r_{rm User; 1}) } + {{rm sim(3,2)}(r_{rm User; 3, Product;2}- bar r_{rm User; 3})} + {{rm sim(5,2)}(r_{rm User; 5, Product;2}- bar r_{rm User; 5}) }}{rm sim(1,2) + sim(3,2)+ sim(5,2)} \ &≈ 3.851 end{align}

    rUser2,Product2=rˉUser2+sim(1,2)+sim(3,2)+sim(5,2)sim(1,2)(rUser1,Product2rˉUser1)+sim(3,2)(rUser3,Product2rˉUser3)+sim(5,2)(rUser5,Product2rˉUser5)3.851

  • Lab Part

    Churn Management

    churn_training.txt 文件包括 2000 条数据,churn_validation.txt 包括 1033 条数据。

    图 10    不同参数下决策树的效果

    图 11    不同参数下决策树的效果(续)

    图 12    不同参数神经网络效果

    图 13    不同参数逻辑回归的效果

    Market Basket Analysis

    采用 Apriori 算法,设置 Minimum antecedent support 为 7%,Minimum confidence 为 45%,Maximum number of antecedents 为 4。

    原文地址:https://blog.csdn.net/weixin_46221946/article/details/134693760

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

    如若转载,请注明出处:http://www.7code.cn/show_11479.html

    如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注