本文介绍: 把服务器当作一种资源,随着访问需求变化,从云计算的服务商地方租,使利用率变高。一个一个单独的elements/items,两两去聚。聚类:把一堆数据分为一组一组的(没有标签)把问题进行切分,分配到不同的处理器上。
课程:清华大学-数据挖掘:理论与算法(国家级精品课)_哔哩哔哩_bilibili
一、Learning Resources
二、Data
- 数据是最底层的一种表现形式。
- 数据具有连续性。
- 从存储上来讲,数据分为逻辑上的和物理层的。
- 大数据:数据量大、产生速度快、数据种类多、
三、The Process of Data Mining
四、clustering聚类
聚类:把一堆数据分为一组一组的(没有标签)
层次性聚类:
一个一个单独的elements/items,两两去聚。
五、 云计算
把服务器当作一种资源,随着访问需求变化,从云计算的服务商地方租,使利用率变高。
- Pay As You Go
- Software as a Service
- Platform as a Service
- Infrastructure as a Service
六、并行运算
把问题进行切分,分配到不同的处理器上。
七、
- 解决数据挖掘:想清楚数据之间到底有没有规律
- 看问题要全面,要从多个角度、多个维度思考,不能以偏概全。
- 注意:存在内在分组
- 不能忘记时间维度。
- 幸存者偏差问题:
样本可能存在偏差。
原文地址:https://blog.csdn.net/2301_80618119/article/details/135723414
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.7code.cn/show_61391.html
如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。