0 简介

今天学长大家分享一个毕业设计项目

基于协同过滤的电影推荐系统

项目运行效果

项目获取

https://gitee.com/sinonfin/algorithm-sharing

1 设计概要

21世纪是信息化时代,随着信息技术网络技术发展信息化已经渗透人们日常生活各个方面,人们可以随时随地浏览海量信息,但是这些大量信息千差万别,需要费事费力的筛选、甄别自己喜欢或者感兴趣数据。对网络电影服务来说,需要用到优秀的协同过滤推荐功能辅助整个系统

系统基于Python技术使用UML建模采用Django框架组合进行设计,Mysql数据库存储数据。本系统的功能主要包括:用户注册登录、信息维护搜索电影、电影评分、个性化推荐以及管理员进行信息管理等。

个性化推荐功能使用基于用户的协同过滤算法热点推荐来实现开发工具主要有:Pycharm、Python3.8、Django3、mysql8、Navicat等。

电影在线推荐系统很大程度上提高了对电影管理效率,符合广大用户的基本需求

在这里插入图片描述

2 课题背景和目的

日益发展网络技术信息技术,各种电影网站也是逐渐应运而生,例如腾讯视频、优酷视频、爱奇艺视频等。人们可以随时随地浏览海量信息,但是这些大量信息千差万别,需要人们费事费力的筛选、甄别自己喜欢或者感兴趣数据

这个课题主要是解决电影网站的个性化推荐功能,以便准确向用户推荐感兴趣的信息。个性化推荐的主要思想是,根据用户的历史操作行为分析用户兴趣喜好,然后把用户比较感兴趣的同时没有操作行为的项目推荐给用户。个性化推荐也可以根据用户操作行为的变化而实时分析并推荐用户喜好程度比较高的项目,这样用户会对网站产生粘性,提高用户的忠诚度,为商家带来流量,进一步提高商家利润具有较大的商业价值,可以达到双赢的目的。

3 协同过滤算法原理

3.1 基于用户的协同过滤推荐算法实现原理

传统基于用户(User-Based)的协同过滤推荐算法实现原理分四个步骤

3.1.1 步骤1

根据用户历史行为信息构建用户-项目评分矩阵,用户历史行为信息包括项目评分浏览历史、收藏历史、喜好标签等,本文以单一的项目评分为例,后期介绍其他行为信息和混合行为信息,用户-项目评分矩阵如表1所示

在这里插入图片描述

注:用户A对项目1的评分是1分,用户A对项目2没有评分。

3.1.2 步骤2

根据用户-项目评分矩阵计算用户之间相似度。计算相似常用方法有余弦算法修正余弦算法、皮尔森算法等等(后期我们会将相似算法展开讲解这里以余弦算法为例)。余弦算法公式如图1所示:

在这里插入图片描述

在这里插入图片描述

3.1.3 步骤3

根据用户之间相似度得到目标用户的最近邻居KNN。KNN的筛选常用的有两种方式,一种是设置相似度阀值(给定一个相似度的下限,大于下限的相似度为最近邻居),一种是根据与目标用户相似度的高低来选择前N个最近邻居(本次以前N个为例,后期会详细对比讲解两者)。相似度排序可用经典冒泡排序法。

3.1.4 步骤4

预测项目评分并进行推荐。最常用预测公式如图所示:

在这里插入图片描述

注:该公式实际上是相似度和评分的加权平均数在这里插入图片描述表示用户u对项目i预测评分,n是最近邻集合v任意一个近邻居, 表示近邻v目标用户u的相似度乘以最近邻v对项目i的评分。得到预测评分后按照评分高低进行降序推荐。

4 系统实现

4.1 开发环境

4.2 系统功能描述

系统代码目录
在这里插入图片描述

项目功能

性化推荐功能

游客采用热点推荐(根据电影总评分降序推荐),

登录用户,首先根据用户评分记录使用基于用户的协同过滤推荐算法推荐电影,如果没有推荐结果采用热点推荐(根据电影总评分降序推荐)

算法的实现使用python常规函数严格按照算法步骤实现。

举例:

用户A:对电影1,2,3进行评分
用户B:对电影1,2进行评分
用户C:对电影1进行评分
那么:
用户B,C 不会对用户A进行推荐
用户A,C 不会对用户B进行推荐
用户A,B 会对用户C进行推荐电影2

4.3 系统数据流

电影在线推荐系统主要由用户端管理员端组成。用户端主要负责用户注册登录、信息维护搜索电影、查看电影、电影评分、个性化推荐等,管理员负责管理员登录、信息维护、用户管理、电影类型管理、电影管理、评分管理等。

4.3.1 用户端数据流

用户端基本流程共有四个步骤

具体如下图所示:

在这里插入图片描述

4.3.2 管理员数据流

管理员端的基本流程共有三个步骤:

1、管理员输入正确的登录凭证进入系统,若登录凭证不正确,系统会自动返回到登录页面提示管理员重新输入登录信息,直到管理员成功登录进入系统。
2、管理员成功进入系统后,首页显示用户数量、电影类型数量、电影数量、评分数量等数据统计信息。
3、管理员具有用户管理、电影类型管理、电影管理、评分管理等功能。

根据上述流程可得到管理员端的数据流程图,具体如下图所示

在这里插入图片描述

4.4 系统功能设计

电影在线推荐系统主要由用户端、管理员端模块组成,各个模块下边又有许多小模块组成,每个模块的作用各不相同,但彼此之间存在一定关系通过分析上述模块之间的联系以及系统需求,可得到该系统的功能架构,具体如图

在这里插入图片描述

5 主要页面设计

5.1 登录页面设计

用户登录页面使用DIV标签布局,Form标签提交登录名、登录密码,登录时Jquery脚本验证登录名或登录密码是否为空,如果为空,会给出提示取消登录操作登陆成功也会给出登录成功提示

在这里插入图片描述

5.2 系统首页设计

统首页使用DIV标签布局分为页面、中间页面、底页面,其中头页面是公共页面,包含网站名称搜索框、注册按钮、登录按钮用户名、注销按钮、电影类型等,中间页面是内容页面,不同的页面展示不同的内容,底页面也是公共页面,使用Django的include指令引入头和底页面

在这里插入图片描述

在这里插入图片描述

5.3 电影详情页面设计

电影详情页面使用DIV标签布局通过Django的include指令引入头页面和底页面,内容展示电影封面、电影名称、电影类型、电影简介和五角星评分按钮。如果当前登录用户没有对该电影进行评分,那么评分五角星颜色灰色,如果有用户评分,那么根据评分多少显示具体个数的黄色五角星,五角星评分功能使用Jqueryraty脚本组件

在这里插入图片描述

5.4 代码实现

5.4.1 Django配置

Django是一个开放源代码的Web应用框架,由Python写成。采用了MTV的框架模式,即模型M,视图V和模版T。通过Pycharm工具可以轻松创建Django框架项目,初始项目中主要包含settings.py配置文件urls.py路由配置文件manage.py项目启动配置文件等。settings.py配置文件配置项目自定义应用程序数据库链接视图路径静态资源路径日志等;urls.py路由配置文件主要是配置请求路由、项目名称等。

# 在setting.py定义全局变量,该变量变量名需要全部大写,否则会引用不到
import os
# import rpvpext.webutil
from pathlib import Path

# 项目根目录例如:F:pycharmworkspaceWebMovieCFRSPython
BASE_DIR = Path(__file__).resolve().parent.parent

# setting中的加密盐,该配置是django安全配置,防止攻击用的,该值是startProject时用系统的某个算法产生
SECRET_KEY = 'django-insecure-9nvr8lf^amyc)9y)wgcm&2th*%j=2l-s4@_(%#z^%l1z4neyd$'

# 调试模式是否开启
DEBUG = True

# 访问web服务的的Ip配置,用于配置能够访问当前站点域名(IP地址),
# 当 DEBUG = False 时,必须填写,有以下三种使用方法
# [],空列表,表示只有127.0.0.1,localhost访问本项目;
# ['*'],表示任何网络地址都能访问当前项目;
# ['192.168.1.3', '192.168.3.3'] 表示只有当前两个主机访问当前项目。
ALLOWED_HOSTS = ['*']

# app应用的安装配
INSTALLED_APPS = [
    'django.contrib.admin',
    'django.contrib.auth',
    'django.contrib.contenttypes',
    'django.contrib.sessions',
    'django.contrib.messages',
    'django.contrib.staticfiles',
    'apps.index.apps.AppsConfig',  # 自定义app,前台首页
    'apps.user.apps.AppsConfig',  # 自定义app,用户
    'apps.type.apps.AppsConfig',  # 自定义app,电影类型
    'apps.item.apps.AppsConfig',  # 自定义app,电影
    'apps.scorerecord.apps.AppsConfig',  # 自定义app,评分记录
    'apps.common.apps.AppsConfig'  # 自定义app,公共
]

# django中间件配置,即MIDDLEWARE设置,
# 所谓中间件就是从用户请求到用户请求结束期间所做的操作
# 即用户的请求会次从上到下依次执行MIDDLEWARE中的配置,
# 然后服务器响应用户的时候会再次从下至上依次执行,
# 在request请求前后,和response响应前后执行
MIDDLEWARE = [
    'django.middleware.security.SecurityMiddleware',  # 安全中间件
    'django.contrib.sessions.middleware.SessionMiddleware',  # 会话中间件启用会话框架
    'django.middleware.common.CommonMiddleware',  # 通用中间件
    # CSRF防御中间件,增加防御保护以防止跨站伪造请攻击。通过向表单Post请求添加隐藏表单字段以及对请求进行检查获取正确的值。
    'django.middleware.csrf.CsrfViewMiddleware',
    # admin用户认证中间件,在每个HttpRequest请求对象添加user属性表名当前已登录的用户
    'django.contrib.auth.middleware.AuthenticationMiddleware',
    # 消息中间件,提供Django的cookie以及session框架的支持,这两个基于消息中间件实现。
    'django.contrib.messages.middleware.MessageMiddleware',
    # X框架操作中间件,通过头部信息中增加X-Frame-OptionsLAI 防止简单点击劫持。
    'django.middleware.clickjacking.XFrameOptionsMiddleware',
    # 前台登录权限验证中间件,自定义
    'apps.common.loginMiddleware.LoginMiddleware',
]

# 指定根级url的配置
ROOT_URLCONF = 'MovieRecommendSystemPython.urls'

# 它用于指定模板的配置信息,列表中每一元素都是一个字典如下所示是 Django 默认自带模板引擎
# 全局上下文处理器提供的变量优先级高于单个视图函数给单个模板传递变量
# 这意味着全局上下文处理器提供的变量可能覆盖你视图函数中自定义本地变量,
# 因此请注意避免本地变量名全局上下文处理器提供的变量名重复
# 这些变量名包括perms, userdebug等等。
TEMPLATES = [
    {
        'BACKEND': 'django.template.backends.django.DjangoTemplates',  # 默认使用的模板引擎
        'DIRS': [os.path.join(BASE_DIR, 'templates')],  # 模板路径
        'APP_DIRS': True,  # 引擎是否在已安装应用程序(的目录)内查找模板源文件
        'OPTIONS': {  # 传递给模板引擎的其他参数
            'context_processors': [  # 上下文处理器,也可以定义,这样就可以在模板中直接使用debugrequest、authmessage变量
                # 在模板里面可以直接使用settings的DEBUG参数以及强大的sql_queries:它本身是一个字典,
                # 其中包括当前页面执行SQL查询所需的时间
                'django.template.context_processors.debug',
                # 在模板中可以直接使用request对象
                'django.template.context_processors.request',
                # 在模板里面可以直接使用userperms对象
                'django.contrib.auth.context_processors.auth',
                # 在模板里面可以直接使用message对象
                'django.contrib.messages.context_processors.messages',
                # 也可以继续添加
                # "django.template.context_processors.i18n",  # 在模板里面可以直接使用settings的LANGUAGES和LANGUAGE_CODE
                # 'django.template.context_processors.media',  # 可以在模板里面使用settings的MEDIA_URL参数
                # 'django.template.loaders.filesystem.Loader',
                # 'django.template.loaders.app_directories.Loader',
            ],
        },
    },
]

# 项目部署时,Django的内置服务器将使用的WSGI应用程序对象完整Python路径
WSGI_APPLICATION = 'MovieRecommendSystemPython.wsgi.application'

# 数据库链接配置,也可以以配置文件的形式加载数据库信息,django目前支持sqlitemysqlpostgreSQL、oracle数据库
# sqlite数据库:'django.db.backends.sqlite3',
# postgreSQL数据库:'django.db.backends.postgresql_psycopg2',
# mysql数据库:'django.db.backends.mysql'
# oracle数据库:'django.db.backends.oracle'
DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.mysql',
        'NAME': 'movierecommendsystempython',
        'USER': 'root',
        'PASSWORD': 'root',
        'HOST': '127.0.0.1',
        'PORT': '3306',
    }
}

# 这是一个支持插拔的密码验证器,且可以一次性配置多个
# Django 通过这些内置组件来避免用户设置的密码等级不足的问题
AUTH_PASSWORD_VALIDATORS = [
    {   # 检查密码和用户某些属性的相似性
        'NAME': 'django.contrib.auth.password_validation.UserAttributeSimilarityValidator',
    },
    {   # 检查密码的最小长度(默认8)
        'NAME': 'django.contrib.auth.password_validation.MinimumLengthValidator',
    },
    {   # 检查密码是否出现常用密码表中
        'NAME': 'django.contrib.auth.password_validation.CommonPasswordValidator',
    },
    {   # 检查密码是否全为数字
        'NAME': 'django.contrib.auth.password_validation.NumericPasswordValidator',
    },
]

# 设置语言zh-hans,zh-cn,en-us
LANGUAGE_CODE = 'zh-hans'
# 设置时区Asia/Shanghai,UTC
TIME_ZONE = 'Asia/Shanghai'
# 设置国际化,根据个人需要进行设置:
USE_I18N = True
# 相同内容被不同时区地区的用户访问时,是否以不同格式内容展示(例如时间日期数字)
USE_L10N = True
# 设置保存数据库时间类型是否为UTC时间,如果不需要请设置为false,默认为true
USE_TZ = True

# 它指的是静态资源存放位置静态资源包括 CSS、JS、Images比如我们要在项目中添加一静态图片
# 通常这些静态图片存放新建static 目录下,这样就实现了通过 STATIC_URL= '/static/' 路径静态资源的访问。
STATIC_URL = '/static/'

# 静态文件的路径
STATICFILES_DIRS = [
    os.path.join(BASE_DIR,'static')
]

# 设置图片上传路径
MEDIA_ROOT = os.path.join(BASE_DIR, "media/")
# 图片统一路由
MEDIA_URL = "/media/"

# 日志
LOGGING = {
    'version': 1,
    'disable_existing_loggers': False,
    'handlers': {
        'console':{
            'level':'DEBUG',
            'class':'logging.StreamHandler',
        },
    },
    'loggers': {
        'django.db.backends': {
            'handlers': ['console'],
            'propagate': True,
            'level':'DEBUG',
        },
    }
}

5.5 模板配置

模板是html文件,默认路径是项目根路径的templates文件夹中。Django模板中主要有两种特殊符号:{{ }}和 {% %},{{ }}表示变量可直接获取request、sessionapplication中的变量,在模板渲染时候替换成值,{% %}表示逻辑相关操作,可直接编写python代码。图5.5是前台index.html部分配置。

在这里插入图片描述

5.6 用户登录功能实现

用户在登录页面登录失败提示登录失败原因,用户登录成功会提示正在跳转页面。用户登录实现代码具体如图

在这里插入图片描述

5.7 图片上传功能实现

本系统图片上传功能使用Django后台框架的Model组件实现,在model文件直接声明实体类属性类型是图片类型。图片上传功能代码具体如图

在这里插入图片描述

5.8 个性化推荐功能实现

基于用户的协同过滤推荐算法实现可分为三个步骤:首先将用户电影评分数构建成用户-电影评分矩阵然后通过皮尔森相似度算法计算用户之间的相似度,再从中选出与目标用户相似度最高的TopN个最近邻用户,然后计算TopN个近邻用户的相似度与电影的加权平均数最后得到K个推荐的电影。

在这里插入图片描述

在这里插入图片描述

5 最后

项目运行效果:

毕业设计 协同过滤的电影推荐系统

项目获取

https://gitee.com/sinonfin/algorithm-sharing

原文地址:https://blog.csdn.net/m0_12378/article/details/131355903

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_40276.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注