当前位置: 首页 > news >正文

springboot集成mahout实现简单基于协同过滤算法的文章推荐算法

文章目录

  • 前言
  • 1.建表并且生成一些数据
    • 首先,建立一个用户文章操作表(user_article_operation)
    • 使用case when语句简单分析数据
  • 2. 代码与测试
      • 只需要根据表生成相应实体类(注意要加一个value属性来存储分数)
      • 主要代码如下,其实就两个方法
      • userArticleOperationMapper.getAllUserPreference()方法收集数据mapper文件如下
      • 测试算法
  • 3.核心代码
  • 4.相关参考


前言

我这里只是简单的跑了一下,仅供参考。。
这边只是跑了个文章推荐的demo,不过什么电影,商品啥的都一样,没啥区别

温馨提醒
这个mahout包有毒。。。。很多依赖冲突。。。。
这是我的pom文件,仅仅供参考。。

   <dependencies><dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-boot-starter</artifactId><version>3.5.3</version></dependency><dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-generator</artifactId><version>3.5.3</version></dependency><dependency><groupId>org.freemarker</groupId><artifactId>freemarker</artifactId><version>2.3.30</version><scope>test</scope></dependency><dependency><groupId>com.alibaba</groupId><artifactId>druid</artifactId><version>1.1.21</version></dependency><!--引入推荐引擎mahout,注意要先全部引入,再使用exclusion标签--><dependency><groupId>org.apache.mahout</groupId><artifactId>mahout-mr</artifactId><version>0.12.2</version><exclusions><exclusion><groupId>javax.servlet</groupId><artifactId>servlet-api</artifactId></exclusion><exclusion><groupId>org.slf4j</groupId><artifactId>slf4j-api</artifactId></exclusion><exclusion><groupId>org.slf4j</groupId><artifactId>slf4j-jcl</artifactId></exclusion><exclusion><groupId>org.apache.lucene</groupId><artifactId>lucene-core</artifactId></exclusion><exclusion><groupId>org.apache.lucene</groupId><artifactId>lucene-analyzers-common</artifactId></exclusion><exclusion><groupId>log4j</groupId><artifactId>log4j</artifactId></exclusion><exclusion><groupId>org.slf4j</groupId><artifactId>slf4j-log4j12</artifactId></exclusion><exclusion><artifactId>jersey-client</artifactId><groupId>com.sun.jersey</groupId></exclusion><exclusion><artifactId>jersey-core</artifactId><groupId>com.sun.jersey</groupId></exclusion><exclusion><artifactId>jersey-apache-client4</artifactId><groupId>com.sun.jersey.contribs</groupId></exclusion></exclusions></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><dependency><groupId>mysql</groupId><artifactId>mysql-connector-java</artifactId><version>8.0.21</version></dependency><dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId><optional>true</optional></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-test</artifactId><scope>test</scope></dependency></dependencies>

1.建表并且生成一些数据

首先,建立一个用户文章操作表(user_article_operation)

在这里插入图片描述
然后生成一些数据,这里使用navicat生成了50条记录(因为只是测试一下算法的准确性因此只生成了3个用户,10篇文章)
在这里插入图片描述

使用case when语句简单分析数据

        SELECTuser_id,article_id,SUM(CASE operation_typeWHEN 0 THEN 3WHEN 1 THEN 3WHEN 2 THEN 5else 0 END) AS "value"FROMuser_article_operationGROUP BY user_id,article_idORDER BY user_id

执行语句如下
在这里插入图片描述

可以看出
1号用户最喜欢6,9号文章,
2号用户最喜欢4,5,6号文章
3号用户最喜欢4,5,6号文章
发现1,2,3号用户都喜欢6号文章,3个用户具有一定相似性。
(别问为啥这么规律,问就是我为了好测试修改了下数据,如果你感觉哪里不对劲的话,那你说的都对(反正我搞这个算法只是用来糊弄老师的😂😂😂))
因此如果要给1号用户推荐文章的话,应该先推荐5号,再推荐4号文章。

2. 代码与测试

只需要根据表生成相应实体类(注意要加一个value属性来存储分数)

在这里插入图片描述

主要代码如下,其实就两个方法

![在这里插入图片描述](https://img-blog.csdnimg.cn/e70aea3c224f4c13b17de84f476016e6.png

userArticleOperationMapper.getAllUserPreference()方法收集数据mapper文件如下

在这里插入图片描述

测试算法

输入推荐5个,但是这里只推荐了四个,应该是样本数据量太小的原因,对比了一下之前运行case when语句时做的的简单预测,5号最推荐,然后是4号,控制台打印的结果还是比较符合的。
(反正糊弄一下老师够了,这里只是提供一个小demo,读者需注意哈🚗🚗🚗🚗)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.核心代码

public List<Long> recommend( Integer userId) throws TasteException {List<UserArticleOperation> userList = userArticleOperationMapper.getAllUserPreference();//创建数据模型DataModel dataModel = this.createDataModel(userList);//获取用户相似程度UserSimilarity similarity = new UncenteredCosineSimilarity(dataModel);//获取用户邻居UserNeighborhood userNeighborhood = new NearestNUserNeighborhood(2, similarity, dataModel);//构建推荐器Recommender recommender = new GenericUserBasedRecommender(dataModel, userNeighborhood, similarity);//推荐2个List<RecommendedItem> recommendedItems = recommender.recommend(userId, 5);List<Long> itemIds = recommendedItems.stream().map(RecommendedItem::getItemID).collect(Collectors.toList());return itemIds;}private DataModel createDataModel(List<UserArticleOperation> userArticleOperations) {FastByIDMap<PreferenceArray> fastByIdMap = new FastByIDMap<>();Map<Integer, List<UserArticleOperation>> map = userArticleOperations.stream().collect(Collectors.groupingBy(UserArticleOperation::getUserId));Collection<List<UserArticleOperation>> list = map.values();for(List<UserArticleOperation> userPreferences : list){GenericPreference[] array = new GenericPreference[userPreferences.size()];for(int i = 0; i < userPreferences.size(); i++){UserArticleOperation userPreference = userPreferences.get(i);GenericPreference item = new GenericPreference(userPreference.getUserId(), userPreference.getArticleId(), userPreference.getValue());array[i] = item;}fastByIdMap.put(array[0].getUserID(), new GenericUserPreferenceArray(Arrays.asList(array)));}return new GenericDataModel(fastByIdMap);}
    <select id="getAllUserPreference" resultType="UserArticleOperation">SELECTuser_id,article_id,SUM(CASE operation_typeWHEN 0 THEN 2WHEN 1 THEN 3WHEN 2 THEN 5else 0 END) AS "value"FROMuser_article_operationGROUP BY user_id,article_id</select>

4.相关参考

1.spring boot项目基于mahout推荐算法实现商品推荐
2.相关内容在章节5-9

http://www.lryc.cn/news/39066.html

相关文章:

  • 自动驾驶介绍系列 ———— 看门狗
  • 今天打开个税APP,我直接人麻了!
  • javascript进阶学习笔记(含AJAX)
  • 今年没有金三银四
  • NFS - Network FileSystem网络文件系统的实现原理
  • C#【汇总篇】语法糖汇总
  • 高完整性系统工程(一): Safety Engineering, HAZOP Fault Tree Analysis
  • VGG16分类模型的网页界面(Flask,keras)
  • 互联网摸鱼日报(2023-03-12)
  • SpringBoot异常处理?用这两个就够啦!
  • mysql-查询重复数据的条数-count
  • 【Java枚举类】使用enum关键词定义枚举类
  • 第十四届蓝桥杯三月真题刷题训练——第 8 天
  • 鼎阳SDS2074X Plus免费“升级”(破解)备忘录
  • 【C++】C++标准模板库STL (一) string类的使用详解
  • 如何用SpringBoot+Thymeleaf+Echart生成好看的柱状图,折线图,饼状图
  • LeetCode819. 最常见的单词(python)
  • 【深入理解C指针】经典笔试题——指针和数组
  • 雷达散射截面
  • 希腊棺材之谜——复盘
  • CentOS的下载和安装
  • new bing的chatGPT如何解析英文论文pdf
  • 学会这12个Python装饰器,让你的代码更上一层楼
  • 企业使用ERP的好处
  • 【QT】如何获取屏幕(桌面)的大小或分辨率
  • ETL工具的选择
  • SpringBoot仿天猫商城java web购物网站的设计与实现
  • C#基础教程22 文件的输入与输出
  • Ubuntu18.04 python 开发usb通信
  • RabbitMq 消息确认机制详解 SpringCloud