当前位置: 首页 > news >正文

【基于机器学习的推荐系统项目实战-2】项目介绍与技术选型

本节目录

  • 一、项目介绍
    • 1.1 采用的数据源
    • 1.2 Concrec架构技术选型
    • 1.3 Sprak介绍
    • 1.4 Flink
    • 1.5 TensorFlow

一、项目介绍

1.1 采用的数据源

Kaggle Anime Recommendations Dataset。
其中的动漫数据源自myanimelist.net。

在这里插入图片描述

1.2 Concrec架构技术选型

  • 数据预处理模块:汇总各方数据源+可视化检视数据+对数据进行清晰和转换(分类属性encode,数值属性进行缩放)
  • 召回模块:根据多种策略对候选集进行初步召回。
  • 排序模块:针对优化目标进行精准的排序,实现特定规则的重排序(类目打散,提升新颖性。)
  • 接口服务模块:组装排序后的结果,提供给前端。
  • 编程语言:Python。
  • 微服务框架:Flask。
  • 前端框架:Vue。
  • 数据分析:pandas。
  • 大数据处理:Spark+Flink。
  • 机器学习框架:TensorFlow。

1.3 Sprak介绍

其中Spark是分布式大数据处理平台,解决了计算能力和存储能力分布的问题。
简而言之,让计算资源去找存储资源。

不同于Hadoop,Spark基于内存计算,速度更快。
同时提供多种编程接口如SparkSQL,Mllib等。

Spark和Hadoop的主要区别在于:

  1. Spark是一个内存密集型的计算框架,而Hadoop是一个磁盘密集型的计算框架。
  2. Spark支持流式处理,而Hadoop不支持。
  3. Spark支持多种编程语言,而Hadoop只支持Java。
  4. Spark支持实时处理,而Hadoop不支持。
  5. Spark支持多种数据源,而Hadoop只支持HDFS。

1.4 Flink

Flink是一个开源的分布式流处理框架,用于处理实时数据流和批处理数据。它提供了一个高效的、可扩展的、可编程的运行时环境,可以用于处理大规模的数据流和批处理任务。Flink支持多种编程模型,包括Java、Scala和Python,可以轻松地将数据流和批处理任务组合在一起,以构建复杂的数据处理管道。Flink还提供了一系列的API,可以用于构建实时分析应用程序,以及支持多种数据源和数据格式,可以轻松地将数据从不同的源头集成到Flink中。

1.5 TensorFlow

TensorFlow是一个开源的机器学习框架,由Google开发,可以用于构建、训练和部署机器学习模型。它提供了一系列的工具,可以帮助开发者构建和训练深度学习模型,并且可以在各种硬件平台上部署模型,包括CPU、GPU和TPU。TensorFlow还提供了一个可视化工具,可以帮助开发者更好地理解和调试模型。

http://www.lryc.cn/news/25868.html

相关文章:

  • 对称锥规划:锥与对称锥
  • 4.基于Label studio的训练数据标注指南:情感分析任务观点词抽取、属性抽取
  • 算法拾遗二十五之暴力递归到动态规划五
  • Linux进程的创建结束类系统调用总结
  • Git分支的合并策略有哪些?Merge和Rebase有什么区别?关于Merge和Rebase的使用建议
  • 2022-2-23作业
  • 1.基于Label studio的训练数据标注指南:信息抽取(实体关系抽取)、文本分类等
  • “高退货率”标签引热议,亚马逊跨境电商是好是坏?
  • Pinia2
  • 服务器配置 | 在Windows本地打开服务器端Tensorboard结果
  • 13 nuxt3学习(新建页面 内置组件 assets 路由)
  • Linus命令记录(持续编辑版)
  • 玩转ThreadLocal
  • 亚马逊二审来袭,跨境电商传统验证算法真的靠谱吗?
  • 微信小程序|基于小程序+云开发制作一个租房小程序
  • 2.4 群辉驱动:多网口,系统网络只能识别两个网口 解决教程
  • Android正确使用资源res文件
  • 5分钟搭建第一个k8s集群
  • 【MySQL】查询操作(基础篇)
  • 工程管理系统+spring cloud 系统管理+java 系统设置+二次开发
  • MyBatisPlus Study Notes
  • 【Vu3 测试篇】自动化测试
  • Android system实战 — Android R(11) 第三方apk权限
  • 面试总结1
  • 【Hello Linux】程序地址空间
  • 电脑崩溃蓝屏问题如何重装系统
  • 《商用密码应用与安全性评估》第一章密码基础知识1.2密码评估基本原理
  • 【编程基础之Python】7、Python基本数据类型
  • Kakfa详解(一)
  • 图解LeetCode——剑指 Offer 12. 矩阵中的路径