您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息
免费发信息
三六零分类信息网 > 昭通分类信息网,免费分类信息发布

大数据培训机构是不会这么给你讲基于内容推荐算法的

2022/2/3 17:15:37发布107次查看
公司有个对hadoop比较感兴趣的java的实习生妹纸,昨天问我基于内容的推荐原理是什么,我简单给他讲了一下,今天也在这里介绍一下。
基于内容推荐(content based)算是最早被使用的推荐方法,它依据用户之前喜欢的产品(item),给用户推荐和他之前喜欢的产品类似的产品。
例如,一个推荐餐厅的系统可以根据用户过去喜欢较多的火锅店而给他推荐火锅店。cb最初应用于信息检索系统中,所以很多信息检索及过滤的方法都适用于cb。
(java人,java人,java人,java人,java人,java人,java人,java人,java人,java人)
cb的过程一般包括以下三步:
1) item representation:为每个item抽取出一些特征(也就是item的content了)来表示此item;
2) profile learning:利用一个用户之前喜欢(及不喜欢)的item的特征数据,来分析出此用户的喜好特征(profile);
3) recommendation generation:通过比较上一步得到的用户profile与候选item的特征,为此用户推荐一组相关性最大的item。
(java人,java人,java人,java人,java人,java人,java人,java人,java人,java人)
举例说明上面3个步骤,对于个性化阅读来说,1篇文章就是1个item。
第一步
首先要从文中提取出能够代表它们的属性。常用的方式就是利用出现在文中的词语来代表,而每个词赋予的权重依据信息检索中的tf-idf来计算。
对于这篇文章来说,词“cb”、“推荐”和“喜欢”的权重会较大,而“火锅”这个词的权重会较低。利用这种方式,就可以使用具体的一个向量来表示一篇抽象的文章了。
(hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组)
第二步
根据用户之前喜欢什么类型的文章来刻画其喜好的profile,最简单的方式就是把用户所有喜欢的文章相对的向量取平均值来作为此用户的profile。
比如,某个用户经常关注与推荐系统相关的文章,那么他的profile中“cb”、“cf”和“推荐”的权重值就会比较高。
第三步
在得到用户的profile后,cb就能够根据所有item与此用户profile的匹配度对其进行文章推荐。
一个常用的相关度计算方法是cosine。最终把候选item里与此用户最相关(cosine值最大)的n个item作为推荐返回给此用户。
(hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组)
我是如何用4个月学会的hadoop?
作为过来人,我知道学一门技术很难,所以希望能给大提供有用的知识。
我最开始买了几本比较权威的书,自己看书学但是效率很低,找不到方向和重点。后来在论坛认识了某渡的哥们,他给了我一套视频。
从0基础入门hadoop,到hadoop生态圈中各个组件的讲解,最最厉害的还是一些真实的商业案例,让我见识到了真实的生产环境,不然都不知道该学什么才适合工作。我也是跟着视频才找到的方向,到学会的hadoop。
我把视频的获取方式留在最后一张图片右下角,如果你准备学hadoop的话可以去要最新版的,我的有点老了。最好说明去意:学习视频
最后我想说,看过文章不思考、不行动知识永远不会变成自己的。
共勉。
昭通分类信息网,免费分类信息发布

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录