早在前几篇务虚的文章中,我们就聊过了推荐系统中的经典问题,其中有一类就是评分预测。

让我摸着自己的良心说,评分预测问题只是很典型,其实并不大众,毕竟在实际的应用中,评分数据很难收集到,属于典型的精英问题;与之相对的另一类问题行为预测,才是平民级推荐问题,处处可见。

阅读全文 »

不管你有没有剁过手,你对“看了这个商品的还看了”这样的推荐形式一定不陌生。无论是猫还是狗,或者是其他电商网站,这样的推荐产品可以说是推荐系统的标配了。类似的还有,如点评标记类网站的“喜欢了这部电影的还喜欢了”,社交媒体网站的“关注了这个人还关注了”,这些都只是文案类似,动词不同而已。这样的推荐形式背后都是来自一个古老的推荐算法,叫做基于物品的协同过滤,通常也被叫作 Item-Based,因为后者更容易搜索到相关的文章,所以被更多地提及。

如果做推荐系统不知道“基于物品的协同过滤”,那等同于做程序员不懂得冒泡排序。这个朴素的算法,就像是乔峰大战聚贤庄所用的“太祖长拳”一样,简单直接有效,读过高中就懂,用得好也能够战倒绝大多数的武林豪杰。本文就来聊聊这个朴素的算法。

阅读全文 »

要说提到推荐系统中,什么算法最名满天下,我想一定是协同过滤。在很多场合,甚至有人把协同过滤和推荐系统划等号,可见二者的关系多么紧密。协同过滤的重点在于“协同”,所谓协同,也就是群体互帮互助,互相支持是集体智慧的体现,协同过滤也是这般简单直接,历久弥新。

阅读全文 »

在做推荐系统时,老板或者产品经理经常会问这样一个问题:我们的推荐系统标签够不够?

这其实是一个很大的误区:基于内容的推荐系统,标签只是很小一部分。而且就算是标签,衡量质量的方式也不是数目够不够;所以,本文要讲的内容,就是说一说脱离标签定式思维的内容推荐。

阅读全文 »

前面,我们聊过了不要把用户画像当成银弹,也不要觉得一无是处。对于一个早期的推荐系统来说,基于内容推荐离不开为用户构建一个初级的画像,这种初级的画像一般叫做用户画像(User Profile),一些大厂内部还习惯叫做 UP,今天我们就来讲一讲从大量文本数据中挖掘用户画像常常用到的一些算法。

阅读全文 »

做好一个推荐系统,总共分三步:

  1. 认识每一个用户
  2. 给他推荐他感兴趣的东西
  3. 坐等各项指标上升

开个玩笑,如果这么简单的话,那么你和我都要失业了;但是话说回来,认识用户是必须的,不过不用担心,认识用户不用请他们吃饭,这就是我们常常听说的“用户画像”这个词。今天,我们就来聊一聊:用户画像的那些事儿。

用户画像比较抽象,就像每个人都听说过鬼,但很少有人见过。事实上,它也没有那么神秘,只是大家对它有误解,要么觉得没什么用,要么觉得它是“银弹”,可能相信后者的人略多一些,但实际上这两种看法都不准确。

阅读全文 »

推荐系统发展到了今天,已经出现了一些常见的问题,一部分已经有很好的解决方案,另外一部分却还没有通用解决方案,需要根据实际情况做一下具体的分析。

今天我们来聊一聊这些问题。本文首先会讲一些推荐系统中的问题模式,然后再专门说一些需要面对的具体问题。

阅读全文 »

个性化推荐的历史和我们国家的改革开放历史差不多,已经有些年头了。它已经从一个非常小众的方向,演变成了今天互联网产品的常见“配件”。

再加上一些以“个性化”为品牌卖点的互联网产品的成功,也给相关从业者打了一剂“强心针”,并让更多人跃跃欲试,想给自己的产品加上个性化元素。

但是别急,在问“该怎么做”之前,先来回答一下“要不要做”,毕竟谁都不想去实现一个无脑 PM 拍脑袋给出的需求不是?我们先来更加透彻地理解“推荐系统”这个概念,只有彻底理解了事物的本质,才能轻松做出“适不适合”的判断,毕竟知根知底再相爱更容易到白头。

阅读全文 »