返回

第1822章 你是说,个性化过度了?

首页
关灯
护眼
字:
上一章 回目录 下一页 进书架
最新网址:wap.qiqixs.info
    方案定下来了。

    接下来一个月,团队投入个性化排序的开发。

    技术上比分布式索引更复杂,需要建立用户行为模型,需要实时计算偏好,还要保证不影响搜索速度。

    但团队热情很高。

    这是前沿技术,国内外都还没成熟产品。

    如果能做成,百度将在技术上领先一大步。

    开发过程中,贾瀞雯每周和陈浩通话汇报进展。

    “匿名化处理做得怎么样?”陈浩在电话里问。

    “技术团队设计了双重加密方案。”贾瀞雯说,“用户行为数据先脱敏,再加密。

    存储服务器和业务服务器物理隔离,访问需要多重授权。”

    “用户教育呢?”

    “我们做了详细的帮助页面,解释个性化功能是什么,需要什么数据,用户有什么权利。

    还做了示意图,很直观。”

    “好。”陈浩说,“记住,透明是关键。

    用户不怕你收集数据,怕的是你偷偷收集。”

    一个月后,个性化排序功能进入内测。

    选了五千名用户参与,都是自愿报名的。

    陈浩也加入了内测名单。

    贾瀞雯给他开了个测试账号。

    内测开始一周后,陈浩打来电话。

    “功能我试了。”他说,“确实更相关了。

    我搜了几次电影,再搜‘导演’,结果里电影导演的内容就排前面。”

    “有什么问题吗?”贾瀞雯问。

    “有。”陈浩顿了顿,“推荐太狭窄了。

    比如我搜了几次武侠片,结果后来搜‘电影’,出来的全是武侠片。

    可我可能也想看看其他类型,只是还没搜过。”

    贾瀞雯记下来:“你是说,个性化过度了?”

    “对。”陈浩说,“算法太依赖历史行为了,会把用户限制在已有的兴趣里。

    但人是有探索欲的,有时候想看看新东西。

    所以我们需要一个平衡——既要基于已知兴趣推荐,也要偶尔推荐未知但可能感兴趣的内容。”

    “技术上怎么做?”

    “可以加一个‘探索性推荐’模块。”陈浩说,“比如用户搜‘电影’,大部分结果按他的历史偏好排序,但可以插一两条其他类型的优质内容。

    或者定期给用户推送‘猜你可能还喜欢’的推荐,这些推荐不完全基于历史,而是基于相似用户的行为。”

    

    (本章未完,请点击下一页继续阅读)
最新网址:wap.qiqixs.info
上一章 回目录 下一页 存书签