方案定下来了。
接下来一个月,团队投入个性化排序的开发。
技术上比分布式索引更复杂,需要建立用户行为模型,需要实时计算偏好,还要保证不影响搜索速度。
但团队热情很高。
这是前沿技术,国内外都还没成熟产品。
如果能做成,百度将在技术上领先一大步。
开发过程中,贾瀞雯每周和陈浩通话汇报进展。
“匿名化处理做得怎么样?”陈浩在电话里问。
“技术团队设计了双重加密方案。”贾瀞雯说,“用户行为数据先脱敏,再加密。
存储服务器和业务服务器物理隔离,访问需要多重授权。”
“用户教育呢?”
“我们做了详细的帮助页面,解释个性化功能是什么,需要什么数据,用户有什么权利。
还做了示意图,很直观。”
“好。”陈浩说,“记住,透明是关键。
用户不怕你收集数据,怕的是你偷偷收集。”
一个月后,个性化排序功能进入内测。
选了五千名用户参与,都是自愿报名的。
陈浩也加入了内测名单。
贾瀞雯给他开了个测试账号。
内测开始一周后,陈浩打来电话。
“功能我试了。”他说,“确实更相关了。
我搜了几次电影,再搜‘导演’,结果里电影导演的内容就排前面。”
“有什么问题吗?”贾瀞雯问。
“有。”陈浩顿了顿,“推荐太狭窄了。
比如我搜了几次武侠片,结果后来搜‘电影’,出来的全是武侠片。
可我可能也想看看其他类型,只是还没搜过。”
贾瀞雯记下来:“你是说,个性化过度了?”
“对。”陈浩说,“算法太依赖历史行为了,会把用户限制在已有的兴趣里。
但人是有探索欲的,有时候想看看新东西。
所以我们需要一个平衡——既要基于已知兴趣推荐,也要偶尔推荐未知但可能感兴趣的内容。”
“技术上怎么做?”
“可以加一个‘探索性推荐’模块。”陈浩说,“比如用户搜‘电影’,大部分结果按他的历史偏好排序,但可以插一两条其他类型的优质内容。
或者定期给用户推送‘猜你可能还喜欢’的推荐,这些推荐不完全基于历史,而是基于相似用户的行为。”
贾瀞雯飞快地记着。
陈浩的想法总是很超前。
“这个模块要控制比例。”陈浩继续说,“探索性推荐不能太多,否则就失去了个性化的意义。
但也不能没有,否则用户会困在信息茧房里。”
电话打了四十分钟。
贾瀞雯记了满满两页纸。
挂电话前,陈浩问:“你那边几点了?”
贾瀞雯看了眼表:“十一点半。”
“又加班?”
“嗯,在看内测报告。”
“早点休息。”陈浩说,“功能可以慢慢优化,身体不能熬。”
“知道了。”
挂了电话,贾瀞雯翻开笔记本,看着刚才记的内容。
陈浩的字里行间,透着对产品的深刻理解,也透着对她的关心。
她忽然想起刚才通话时,自己记笔记时嘴角不自觉上扬的样子。
那种感觉……像学生时代,听喜欢的老师讲课,既学到东西,又心里甜甜的。
她摇摇头,赶走这些杂念。
继续看内测报告。
但看着看着,她又笑了。
分布式索引让搜索更快,个性化排序让搜索更聪明。
百度正在进入一个新的技术阶段。
而带领他们进入这个阶段的,是远在横店的陈浩,和坐在这里的她。
一个看方向,一个带路。
这个组合,真的像王工走时说的——最可怕,也最珍贵。
她合上笔记本,关掉电脑。
今晚不加班了,听陈浩的,早点休息。
走出办公室时,她看了眼窗外的北京。
灯火璀璨,车流不息。
这座城市的某个角落,也许正有人用百度搜索着什么。
他们不知道背后的技术有多复杂,不知道有一群人在为他们能更快更准地找到信息而熬夜。
但他们能感觉到——好用。
这就够了。
贾瀞雯锁上门,走进电梯。
电梯下行时,她想:明天要和技术团队讨论“探索性推荐”的实现了。
又要开始新的攻关了。
但她不觉得累。
反而觉得,很有意思。
因为这不仅仅是一份工作。
这是在创造未来。
电梯门打开,她走出去,脚步轻快。
【跪求礼物,免费的为爱发电也行!】