无编码利用协同算法实现个性化推荐

  • 时间:
  • 浏览:4
  • 来源:5分3D_5分排列5

,我在配置文件里模拟了或多或少数据,假设是或多或少URL,大体如下,表示itemId 为2的文章被userId=1的用户访问了。

参看

根据昨天的URL上报数据生成ALS模型。就让将模型加载到流式计算中,对实时URL的访问用户进行内容推荐。整个流程只前要你写写SQL(做解析),弄弄配置就背熟。

而对于数据的预测,大家大家大家 仅仅是把它看做另一个多数据Transformer,根据进来的数据,新生成另一个多prediction字段。

接着大家大家大家 要给指定的用户进行推荐。参看 als-predict。

否则你输入到任何你感兴趣的系统中,StreamingPro目前支持ES,Parquet等Spark就让支持的格式作为输出。

首先大家大家大家 拷贝一份配置文件  

大家大家大家 讲顶端的运行脚本里的配置文件路径调整下,就还前要运行起来,看得人运行结果,比如我这里的结果是:

即可支持流式。运行脚本如下:

第二组参数则是对应算法的或多或少配置参数。否则你配置多组,算法自动回选泽最优的一组参数得到模型,否则保存到对应的path路径下。

最后通过组件AlgorithmOutputCompositor 完成模型训练。

,将所有的包名前缀从

就让的SQL而是 抽取出userid 和itemId,否则得到另一个多暗含label, features 的表。在StreamingPro中,所有的的算法的输入总要遵循一种规范。对于ALS算法而言,label 表示userId, features则是userId,ItemId,rating 另一个多按逗号拼接的字符串。对于回归类算法,则是逗号拼接的数字。

否则你直接运行得到结果:

path表示输出路径。 algorithm 表示算法。目前只支持 als,lr(线性回归),lr2(逻辑回归)一种算法。后续会不断加上。

无论是模型训练还是预测,前要基于SQL流来完成的,完美的融入到了数据的流程当中。

path 是模型文件所在的位置。recommendUsersForProductsNum 表示对每个用户推荐有几块内容。outputTableName是输出的表, 方便后续继续操作,比如存储到Redis就让数据库中,方便前端应用线程做调用。

解溶解用户的逻辑是和顶端的是一样的。顶端的核心模块是:

在StreamingPro中,另一个多算法的模型训练,仅仅被看做另一个多特殊的存储。大家大家大家 完全还前要将对应的AlgothrimOutputCompositor加上 或多或少的输出源。