#633 【“我为开源打榜狂” 第5期】OpenBandit 数据集上传

Closed
created 1 year ago by ZhangbuDong · 2 comments
数据集地址:https://openi.pcl.ac.cn/ZhangbuDong/Bandit/datasets
ZhangbuDong commented 1 year ago
Poster
# Bandit数据集 Open Bandit Dataset 是公开的真实世界记录的老虎机反馈数据。该数据集由日本最大的时尚电子商务公司 ZOZO, Inc. 提供,市值超过 50 亿美元(截至 2020 年 5 月)。该公司使用多臂老虎机算法在名为 ZOZOTOWN 的大型时尚电子商务平台上向用户推荐时尚单品。 官方网址:https://research.zozo.com/data.html paperwithcode:https://paperswithcode.com/dataset/obp GitHub:https://github.com/st-tech/zr-obp Open Bandit Dataset 是公开的真实世界记录的老虎机反馈数据。该数据集由日本最大的时尚电子商务公司 ZOZO, Inc. 提供,市值超过 50 亿美元(截至 2020 年 5 月)。该公司使用多臂老虎机算法在名为 ZOZOTOWN 的大型时尚电子商务平台上向用户推荐时尚单品。 ## 数据集介绍 Open Bandit Dataset 是在一个大型时尚电商平台中对两个多臂老虎机策略的 A/B 测试构建的, 佐佐敦. 它目前总共由 2600 万行组成,每一行都代表具有一些特征值的用户印象、所选项目作为操作、真实倾向得分和点击指标作为结果。这尤其适用于评估离策略评估(OPE),它尝试使用由不同算法生成的数据来估计假设算法的反事实性能。 ## 字段 以下是这些字段的详细说明(它们在 CSV 文件中以逗号分隔):{behavior_policy}/{campaign}.csv(behavior_policy in (bts, random), campaign in (all, men, women)) - timestamp:展示的时间戳。 - item_id:作为武器的物品索引(索引范围在“所有”活动中为 0-80,“男性”活动为 0-33,“女性”活动为 0-46)。 - position:被推荐的item的位置(1、2、3分别对应ZOZOTOWN推荐界面的左、中、右位置)。 - click: 目标变量,指示一个项目是否被点击 (1) 或没有 (0)。 - propensity_score:在每个位置推荐项目的概率。 - user feature 0-4:与用户相关的特征值。 - user-item affinity 0-:由每个用户-项目对之间观察到的过去点击次数得出的用户-项目亲和度分数。 ## 论文与引用 论文:Yuta Saito, Shunsuke Aihara, Megumi Matsutani, Yusuke Narita. Large-scale Open Dataset, Pipeline, and Benchmark for Bandit Algorithms https://arxiv.org/abs/2008.07146 ``` 使用此数据集时,请引用以下bibtex的论文: @article{saito2020large, title={Large-scale Open Dataset, Pipeline, and Benchmark for Bandit Algorithms}, author={Saito, Yuta, Shunsuke Aihara, Megumi Matsutani, Yusuke Narita}, journal={arXiv preprint arXiv:2008.07146}, year={2020} } ```
lip01 commented 1 year ago
Collaborator
上传文件与描述不符
lip01 closed this issue 1 year ago
Sign in to join this conversation.
No Milestone
No Assignees
2 Participants
Notifications
Due Date

No due date set.

Dependencies

This issue currently doesn't have any dependencies.

Loading…
There is no content yet.