-
Notifications
You must be signed in to change notification settings - Fork 2
/
Copy pathseq.yaml
175 lines (129 loc) · 4.3 KB
/
seq.yaml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
## model config
#embedding_size: 32
# dataset config
# MovieLens, Amazon
field_separator: "\t" #指定数据集field的分隔符
seq_separator: " " #指定数据集中token_seq或者float_seq域里的分隔符
USER_ID_FIELD: user_id #指定用户id域
ITEM_ID_FIELD: item_id #指定物品id域
RATING_FIELD: rating #指定打分rating域
TIME_FIELD: timestamp #指定时间域
#指定从什么文件里读什么列,这里就是从ml-1m.inter里面读取user_id, item_id, rating, timestamp这四列,剩下的以此类推
load_col:
inter: [user_id, item_id, rating, timestamp]
NEG_PREFIX: neg_ #指定负采样前缀
LABEL_FIELD: label #指定标签域
ITEM_LIST_LENGTH_FIELD: item_length #指定序列长度域
LIST_SUFFIX: _list #指定序列前缀
MAX_ITEM_LIST_LENGTH: 50 #指定最大序列长度
POSITION_FIELD: position_id #指定生成的序列位置id
#max_user_inter_num: 100
min_user_inter_num: 5
#max_item_inter_num: 100
min_item_inter_num: 5
#lowest_val:
# timestamp: 1546264800
#highest_val:
# timestamp: 1577714400
# training settings
epochs: 1000 #训练的最大轮数
train_batch_size: 256 #训练的batch_size
learner: adam #使用的pytorch内置优化器
learning_rate: 0.001 #学习率
training_neg_sample_num: 0 #负采样数目
eval_step: 1 #每次训练后做evalaution的次数
stopping_step: 20 #控制训练收敛的步骤数,在该步骤数内若选取的评测标准没有什么变化,就可以提前停止了
# evalution settings
eval_setting: TO_LS,full #对数据按时间排序,设置留一法划分数据集,并使用全排序
metrics: ["Recall", "MRR","NDCG","Precision"] #评测标准
valid_metric: MRR@10 #选取哪个评测标准作为作为提前停止训练的标准
eval_batch_size: 256 #评测的batch_size
weight_decay: 0
topk: [5, 10, 20, 50]
# directory setting
log_root: "./log/"
data_path: "./dataset/"
lmd: 0.1
lmd_sem: 0.1
tau: 1
# choose from {un, su, us, us_x}
contrast: 'us_x'
# choose from {dot, cos}
sim: 'dot'
hidden_dropout_prob: 0.5
attn_dropout_prob: 0.5
### model config
##embedding_size: 32
## dataset config
#
## MovieLens, Amazon
#field_separator: "\t" #指定数据集field的分隔符
#seq_separator: " " #指定数据集中token_seq或者float_seq域里的分隔符
#USER_ID_FIELD: user_id #指定用户id域
##ITEM_ID_FIELD: item_id #指定物品id域
#ITEM_ID_FIELD: business_id #指定物品id域
#
##RATING_FIELD: rating #指定打分rating域
#RATING_FIELD: stars #指定打分rating域
##TIME_FIELD: timestamp #指定时间域
#TIME_FIELD: date #指定时间域
#
##指定从什么文件里读什么列,这里就是从ml-1m.inter里面读取user_id, item_id, rating, timestamp这四列,剩下的以此类推
## rating, timestamp
#load_col:
# inter: [user_id, business_id, stars,date]
#
#NEG_PREFIX: neg_ #指定负采样前缀
#LABEL_FIELD: label #指定标签域
#ITEM_LIST_LENGTH_FIELD: item_length #指定序列长度域
#LIST_SUFFIX: _list #指定序列前缀
#MAX_ITEM_LIST_LENGTH: 50 #指定最大序列长度
#POSITION_FIELD: position_id #指定生成的序列位置id
#
##max_user_inter_num: 100
#min_user_inter_num: 5
##max_item_inter_num: 100
#min_item_inter_num: 5
#lowest_val:
# date: 1546264800
#highest_val:
# date: 1577714400
#
##lowest_val:
## timestamp: 1546264800
##highest_val:
## timestamp: 1577714400
#
## training settings
#epochs: 1000 #训练的最大轮数
#train_batch_size: 256 #训练的batch_size
#learner: adam #使用的pytorch内置优化器
#learning_rate: 0.001 #学习率
#training_neg_sample_num: 0 #负采样数目
#eval_step: 1 #每次训练后做evalaution的次数
#stopping_step: 10 #控制训练收敛的步骤数,在该步骤数内若选取的评测标准没有什么变化,就可以提前停止了
## evalution settings
#eval_setting: TO_LS,full #对数据按时间排序,设置留一法划分数据集,并使用全排序
#metrics: ["Recall", "MRR","NDCG","Precision"] #评测标准
#valid_metric: MRR@10 #选取哪个评测标准作为作为提前停止训练的标准
#eval_batch_size: 256 #评测的batch_size
#weight_decay: 0
#topk: [5, 10, 20, 50]
#
## directory setting
#log_root: "./log/"
#data_path: "./dataset/"
#
#lmd: 0.1
#lmd_sem: 0.1
#
#tau: 1
#
## choose from {un, su, us, us_x}
#contrast: 'us_x'
#
## choose from {dot, cos}
#sim: 'dot'
#
#hidden_dropout_prob: 0.5
#attn_dropout_prob: 0.5