-
Notifications
You must be signed in to change notification settings - Fork 3
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
关于text.pt文件的一些问题? #4
Comments
其中第一行时desc的编码,剩余200行是tweet的编码? |
是的,这里第一个token是desc,剩余是tweet*200 |
作者,您好。 请问你们是怎么处理Cresci-15数据集的呢?我下载了Cresci-15的原始数据集,但是里面似乎由五个压缩包组合而成,我不知道如何将它整理成一个用于推特机器人检测的数据集。 或者,作者您这边是否方便为我提供一些数据支持?这些数据我将会仅作为研究使用: 1)您能否为我提供处理好的关于Cresci-15的 .pt文件? 2)如果您不方便提供处理好的.pt文件,是否能为我提供整理好的文本形式的Cresci-15数据集?我可以自己进行后续的编码操作。 这是我的电子邮箱,我们可以通过邮箱进行后续的文件传输吗?[email protected] 谢谢! |
您好, 我目前可能没有保存好的Cresci-15的文件,我后面可能会再重新写code生成一次,但目前可能无法提供。cresci-15 raw dataset 不包含label,所以你(1)可以问问cresci-15的提供者 (2)问问我们paper的另一个共一和其他作者,他们可能会有保存。 |
好的,谢谢您。
那请问作者知道原始数据集中的followers和friends中的这两个字段分别代表什么吗?我似乎无法在user.csv中找到对应uid的用户。
| |
wzhongjie07
|
|
***@***.***
|
---- 回复的原邮件 ----
| 发件人 | ***@***.***> |
| 发送日期 | 2024年4月30日 02:21 |
| 收件人 | ***@***.***> |
| 抄送人 | ***@***.***>,
***@***.***> |
| 主题 | Re: [LzyFischer/BIC] 关于text.pt文件的一些问题? (Issue #4) |
您好, 我目前可能没有保存好的Cresci-15的文件,我后面可能会再重新写code生成一次,但目前可能无法提供。cresci-15 raw dataset 不包含label,所以你(1)可以问问cresci-15的提供者 (2)问问我们paper的另一个共一和其他作者,他们可能会有保存。
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you authored the thread.Message ID: ***@***.***>
|
想问一下作者这里的text.pt是什么维度的呢?(201,768)么?
The text was updated successfully, but these errors were encountered: