-
Notifications
You must be signed in to change notification settings - Fork 1.6k
数据导入清理及结果查看
Yu Wu edited this page Feb 22, 2021
·
7 revisions
-
如何上传数据表?
具体上传流程参考这里的upload guide. 数据上传到eggroll(存储及计算引擎)里面,在内部party里进行数据分发,变成后续算法可执行的DTable格式 -
如何删除已经上传的数据表 请参考FATE-Flow Client的删除数据的接口。
-
如何使用某个算法,跑自己的数据?
首先,使用fate_flow上传自己的数据,记录下对应的table和table name,具体上传流程参考这里的upload guide. 然后在example下有对应算法的文件夹,里面有例子的dsl和conf,把conf里面的数据table和table_name换成刚刚上传了的数据表。然后利用fate_flow的接口启动任务即可,具体启动命令,在文件夹下有README. dsl和对应conf的配置,根据需要自行修改 -
如何查看组件数据输出
- Fateboard可展示前100条。
- 通过FATE-Flow Client查看。
-
如何查看训练好的模型
- Fateboard展示模型信息。
- 通过FATE-Flow Client查看。
-
各方数据需要准备什么?需要知道对方的features吗?
答:各方数据需要做一定的ETL加工处理,处理成可以建模的数据,比如是数值特征。联邦学习一方不需要知道另外一方的feature。 -
预处理有什么要求?
如果数据预处理,可以在数据导入前做好,处理成能建模的数据就可以,也可以用FATE系统自带一些特征工程处理工具。