Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

需求:Job接入普罗米修斯监控 #2237

Open
SuperCarrys opened this issue Jun 27, 2023 · 9 comments · May be fixed by #2265
Open

需求:Job接入普罗米修斯监控 #2237

SuperCarrys opened this issue Jun 27, 2023 · 9 comments · May be fixed by #2265

Comments

@SuperCarrys
Copy link

需求:Job接入普罗米修斯监控,比如收集job执行一段时间的成功次数、失败次数,job线程池信息,job延时执行时长等指标等等,通过可视化看板直观查看job状态,以及接入job异常的告警。

请问社区是否有计划

@SuperCarrys
Copy link
Author

通过控制台可以查询job的执行轨迹,但需要依赖数据库,有一些秒级任务,数据库的记录数增长很快,而且观察job的执行轨迹不直观,没有统计图

@songxiaosheng
Copy link
Member

第一个好整扩展一个作业执行器就可以,如果有需要我来整下,还有一个非常重要的监控项:作业到时间需要执行但是为执行监控(低频作业我实现了高频作业暂时没有思路)

@SuperCarrys
Copy link
Author

需要,我可以和你一起共建吗

@songxiaosheng
Copy link
Member

需要,我可以和你一起共建吗

可以,微信聊聊

@SuperCarrys
Copy link
Author

我已邮箱发给你我的微信号

@songxiaosheng
Copy link
Member

我已邮箱发给你我的微信号

ok

@zjx990
Copy link
Contributor

zjx990 commented Sep 15, 2023

@songxiaosheng 这个功能对于我来说也很重要。因为我需要知道作业执行的健康情况(失败、成功),目前我的做法是在执行时打日志,我自己做了个日志收集系统存储到ES然后分析统计。请问如果咱们做版本迭代此功能是否2.x和3.x都会适配。

@songxiaosheng
Copy link
Member

@songxiaosheng 这个功能对于我来说也很重要。因为我需要知道作业执行的健康情况(失败、成功),目前我的做法是在执行时打日志,我自己做了个日志收集系统存储到ES然后分析统计。请问如果咱们做版本迭代此功能是否2.x和3.x都会适配。

新功能只会在新版本做,推荐老版本升级,不过你们老版本可以通过分析zookeeper节点状态 ,日志,升级sdk多种方式同步展开

@zjx990
Copy link
Contributor

zjx990 commented Sep 15, 2023

@songxiaosheng 这个功能对于我来说也很重要。因为我需要知道作业执行的健康情况(失败、成功),目前我的做法是在执行时打日志,我自己做了个日志收集系统存储到ES然后分析统计。请问如果咱们做版本迭代此功能是否2.x和3.x都会适配。

新功能只会在新版本做,推荐老版本升级,不过你们老版本可以通过分析zookeeper节点状态 ,日志,升级sdk多种方式同步展开

感谢。期待新的版本

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

Successfully merging a pull request may close this issue.

4 participants