阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

优化定时任务调度框架的实现

348次阅读
没有评论

共计 3306 个字符,预计需要花费 9 分钟才能阅读完成。

导读 本文介绍了作者优化定时任务调度框架的实现。一起来来看看吧。

项目中需要使用一个简单的定时任务调度的框架,最初直接从 GitHub 上搜了一个 star 比较多的,就是 https://github.com/robfig/cron,目前有 8000+ star。刚开始使用的时候发现问题不大,但是随着单机需要定时调度的任务越来越多,高峰期差不多接近 500QPS,随着业务的推广使用,可以预期增长还会比较快,但是已经遇到 CPU 使用率偏高的问题,通过 pprof 分析,很多都是在做排序,看了下这个项目的代码,整体执行的过程大概如下:

对所有任务进行排序,按照下次执行时间进行排序
选择数组中第一个任务,计算下次执行时间减去当前时间得到时间 t,然后 sleep t
然后从数组第一个元素开始遍历任务,如果此任务需要调度的时间 < now,那么就执行此任务,执行之后重新计算这个任务的 next 执行时间
每次待执行的任务执行完毕之后,都会重新对这个数组进行排序
然后再循环从排好序的数组中找到第一个需要执行的任务去执行。

代码如下:

for {
        // Determine the next entry to run.
        sort.Sort(byTime(c.entries))
        var timer *time.Timer
        if len(c.entries) == 0 || c.entries[0].Next.IsZero() {
            // If there are no entries yet, just sleep - it still handles new entries
            // and stop requests.
            timer = time.NewTimer(100000 * time.Hour)
        } else {timer = time.NewTimer(c.entries[0].Next.Sub(now))
        }
        for {
            select {
            case now = <-timer.C:
                now = now.In(c.location)
                c.logger.Info("wake", "now", now)
                // Run every entry whose next time was less than now
                for _, e := range c.entries {if e.Next.After(now) || e.Next.IsZero() {break}
                    c.startJob(e.WrappedJob)
                    e.Prev = e.Next
                    e.Next = e.Schedule.Next(now)
                    c.logger.Info("run", "now", now, "entry", e.ID, "next", e.Next)
                }
            case newEntry := <-c.add:
                timer.Stop()
                now = c.now()
                newEntry.Next = newEntry.Schedule.Next(now)
                c.entries = append(c.entries, newEntry)
                c.logger.Info("added", "now", now, "entry", newEntry.ID, "next", newEntry.Next)
            case replyChan := <-c.snapshot:
                replyChan <- c.entrySnapshot()
                continue
            case <-c.stop:
                timer.Stop()
                c.logger.Info("stop")
                return
            case id := <-c.remove:
                timer.Stop()
                now = c.now()
                c.removeEntry(id)
                c.logger.Info("removed", "entry", id)
            }
            break
        }
    }

问题就显而易见了,执行一个任务(或几个任务)都重新计算 next 执行时间,重新排序,最坏情况就是每次执行 1 个任务,排序一遍,那么执行 k 个任务需要的时间的时间复杂度就是 O(k*nlogn),这无疑是非常低效的。

于是想着怎么优化一下这个框架,不难想到每次找最先需要执行的任务就是从一堆任务中找 schedule_time 最小的那一个(设 schedule_time 是任务的执行时间),那么比较容易想到的思路就是使用最小堆:

在初始化任务列表的时候就直接构建一个最小堆
每次执行查看 peek 元素是否需要执行
需要执行就 pop 堆顶元素,计算 next 执行时间,重新 push 入堆
不需要执行就 break 到外层循环取堆顶元素,计算 next_time-now() = need_sleep_time,然后 select 睡眠、add、remove 等操作。

我修改为 min-heap 的方式之后,每次添加任务的时候通过堆的属性进行 up 和 down 调整,每次添加任务时间复杂度 O(logn),执行 k 个任务时间复杂度是 O(klogn)。经过验证线上 CPU 使用降低 4~5 倍。CPU 从 50% 左右降低至 10% 左右。

优化后的代码如下,只是其中一部分。

全部的代码也已经在 github 上已经创建了一个 Fork 的仓库并推送上去了,全部单测 Case 也都 PASS。感兴趣可以点过去看。https://github.com/tovenja/cro

for {

// Determine the next entry to run.

// Use min-heap no need sort anymore

// 这里不再需要排序了,因为 add 的时候直接进行堆调整

//sort.Sort(byTime(c.entries))

var timer *time.Timer

if len(c.entries) == 0 || c.entries[0].Next.IsZero() {

// If there are no entries yet, just sleep - it still handles new entries

// and stop requests.

timer = time.NewTimer(100000 * time.Hour)

} else {timer = time.NewTimer(c.entries[0].Next.Sub(now))

//fmt.Printf("%v, %+v\n", c.entries[0].Next.Sub(now), c.entries[0].ID)

}

for {

select {

case now = <-timer.C:

now = now.In(c.location)

c.logger.Info("wake", "now", now)

// Run every entry whose next time was less than now

for {e := c.entries.Peek()

if e.Next.After(now) || e.Next.IsZero() {break}

e = heap.Pop(&c.entries).(*Entry)

c.startJob(e.WrappedJob)

e.Prev = e.Next

e.Next = e.Schedule.Next(now)

heap.Push(&c.entries, e)

c.logger.Info("run", "now", now, "entry", e.ID, "next", e.Next)

}

case newEntry := <-c.add:

timer.Stop()

now = c.now()

newEntry.Next = newEntry.Schedule.Next(now)

heap.Push(&c.entries, newEntry)

c.logger.Info("added", "now", now, "entry", newEntry.ID, "next", newEntry.Next)

case replyChan := <-c.snapshot:

replyChan <- c.entrySnapshot()

continue

case <-c.stop:

timer.Stop()

c.logger.Info("stop")

return

case id := <-c.remove:

timer.Stop()

now = c.now()

c.removeEntry(id)

c.logger.Info("removed", "entry", id)

}

break

}

}

阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年,有高配

腾讯云新客低至 82 元 / 年,老客户 99 元 / 年

代金券:在阿里云专用满减优惠券

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2024-07-25发表,共计3306字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

星哥玩云

星哥玩云
星哥玩云
分享互联网知识
用户数
4
文章数
19354
评论数
4
阅读量
8246207
文章搜索
热门文章
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见 zabbix!轻量级自建服务器监控神器在 Linux 的完整部署指南 在日常运维中,服务器监控是绕不开的...
飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛 NAS 中安装 Navidrome 音乐文件中文标签乱码问题解决、安装 FntermX 终端 问题背景 ...
星哥带你玩飞牛NAS-7:手把手教你免费内网穿透-Cloudflare tunnel

星哥带你玩飞牛NAS-7:手把手教你免费内网穿透-Cloudflare tunnel

星哥带你玩飞牛 NAS-7:手把手教你免费内网穿透 -Cloudflare tunnel 前言 大家好,我是星...
阿里云CDN
阿里云CDN-提高用户访问的响应速度和成功率
随机文章
星哥带你玩飞牛NAS-12:开源笔记的进化之路,效率玩家的新选择

星哥带你玩飞牛NAS-12:开源笔记的进化之路,效率玩家的新选择

星哥带你玩飞牛 NAS-12:开源笔记的进化之路,效率玩家的新选择 前言 如何高效管理知识与笔记,已经成为技术...
让微信公众号成为 AI 智能体:从内容沉淀到智能问答的一次升级

让微信公众号成为 AI 智能体:从内容沉淀到智能问答的一次升级

让微信公众号成为 AI 智能体:从内容沉淀到智能问答的一次升级 大家好,我是星哥,之前写了一篇文章 自己手撸一...
每年0.99刀,拿下你的第一个顶级域名,详细注册使用

每年0.99刀,拿下你的第一个顶级域名,详细注册使用

每年 0.99 刀,拿下你的第一个顶级域名,详细注册使用 前言 作为长期折腾云服务、域名建站的老玩家,星哥一直...
安装Black群晖DSM7.2系统安装教程(在Vmware虚拟机中、实体机均可)!

安装Black群晖DSM7.2系统安装教程(在Vmware虚拟机中、实体机均可)!

安装 Black 群晖 DSM7.2 系统安装教程(在 Vmware 虚拟机中、实体机均可)! 前言 大家好,...
欧洲无限速云盘免费10GB永久存储 + WebDAV部署+图床搭建,多平台联动一步到位!

欧洲无限速云盘免费10GB永久存储 + WebDAV部署+图床搭建,多平台联动一步到位!

欧洲无限速云盘免费 10GB 永久存储 + WebDAV 部署 + 图床搭建,多平台联动一步到位! 大家好,我...

免费图片视频管理工具让灵感库告别混乱

一言一句话
-「
手气不错
300元就能买到的”小钢炮”?惠普7L四盘位小主机解析

300元就能买到的”小钢炮”?惠普7L四盘位小主机解析

  300 元就能买到的 ” 小钢炮 ”?惠普 7L 四盘位小主机解析 最近...
每天一个好玩的网站-手机博物馆-CHAZ 3D Experience

每天一个好玩的网站-手机博物馆-CHAZ 3D Experience

每天一个好玩的网站 - 手机博物馆 -CHAZ 3D Experience 一句话介绍:一个用 3D 方式重温...
星哥带你玩飞牛NAS-16:飞牛云NAS换桌面,fndesk图标管理神器上线!

星哥带你玩飞牛NAS-16:飞牛云NAS换桌面,fndesk图标管理神器上线!

  星哥带你玩飞牛 NAS-16:飞牛云 NAS 换桌面,fndesk 图标管理神器上线! 引言 哈...
星哥带你玩飞牛NAS-13:自动追番、订阅下载 + 刮削,动漫党彻底解放双手!

星哥带你玩飞牛NAS-13:自动追番、订阅下载 + 刮削,动漫党彻底解放双手!

星哥带你玩飞牛 NAS-13:自动追番、订阅下载 + 刮削,动漫党彻底解放双手! 作为动漫爱好者,你是否还在为...
告别Notion焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁”

告别Notion焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁”

  告别 Notion 焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁” 引言 在数字笔记工...