当前位置:首页 > 文章列表 > Golang > Go问答 > 使用ticker定期定时加载内存中所有不断变化的路径中的文件

使用ticker定期定时加载内存中所有不断变化的路径中的文件

来源:stackoverflow 2024-02-28 17:45:24 0浏览 收藏

IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《使用ticker定期定时加载内存中所有不断变化的路径中的文件》,聊聊,我们一起来看看吧!

问题内容

我有一个应用程序需要从两个不同的路径读取文件。读取所有这些文件后,我需要将它们加载到 products 地图的内存中。

路径:

  • full:这是内存中服务器启动期间需要加载的所有文件的路径。该路径将包含大约 50 个文件,每个文件大小约为 60mb。
  • delta:这是包含我们需要每 1 分钟定期加载到内存中的所有增量文件的路径。这些文件仅包含与完整路径文件的差异。该路径将包含大约 60 个文件,每个文件大小约为 20mb。

下面的代码 watchdeltapath 在服务器启动期间被调用以监视增量更改。它将从 getdeltapath 方法获取增量路径,并从该路径我需要加载内存中的所有文件。 此增量路径每隔几分钟就会发生变化,我不会错过任何一个增量路径以及该路径中的所有文件

loadallfiles 方法加载内存中的所有文件可能需要一些时间(大约 5 分钟),所以我试图找到一种方法,让我不应该错过任何新的增量路径(因为它每隔几分钟就会不断变化)并且应该能够定期从增量路径加载内存中的所有这些文件,不会出现任何问题且高效。

我得到了下面的代码,每 1 分钟运行一次,每次都会查找新的 delta 路径 ,然后从内存中的该路径加载所有文件。它工作得很好,但我认为这不是正确的方法。如果 loadallfiles 方法需要超过 10 分钟来加载内存中的所有文件,并且我的代码每 1 分钟运行一次以查找新的增量路径,然后找到该新路径中的所有文件,然后加载到内存中,会发生什么情况?它会继续创建大量后台线程并可能大幅增加 cpu 使用率吗?

type applicationRepository struct {
  client         customer.Client
  logger         log.Logger
  done           chan struct{}
  products       *cmap.ConcurrentMap
}

// this will be called only once
func (r *applicationRepository) watchDeltaPath() error {
    ticker := time.NewTicker(1 * time.Minute)
    go func() {
        select {
        case <-r.done:
            ticker.Stop()
            return
        case <-ticker.C:
            func() (result error) {
                trans := r.logger.StartTransaction(nil, "delta-changes", "")
                defer trans.End()
                defer func() {
                    if result != nil {
                        trans.Errorf("Recovered from error: %v")
                    } else if err := recover(); err != nil {
                        trans.Errorf("Recovered from panic: %v", err)
                    }
                }()
                // get latest delta path everytime as it keeps changing every few minutes
                path, err := r.client.GetDeltaPath("delta")
                if err != nil {
                    return err
                }
                // load all the files in memory in "products" map from that path
                err = r.loadAllFiles(path)
                if err != nil {
                    return err
                }
                return nil
            }()
        }
    }()
    return nil
}

func (r *applicationRepository) Stop() {
    r.done <- struct{}{}
}

在产品中有效地做到这一点的最佳方法是什么?

这是我对代码的执行方式的玩弄 - https://go.dev/play/p/fs4-b0fwwte


正确答案


根据评论,“在产品中有效地做到这一点的最佳方法”取决于很多因素,并且在像 stack overflow 这样的网站上可能无法回答。话虽如此,我可以提出一种方法,可以让您更容易地思考如何最好地解决问题。

下面的代码(playground;非常粗糙且未经测试)演示了使用三个 go 例程的方法:

  1. 检测新的增量路径并将其推送到缓冲通道
  2. 处理初始负载
  3. 等待初始加载完成,然后应用增量(请注意,这会处理初始加载正在进行时发现的增量)

如上所述,问题中没有足够的细节来确定这是否是一个好方法。初始负载和增量可能可以同时运行而不会使 io 饱和,但这需要测试(并且是一个相对较小的变化)。

// simulation of process to perform initial load and handle deltas
package main

import (
    "fmt"
    "strconv"
    "sync"
    "time"
)

const deltabuffer = 100
const initialloadtime = time.duration(time.duration(1.5 * float32(time.second)))
const deltacheckfrequency = time.duration(500 * time.millisecond)

func main() {
    ar := newapplicationrepository()
    time.sleep(5 * time.second)
    ar.stop()
    fmt.println(time.now(), "complete")
}

type applicationrepository struct {
    deltachan       chan string   // could be some other type...
    initialloaddone chan struct{} // closed when initial load finished

    done chan struct{}
    wg   sync.waitgroup
}

func newapplicationrepository() *applicationrepository {
    ar := applicationrepository{
        deltachan:       make(chan string, deltabuffer),
        initialloaddone: make(chan struct{}),
        done:            make(chan struct{}),
    }

    ar.wg.add(3)
    go ar.detectnewdeltas()
    go ar.initialload()
    go ar.deltaload()

    return &ar
}

// detectnewdeltas - watch for new delta paths
func (a *applicationrepository) detectnewdeltas() {
    defer a.wg.done()
    var previousdelta string
    for {
        select {
        case <-time.after(deltacheckfrequency):
            dp := a.getdeltapath()
            if dp != previousdelta {
                select {
                case a.deltachan <- dp:
                default:
                    panic("channel full - no idea what to do here!")
                }
                previousdelta = dp
            }
        case <-a.done:
            return
        }
    }
}

// getdeltapath in real application this will retrieve the delta path
func (a *applicationrepository) getdeltapath() string {
    return strconv.itoa(time.now().second()) // for now just return the current second..
}

// initialload - load the initial data
func (a *applicationrepository) initialload() {
    defer a.wg.done()
    defer close(a.initialloaddone)
    time.sleep(initialloadtime) // simulate time taken for initial load
}

// deltaload- load deltas found by detectnewdeltas
func (a *applicationrepository) deltaload() {
    defer a.wg.done()
    fmt.println(time.now(), "deltaload started")

    // wait for initial load to complete before doing anything
    <-a.initialloaddone
    fmt.println(time.now(), "initial load done")

    // wait for incoming deltas and load them
    for {
        select {
        case newdelta := <-a.deltachan:
            fmt.println(time.now(), newdelta)
        case <-a.done:
            return
        }
    }
}

// stop - signal loader to stop and wait until this is done
func (a *applicationrepository) stop() {
    close(a.done)
    a.wg.wait()
}

我想你想要 golang 并发模式:扇入、扇出。您可以在 google 中搜索。

我创建了一个示例代码。您可以复制粘贴它并创建文件夹 fulldelta ,其中包含虚拟文件。

package main

import (
    "fmt"
    "log"
    "os"
    "path/filepath"
    "sync"
    "time"
)

type MyFile struct {
    full         map[string][]byte
    delta        map[string][]byte
    files        []string
    stopAutoLoad chan struct{}
}

func FilePathWalkDir(root string) ([]string, error) {
    var files []string
    err := filepath.Walk(root, func(path string, info os.FileInfo, err error) error {
        if !info.IsDir() {
            files = append(files, path)
        }
        return nil
    })
    return files, err
}

func main() {
    mf := NewMyFile()
    mf.StartAutoLoadDelta(10 * time.Second)

    // time.Sleep(15 * time.Second)
    // mf.StopAutoLoadDelta()

    time.Sleep(50 * time.Minute)
    fmt.Println(len(mf.full))
    fmt.Println(len(mf.delta))
}

func NewMyFile() *MyFile {
    mf := &MyFile{
        full:         make(map[string][]byte),
        delta:        make(map[string][]byte),
        stopAutoLoad: make(chan struct{}),
    }

    mf.LoadFile("full", 0)
    mf.LoadFile("delta", 0)
    return mf
}

func (mf *MyFile) StartAutoLoadDelta(d time.Duration) {
    ticker := time.NewTicker(d)

    go func() {
        defer func() {
            ticker.Stop()
        }()

        i := 1
        for {
            select {
            case <-ticker.C:
                // mf.deleteCurrentDelta()
                mf.LoadFile("delta", i)
                fmt.Println("In Memory:")
                for k, v := range mf.delta {
                    fmt.Printf("key : %s\t\tlen: %d\n", k, len(v))
                }
                i++
            case <-mf.stopAutoLoad:
                return
            }
        }
    }()
}

func (mf *MyFile) StopAutoLoadDelta() {
    fmt.Println("Stopping autoload Delta")
    mf.stopAutoLoad <- struct{}{}
}

func (mf *MyFile) deleteCurrentDelta() {
    for k, _ := range mf.delta {
        fmt.Println("data deleted: ", k)
        delete(mf.delta, k)
    }
}

type Fileinfo struct {
    name string
    data []byte
    err  error
}

func (mf *MyFile) LoadFile(prefix string, i int) {
    log.Printf("%s load : %d", prefix, i)
    files, err := FilePathWalkDir(prefix)
    if err != nil {
        panic("failed to open delta directory")
    }

    newFiles := make([]string, 0)

    for _, v := range files {
        if _, ok := mf.delta[v]; !ok {
            newFiles = append(newFiles, v)
        }
    }

    chanJobs := GenerateJobs(prefix, newFiles)
    chanResultJobs := ReadFiles(chanJobs, 8)
    counterTotal := 0
    counterSuccess := 0
    for results := range chanResultJobs {
        if results.err != nil {
            log.Printf("error creating file %s. stack trace: %s", results.name, results.err)
        } else {
            switch prefix {
            case "delta":
                mf.delta[results.name] = results.data
            case "full":
                mf.full[results.name] = results.data
            default:
                panic("not implemented")
            }
            counterSuccess++
        }
        counterTotal++
    }

    log.Printf("status jobs running: %d/%d", counterSuccess, counterTotal)
}

func GenerateJobs(prefix string, files []string) <-chan Fileinfo {
    chanOut := make(chan Fileinfo)

    go func() {
        for _, v := range files {
            chanOut <- Fileinfo{
                name: v,
            }
        }
        close(chanOut)
    }()

    return chanOut
}

func ReadFiles(chanIn <-chan Fileinfo, worker int) <-chan Fileinfo {
    chanOut := make(chan Fileinfo)

    var wg sync.WaitGroup

    wg.Add(worker)

    go func() {
        for i := 0; i < worker; i++ {
            go func(workerIndex int) {
                defer wg.Done()
                for job := range chanIn {
                    log.Printf("worker %d is reading file %s", workerIndex, job.name)
                    data, err := os.ReadFile(job.name)
                    chanOut <- Fileinfo{
                        name: job.name,
                        data: data,
                        err:  err,
                    }
                }
            }(i)
        }
    }()

    go func() {
        wg.Wait()
        close(chanOut)
    }()
    return chanOut
}

以上就是《使用ticker定期定时加载内存中所有不断变化的路径中的文件》的详细内容,更多关于的资料请关注golang学习网公众号!

版本声明
本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
发现Golang常用的标准库和包发现Golang常用的标准库和包
上一篇
发现Golang常用的标准库和包
创建macOS系统的虚拟机并设置固件类型
下一篇
创建macOS系统的虚拟机并设置固件类型
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    307次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    324次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    292次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    472次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    456次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码