全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210752047.8 (22)申请日 2022.06.28 (71)申请人 阿里巴巴 (中国) 有限公司 地址 310023 浙江省杭州市余杭区五常街 道文一西路969号3幢5层5 54室 (72)发明人 彭梦烨 裴晓辉 鲍利平 王志强  谢东凯  (74)专利代理 机构 北京太合九思知识产权代理 有限公司 1 1610 专利代理师 孙明子 刘戈 (51)Int.Cl. G06F 9/50(2006.01) G06F 16/27(2019.01) (54)发明名称 数据处理方法、 装置、 设备和存 储介质 (57)摘要 本申请提供一种数据处理方法、 装置、 设备 和存储介质, 该方法包括: 获取多个碎片数据在 分布式存储系统的写入时长, 其中, 分布式存储 系统中包含第一存储空间和多个第二存储空间; 如果写入时长为第一时长, 则将暂存至第一存储 空间中的多个碎片数据整合至第二存储空间中 进行持久化存储; 如果写入时长为第二时长, 则 对多个第二存储空间中持久化存储的所述多个 碎片数据进行数据整合, 得到更新后第二存储空 间, 其中, 第二时长大于第一时长。 以实现在没有 浪费存储空间的情况下, 最大程度上减少碎片数 据整理所 带来的流 量消耗。 权利要求书2页 说明书8页 附图2页 CN 115080239 A 2022.09.20 CN 115080239 A 1.一种数据处 理方法, 其特 征在于, 包括: 获取多个碎片数据在分布式存储系统的写入时长, 其中, 所述分布式存储系统中包含 第一存储空间和多个第二存 储空间; 如果所述写入时长为第 一时长, 则将暂存至所述第 一存储空间中的所述多个碎片数据 整合至所述第二存 储空间中进行持久化存 储; 如果所述写入时长为第 二时长, 则对所述多个第 二存储空间中持久化存储的所述多个 碎片数据进行数据整合, 得到更新后第二存储空间, 其中, 所述第二时长大于所述第一时 长。 2.根据权利要求1所述的方法, 其特征在于, 所述将暂存至所述第 一存储空间中的所述 多个碎片数据整合至所述第二存 储空间中进行持久化存 储, 包括: 获取所述第 一存储空间中的所述多个碎片数据各自所属文件的第 一文件标识, 以及所 述多个碎片数据在各自所属文件中的第一逻辑 地址; 根据所述第 一文件标识和所述第 一逻辑地址, 将所述第 一存储空间中的所述多个碎片 数据整合至所述第二存 储空间中进行持久化存 储。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述第 一文件标识和所述第 一逻 辑地址, 将所述第一存储空间中的所述多个碎片数据整合至所述第二存储空间中进行持久 化存储, 包括: 确定所述第 一存储空间中的第 一文件标识相同的多个碎片数据, 以将所述第 一文件标 识相同的多个碎片数据整合至相同的所述文件中; 根据所述第 一逻辑地址分别对所述文件中的多个碎片数据进行排序, 得到多个更新后 文件; 根据多个所述更新后文件在所述第 一存储空间的创建时间, 顺序将所述多个更新后文 件整合至所述第二存 储空间中进行持久化存 储。 4.根据权利要求3所述的方法, 其特征在于, 所述根据多个所述更新后文件在所述第 一 存储空间的创建时间, 顺序将所述多个更新后文件整合至所述第二存储空间中进 行持久化 存储, 包括: 检测所述第一存 储空间的当前文件数量是否 达到预设文件数量; 若检测到所述当前文件数量达到所述预设文件数量, 则获取所述更新后文件在所述第 一存储空间的创建时间, 以根据所述创建时间, 顺序将所述多个更新后文件整合至所述第 二存储空间中进行持久化存 储。 5.根据权利要求1所述的方法, 其特征在于, 所述对所述多个第 二存储空间中持久化存 储的所述多个碎片数据进行 数据整合, 得到更新后第二存 储空间, 包括: 获取所述多个第二存储空间中各自存储的所述多个碎片数据各自所属文件的第二文 件标识, 以及所述多个碎片数据在各自所属文件中的第二逻辑 地址; 根据所述第二文件标识和所述第二逻辑地址对所述多个第二存储空间中持久化存储 的所述多个碎片数据进行 数据整合, 得到更新后第二存 储空间。 6.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括: 响应于对无效碎片数据的垃圾 回收请求, 触发执行所述获取所述多个第 二存储空间中 各自存储的所述多个碎片数据各自所属文件的第二文件标识, 以及所述多个碎片数据在各权 利 要 求 书 1/2 页 2 CN 115080239 A 2自所属文件中的第二逻辑 地址。 7.根据权利要求5所述的方法, 其特征在于, 所述根据所述第 二文件标识和所述第 二逻 辑地址对所述多个第二存储空间中持久化存储的所述多个碎片数据进 行数据整合, 得到更 新后第二存 储空间, 包括: 根据所述第 二文件标识和所述第 二逻辑地址, 对第 一数量的所述多个第 二存储空间中 持久化存储的所述多个碎片数据进行数据整合, 得到第二数量的所述更新后第二存储空 间, 其中, 所述第二数量少于所述第一数量。 8.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 响应于对所述碎片数据的写入请求, 将所述碎片数据暂存至所述第一存储空间, 以及 将所述碎片数据持久化存储至日志存储空间, 以在所述第二存储空间故障时根据所述日志 存储空间的存 储内容执 行数据恢复。 9.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 响应于用户的文件读取请求, 触发执行所述将暂存至所述第 一存储空间中的所述多个 碎片数据整合至所述第二存储空间中进行持久化存储; 以及对所述多个第二存储空间中持 久化存储的所述多个碎片数据进行 数据整合, 得到更新后第二存 储空间。 10.一种数据处 理装置, 其特 征在于, 包括: 获取模块, 用于获取多个碎片数据在 分布式存储系统 的写入时长, 其中, 所述分布式存 储系统中包 含第一存 储空间和多个第二存 储空间; 第一处理模块, 用于如果所述写入时长为第一时长, 则将暂存至所述第一存储空间中 的所述多个碎片数据整合至所述第二存 储空间中进行持久化存 储; 第二处理模块, 用于如果所述写入时长为第二时长, 则对所述多个第二存储空间中持 久化存储的所述多个碎片数据进 行数据整合, 得到更新后第二存储空间, 其中, 所述第二时 长大于所述第一时长 。 11.一种电子设备, 其特征在于, 包括: 存储器、 处理器、 通信接口; 其中, 所述存储器上 存储有可执行代码, 当所述可执行代码被所述处理器执行时, 使所述处理器执行如权利要 求1至9中任一项所述的数据处 理方法。 12.一种非暂时性机器可读存储介质, 其特征在于, 所述非暂时性机器可读存储介质上 存储有可执行代码, 当所述可执行代码被电子设备 的处理器执行时, 使所述处理器执行如 权利要求1至9中任一项所述的数据处 理方法。权 利 要 求 书 2/2 页 3 CN 115080239 A 3

.PDF文档 专利 数据处理方法、装置、设备和存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、装置、设备和存储介质 第 1 页 专利 数据处理方法、装置、设备和存储介质 第 2 页 专利 数据处理方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:32:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。