阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

超大文件上传到Azure Linux虚拟机最佳实践

468次阅读
没有评论

共计 2215 个字符,预计需要花费 6 分钟才能阅读完成。

客户在实际进行迁移的时候,往往碰到需要将本地数据中心的超大文件,比如单个 200GB 的文件,或者总共 1TB 的无数文件上传到 Azure 上的情况,尤其是传到 Azure 的 Linux 虚拟机的场景,这种场景包括:

  • 大日志文件上传到 Azure 进行分析

  • 数据库备份文件导入导出

  • 大数据文件下载到本地等等

尤其是要将数据库备份文件导入到 Linux 虚拟机进行数据库恢复,一般用户常常会选择传统的 FTP 方式进行处理,这样的方式通常会花费用户十几个小时,甚至几天的时间进行文件传输,但是在云计算的时代,其实有非常多的工具和方法可以使用,让你大幅度降低时间和成本,今天我们就以 250GB 数据库文件上传到 Linux 虚拟机为例,来看看怎么利用这些工具。

基本流程:

  1. 在本地安装或者使用一个 Windows 机器,内核数目和内存可能的话最好大一些,因为 azcopy 会根据内核数计算并发线程数

  2. 安装 azcopy

  3. 在 Azure 上创建 storage account,容器 container

  4. 利用 azcopy 上传本地文件到 Blob storage

  5. 在 Linux 虚拟机利用 Azure CLI 下载云端文件到本地 Linux 虚拟机

  6. 如果 Azure 上是 Windows 虚拟机,使用 azcopy 下载

限制和优化建议:

  1. 单个 block blob 的文件不能超过 195GB,所以如果你的本地单个文件超过这个大小,你可以选择:

    1. 分割文件成小份

    2. 利用压缩软件压缩文件到较小大小

  2. 如果你本地的机器比较强大,并且单个文件的确比较大,建议你本地压缩,可以节约总体时间,你开始压缩的时候,大致可以知道这个压缩需要多长时间,

  3. 你的虚拟机和你的存储帐号入伍特别需要,请放在一个区域,比如都在北京或者上海,一边最大限度的降低延迟,提升速度

  4. Azcopy 会最大限度的利用你的数据中心的带宽,如果你希望降低带宽占用,可以限制 azcopy 的并发处理数目,利用 /NC 来做限制,默认情况下,如果你是操作 blob storage,azcopy 的并发线程数是你处理器数目的 8 倍;对于 Table 的操作,默认的并发线程数是你的处理器数目。

  5. 上传下载速度和你的磁盘速度,网络带宽等都有关系,如果需要处理大规模文件,可以考虑临时调整你的数据中心带宽大小

 

在本示例中,基本环境如下:

  1. 备份文件未压缩前 210GB,压缩后 60GB

  2. 用户数据中心服务器,Windows Server 2012,16 cores,32GB

  3. Azure Linux 虚拟机:A4,SUSE 11 SP3

基本配置步骤如下:

  1. 在用户数据中心 Windows Server 上下载并安装 azcopy,请安装最新版本:

    http://aka.ms/downloadazcopy

  2. 在 Azure 上创建一个存储账号,并取得存储账号的主访问密钥:

超大文件上传到 Azure Linux 虚拟机最佳实践

超大文件上传到 Azure Linux 虚拟机最佳实践

3. 在该存储账号下创建一个容器,名字为 upload,你可以按照自己的需要命名:

超大文件上传到 Azure Linux 虚拟机最佳实践

超大文件上传到 Azure Linux 虚拟机最佳实践

 

4. 利用 Azcopy,上传你本地的文件到 Blob storage,注意要用到上个步骤创建到的存储账号和账号的 key,假定当前的上传文件名为 FULL0606.zip, 放在你的 E 盘:

Azcopy.exe /Source:E:\ /Dest: https://myhousestorage.blob.core.linuxidc.com/upload /DestKey:YOURSTORAGEKEY /Pattern:”FULL0606.zip”

参数说明:

/Souce: 你的源文件地址,写目录,具体文件名写后面,如 C:\data

/Dest:你的存储账号的容器地址,可以在你的容器页面看到

/DestKey:存储帐号的主访问密钥

更多关于 azcopy 的详细用法和命令,请参考:

https://azure.microsoft.com/en-us/documentation/articles/storage-use-azcopy/

5. 传统方式下,用户会使用 FTP 的模式,经过调优,大概速度是 3.5MB/s, 而使用了 azcopy,由于它有多线程,网络优化等底层功能的支持,速度可以达到近 11MB/s,用户数据中心带宽 100M, 这个速度是相当不错的:

超大文件上传到 Azure Linux 虚拟机最佳实践

6. 在将数据上传到 Azure blob storage 之后,需要在 Linux 虚拟机上将他下载到本地,在 Windows 上有 Powershell,azcopy 等工具,在 Linux 系统上,有 Azure CLI 作为跨平台的工具可以管理 Azure 的各项服务,关于如何在 Linux 上安装配置 Azure CLI,请参考:

http://www.linuxidc.com/Linux/2016-11/136978.htm

7. 在 Linux 虚拟机上,直接使用 Azure 的 CLI 命令下载上传到 Blob storage 上的压缩文件即可,在同一个 region,速度大约 30MB,但实际速度依赖于网络状况和当前负载:

# azure storage blob download upload FULL0606.zip ./

超大文件上传到 Azure Linux 虚拟机最佳实践

 

如果需要把 Linux 虚拟机上的大文件下载到本地,可以考虑逆序使用上述方法,azcopy 经过了网络优化,压缩优化和算法优化,是 Azure 上数据处理的神器:)

在之前客户的方案中,文件上传到 Linux 虚拟机大约需要 17 个小时,经过选择合适的方法,数据上传,下载大约总共 2 个小时的时间,所以根据不同的场景选择不同的工具和方法很重要。

本文永久更新链接地址 :http://www.linuxidc.com/Linux/2016-11/136977.htm

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-21发表,共计2215字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

星哥玩云

星哥玩云
星哥玩云
分享互联网知识
用户数
4
文章数
19356
评论数
4
阅读量
8321426
文章搜索
热门文章
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
星哥带你玩飞牛NAS-7:手把手教你免费内网穿透-Cloudflare tunnel

星哥带你玩飞牛NAS-7:手把手教你免费内网穿透-Cloudflare tunnel

星哥带你玩飞牛 NAS-7:手把手教你免费内网穿透 -Cloudflare tunnel 前言 大家好,我是星...
星哥带你玩飞牛NAS-2:飞牛配置RAID磁盘阵列

星哥带你玩飞牛NAS-2:飞牛配置RAID磁盘阵列

星哥带你玩飞牛 NAS-2:飞牛配置 RAID 磁盘阵列 前言 大家好,我是星哥之前星哥写了《星哥带你玩飞牛 ...
星哥带你玩飞牛NAS-1:安装飞牛NAS

星哥带你玩飞牛NAS-1:安装飞牛NAS

星哥带你玩飞牛 NAS-1:安装飞牛 NAS 前言 在家庭和小型工作室场景中,NAS(Network Atta...
阿里云CDN
阿里云CDN-提高用户访问的响应速度和成功率
随机文章
告别Notion焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁”

告别Notion焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁”

  告别 Notion 焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁” 引言 在数字笔记工...
星哥带你玩飞牛NAS-14:解锁公网自由!Lucky功能工具安装使用保姆级教程

星哥带你玩飞牛NAS-14:解锁公网自由!Lucky功能工具安装使用保姆级教程

星哥带你玩飞牛 NAS-14:解锁公网自由!Lucky 功能工具安装使用保姆级教程 作为 NAS 玩家,咱们最...
手把手教你,购买云服务器并且安装宝塔面板

手把手教你,购买云服务器并且安装宝塔面板

手把手教你,购买云服务器并且安装宝塔面板 前言 大家好,我是星哥。星哥发现很多新手刚接触服务器时,都会被“选购...
安装并使用谷歌AI编程工具Antigravity(亲测有效)

安装并使用谷歌AI编程工具Antigravity(亲测有效)

  安装并使用谷歌 AI 编程工具 Antigravity(亲测有效) 引言 Antigravity...
让微信公众号成为 AI 智能体:从内容沉淀到智能问答的一次升级

让微信公众号成为 AI 智能体:从内容沉淀到智能问答的一次升级

让微信公众号成为 AI 智能体:从内容沉淀到智能问答的一次升级 大家好,我是星哥,之前写了一篇文章 自己手撸一...

免费图片视频管理工具让灵感库告别混乱

一言一句话
-「
手气不错
仅2MB大小!开源硬件监控工具:Win11 无缝适配,CPU、GPU、网速全维度掌控

仅2MB大小!开源硬件监控工具:Win11 无缝适配,CPU、GPU、网速全维度掌控

还在忍受动辄数百兆的“全家桶”监控软件?后台偷占资源、界面杂乱冗余,想查个 CPU 温度都要层层点选? 今天给...
星哥带你玩飞牛NAS-16:不再错过公众号更新,飞牛NAS搭建RSS

星哥带你玩飞牛NAS-16:不再错过公众号更新,飞牛NAS搭建RSS

  星哥带你玩飞牛 NAS-16:不再错过公众号更新,飞牛 NAS 搭建 RSS 对于经常关注多个微...
4盘位、4K输出、J3455、遥控,NAS硬件入门性价比之王

4盘位、4K输出、J3455、遥控,NAS硬件入门性价比之王

  4 盘位、4K 输出、J3455、遥控,NAS 硬件入门性价比之王 开篇 在 NAS 市场中,威...
颠覆 AI 开发效率!开源工具一站式管控 30+大模型ApiKey,秘钥付费+负载均衡全搞定

颠覆 AI 开发效率!开源工具一站式管控 30+大模型ApiKey,秘钥付费+负载均衡全搞定

  颠覆 AI 开发效率!开源工具一站式管控 30+ 大模型 ApiKey,秘钥付费 + 负载均衡全...
零成本上线!用 Hugging Face免费服务器+Docker 快速部署HertzBeat 监控平台

零成本上线!用 Hugging Face免费服务器+Docker 快速部署HertzBeat 监控平台

零成本上线!用 Hugging Face 免费服务器 +Docker 快速部署 HertzBeat 监控平台 ...