aws-go-sdk并发分片上传封装

目前的话,aws 官方的go sdk只提供了分片的操作方法,具体的实现还得自己去组合方法,网上能够找到很多相关的例子,但是我觉得都不太性能或者太复杂,这里我只是对分片上传包装了一下,上传是异步的,如果需要同步可以自己拆分一下

相关接口

  • 创建分片上传
1
func (c *S3) CreateMultipartUpload(input *CreateMultipartUploadInput)
  • 上传单个分片
1
func (c *S3) UploadPart(input *UploadPartInput) (*UploadPartOutput, error)
  • 分片上传完成,通知合成文件
1
func (c *S3) CompleteMultipartUpload(input *CompleteMultipartUploadInput)
  • 中分片上传 (上传失败调用来删除已上传的分片)
1
func (c *S3) AbortMultipartUpload(input *AbortMultipartUploadInput) (*AbortMultipartUploadOutput, error)

文档入口方法

1
func (a *AwsMultiPartUpload) AwsMultipartUpload(svc *s3.S3) error

使用例子

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
func main() {
sess := session.Must(session.NewSession(&aws.Config{
Endpoint: aws.String(Endpoint), //地域
Region: aws.String(region), //地区
DisableSSL: aws.Bool(false), // ssl支持
Credentials: credentials.NewStaticCredentials(AccessKeyId, AccessKeySecret, ""), //令牌
}))

svc := s3.New(sess)

// 需要引入文件或者直接复制使用
upload := &AwsMultiPartUpload{
Bucket: BucketName,
FilePath: filePath,
FileSize: fileSize,
FileKey: fileKey,
FileMime: fileMime,
PartSize: partSize,
}
err = upload.AwsMultipartUpload(svc)
}

结构数据

1
2
3
4
5
6
7
8
9
10
11
12
13
type AwsMultiPartUpload struct {
Bucket string
FilePath string
FileKey string
FileMime string
FileSize int64
PartSize int64 // 分片大小
chunkCount int // 分块个数
Tries int // 单个分片上传尝试次数
Goroutine int // 线程
CompletedParts []*s3.CompletedPart // 保存分片数据
mux sync.Mutex
}

所有的方法接受者均为 AwsMultiPartUpload, 所以需要先初始化数据 upload := &AwsMultiPartUploadupload := new(AwsMultiPartUpload) 是一样的。

并发线程

默认是八个,需要更多线程完全可以自己修改。

单个分片上传重试

默认重试次数为3,这个也可以在修改的时候直接设置

分块大小

就是分片上传切分成多大一个的块,默认是 4M,这个也可以设置

实现方法代码

github 或者如下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
package golang

import (
"bytes"
"errors"
"github.com/aws/aws-sdk-go/aws"
"github.com/aws/aws-sdk-go/aws/awserr"
"github.com/aws/aws-sdk-go/service/s3"
"io/ioutil"
"math"
"os"
"sync"
)

type AwsMultiPartUpload struct {
Bucket string
FilePath string
FileKey string
FileMime string
FileSize int64
PartSize int64 // 分片大小
chunkCount int // 分块个数
Tries int // 单个分片上传尝试次数
Goroutine int // 线程
CompletedParts []*s3.CompletedPart // 保存分片数据
mux sync.Mutex
}

//func NewAwsMultiPartUpload() *AwsMultiPartUpload {
// return &AwsMultiPartUpload{
// Goroutine: 8,
// Tries: 3,
// PartSize: 1 * 1024 * 1024,
// }
//}

func (a *AwsMultiPartUpload) AwsMultipartUpload(svc *s3.S3) error {
if 16 < a.Goroutine || 0 >= a.Goroutine {
a.Goroutine = 8 // 不允许设置过大
}
if a.Bucket == "" || a.FilePath == "" {
return errors.New("未设置必须参数")
}
if a.Tries == 0 {
a.Tries = 3
}
if a.PartSize == 0 {
a.PartSize = 4 * 1024 * 1024
}
if svc == nil {
return errors.New("svc 错误")
}
a.chunkCount = a.divideCeil(a.FileSize, a.PartSize) // 分块个数
if len(a.CompletedParts) == 0 { //初始化切片,长度为分块个数,后面分片排序需要用到
a.CompletedParts = make([]*s3.CompletedPart, a.chunkCount)
}
return a.awsMultiPartUpload(svc)
}

func (a *AwsMultiPartUpload) awsMultiPartUpload(svc *s3.S3) error {
file, err := os.Open(a.FilePath)
if err != nil {
return err
}
defer file.Close()
buffer := make([]byte, a.FileSize) // 使用一个文件大小长度的byte切片存储上传的文件数据
buffer, _ = ioutil.ReadAll(file) // ioutil 读取速度快!

initData, err := a.initMultipartUpload(svc) // 初始化分块
if err != nil {
return err
}
errChan := make(chan error, a.Goroutine) // 创建通道
for i := 0; i != a.Goroutine; i++ { //通道置空,阻塞八个并发
errChan <- nil
}

wg := &sync.WaitGroup{}
for i := 0; i != a.chunkCount; i++ {
//println(i)
wg.Add(1)
go func(pos int) { // 第几个块,取偏移量
defer wg.Done() // 完成分片,计数器减一
start := a.PartSize * int64(pos) // 起始地址
offset := a.PartSize * int64(pos+1) // 偏移地址
if pos == a.chunkCount-1 { // 最后一个块,偏移地址为文件长度
offset = a.FileSize
}
err := a.uploadPart(svc, initData, buffer[start:offset], pos)
errChan <- err
}(i)
uploadErr := <-errChan // 接收通道值
if uploadErr != nil {
err = uploadErr
break //上传出错,需要取消上传
}
}
wg.Wait() // 等待任务完成

select { //检查一下是否有剩余的通道未接收,然后检查
case e := <-errChan:
if e != nil {
err = e
}
default:
err = nil
}
close(errChan) // 关闭通道
if err != nil { // 处理之前的错误
_, err := a.abortMultipartUpload(svc, initData)
if err != nil {
//fmt.Println(resp)
return err
}
}

_, err = a.completeMultipartUpload(svc, initData, a.CompletedParts) // 分片上传完成
return err
}

// 初始化分片上传
func (a *AwsMultiPartUpload) initMultipartUpload(svc *s3.S3) (*s3.CreateMultipartUploadOutput, error) {
return svc.CreateMultipartUpload(&s3.CreateMultipartUploadInput{ // 直接返回初始化分片上传的数据
Bucket: aws.String(a.Bucket),
Key: aws.String(a.FileKey),
ContentType: aws.String(a.FileMime),
})
}

// 上传单个分片
func (a *AwsMultiPartUpload) uploadPart(svc *s3.S3, resp *s3.CreateMultipartUploadOutput, fileByte []byte, pos int) (err error) {
tryNum := 0

for tryNum < a.Tries {
uploadResult, err := svc.UploadPart(&s3.UploadPartInput{
Body: bytes.NewReader(fileByte),
Bucket: resp.Bucket,
Key: resp.Key,
PartNumber: aws.Int64(int64(pos)),
UploadId: resp.UploadId,
ContentLength: aws.Int64(int64(len(fileByte))),
})
if err != nil {
if tryNum == a.Tries {
if aerr, ok := err.(awserr.Error); ok {
return aerr
}
return err
}
//fmt.Printf("Retrying to upload part #%v\n", pos)
tryNum++
} else {
a.mux.Lock() // 上锁,避免数据出错
temp := &s3.CompletedPart{
ETag: uploadResult.ETag,
PartNumber: aws.Int64(int64(pos)),
}
a.CompletedParts[pos] = temp
//println(a.CompletedParts[pos])
a.mux.Unlock() //解锁
return nil // 不返回的话会无限循环
}
}
return nil
}

// 分片上传完成,请求完成
func (a *AwsMultiPartUpload) completeMultipartUpload(svc *s3.S3, resp *s3.CreateMultipartUploadOutput, completedParts []*s3.CompletedPart) (*s3.CompleteMultipartUploadOutput, error) {
return svc.CompleteMultipartUpload(&s3.CompleteMultipartUploadInput{ // 完成分片上传,发请求合成文件
Bucket: resp.Bucket,
Key: resp.Key,
UploadId: resp.UploadId,
MultipartUpload: &s3.CompletedMultipartUpload{Parts: completedParts},
})
}

// 分片上传出错,中断上传
func (a *AwsMultiPartUpload) abortMultipartUpload(svc *s3.S3, resp *s3.CreateMultipartUploadOutput) (*s3.AbortMultipartUploadOutput, error) {
return svc.AbortMultipartUpload(&s3.AbortMultipartUploadInput{ // 分片上传失败调用取消分片上传
Bucket: resp.Bucket,
Key: resp.Key,
UploadId: resp.UploadId,
})
}

func (a *AwsMultiPartUpload) divideCeil(inta, intb int64) int {
div := float64(inta) / float64(intb)
c := math.Ceil(div)
return int(c)
}

评论


:D 一言句子获取中...