replicate · tempusfrangit · Feb 23, 2024 · Feb 26, 2024 · Feb 26, 2024 · nickstenning
diff --git a/pkg/download/buffer.go b/pkg/download/buffer.go
@@ -2,6 +2,7 @@ package download
 
 import (
 	"context"
+	"errors"
 	"fmt"
 	"io"
 	"net/http"
@@ -14,6 +15,7 @@ import (
 
 	"github.com/replicate/pget/pkg/client"
 	"github.com/replicate/pget/pkg/logging"
+	"github.com/replicate/pget/pkg/multireader"
 )
 
 const defaultMinChunkSize = 16 * humanize.MiByte
@@ -65,19 +67,34 @@ type firstReqResult struct {
 	err      error
 }
 
+func readBody(reader *multireader.BufferedReader, resp *http.Response) error {
+	expectedBytes := resp.ContentLength
+	_ = reader.SetSize(expectedBytes)
+	n, err := reader.ReadFrom(resp.Body)
+	if errors.Is(err, io.EOF) {
+		reader.Err = fmt.Errorf("error reading response for %s: %w", resp.Request.URL.String(), err)
+		return reader.Err
+	}
+	if n != expectedBytes {
+		reader.Err = fmt.Errorf("downloaded %d bytes instead of %d for %s", n, expectedBytes, resp.Request.URL.String())
+		return reader.Err
+	}
+	return nil
+}
+
 func (m *BufferMode) Fetch(ctx context.Context, url string) (io.Reader, int64, error) {
 	logger := logging.GetLogger()
 
-	br := newBufferedReader(m.minChunkSize())
+	br := multireader.NewBufferedReader(m.minChunkSize())
 
 	firstReqResultCh := make(chan firstReqResult)
 	m.queue.submit(func() {
 		m.sem.Go(func() error {
 			defer close(firstReqResultCh)
-			defer br.done()
+			defer br.Done()
 			firstChunkResp, err := m.DoRequest(ctx, 0, m.minChunkSize()-1, url)
 			if err != nil {
-				br.err = err
+				br.Err = err
 				firstReqResultCh <- firstReqResult{err: err}
 				return err
 			}
@@ -95,8 +112,7 @@ func (m *BufferMode) Fetch(ctx context.Context, url string) (io.Reader, int64, e
 				return err
 			}
 			firstReqResultCh <- firstReqResult{fileSize: fileSize, trueURL: trueURL}
-
-			return br.downloadBody(firstChunkResp)
+			return readBody(br, firstChunkResp)
 		})
 	})
 
@@ -127,7 +143,7 @@ func (m *BufferMode) Fetch(ctx context.Context, url string) (io.Reader, int64, e
 		numChunks = m.maxConcurrency()
 	}
 
-	readersCh := make(chan io.Reader, m.maxConcurrency()+1)
+	readersCh := make(chan *multireader.BufferedReader, m.maxConcurrency()+1)
 	readersCh <- br
 
 	startOffset := m.minChunkSize()
@@ -153,23 +169,23 @@ func (m *BufferMode) Fetch(ctx context.Context, url string) (io.Reader, int64, e
 				end = fileSize - 1
 			}
 
-			br := newBufferedReader(end - start + 1)
+			br := multireader.NewBufferedReader(end - start + 1)
 			readersCh <- br
 
 			m.sem.Go(func() error {
-				defer br.done()
+				defer br.Done()
 				resp, err := m.DoRequest(ctx, start, end, trueURL)
 				if err != nil {
-					br.err = err
+					br.Err = err
 					return err
 				}
 				defer resp.Body.Close()
-				return br.downloadBody(resp)
+				return readBody(br, resp)
 			})
 		}
 	})
 
-	return newChanMultiReader(readersCh), fileSize, nil
+	return multireader.NewMultiReader(readersCh), fileSize, nil
 }
 
 func (m *BufferMode) DoRequest(ctx context.Context, start, end int64, trueURL string) (*http.Response, error) {

diff --git a/pkg/download/buffered_reader.go b/pkg/download/buffered_reader.go
diff --git a/pkg/download/chan_multi_reader.go b/pkg/download/chan_multi_reader.go
diff --git a/pkg/download/consistent_hashing.go b/pkg/download/consistent_hashing.go
@@ -16,6 +16,7 @@ import (
 	"github.com/replicate/pget/pkg/config"
 	"github.com/replicate/pget/pkg/consistent"
 	"github.com/replicate/pget/pkg/logging"
+	"github.com/replicate/pget/pkg/multireader"
 )
 
 type ConsistentHashingMode struct {
@@ -104,15 +105,15 @@ func (m *ConsistentHashingMode) Fetch(ctx context.Context, urlString string) (io
 		return m.FallbackStrategy.Fetch(ctx, urlString)
 	}
 
-	br := newBufferedReader(m.minChunkSize())
+	br := multireader.NewBufferedReader(m.minChunkSize())
 	firstReqResultCh := make(chan firstReqResult)
 	m.queue.submit(func() {
 		m.sem.Go(func() error {
 			defer close(firstReqResultCh)
-			defer br.done()
+			defer br.Done()
 			firstChunkResp, err := m.DoRequest(ctx, 0, m.minChunkSize()-1, urlString)
 			if err != nil {
-				br.err = err
+				br.Err = err
 				firstReqResultCh <- firstReqResult{err: err}
 				return err
 			}
@@ -125,7 +126,7 @@ func (m *ConsistentHashingMode) Fetch(ctx context.Context, urlString string) (io
 			}
 			firstReqResultCh <- firstReqResult{fileSize: fileSize}
 
-			return br.downloadBody(firstChunkResp)
+			return readBody(br, firstChunkResp)
 		})
 	})
 	firstReqResult, ok := <-firstReqResultCh
@@ -173,7 +174,7 @@ func (m *ConsistentHashingMode) Fetch(ctx context.Context, urlString string) (io
 		chunksPerSlice = append([]int64{0}, EqualSplit(int64(concurrency), totalSlices-1)...)
 	}
 
-	readersCh := make(chan io.Reader, m.maxConcurrency()+1)
+	readersCh := make(chan *multireader.BufferedReader, m.maxConcurrency()+1)
 	readersCh <- br
 
 	logger.Debug().Str("url", urlString).
@@ -213,10 +214,10 @@ func (m *ConsistentHashingMode) Fetch(ctx context.Context, urlString string) (io
 				chunkStart := startFrom
 				chunkEnd := startFrom + chunkSize - 1
 
-				br := newBufferedReader(chunkSize)
+				br := multireader.NewBufferedReader(chunkSize)
 				readersCh <- br
 				m.sem.Go(func() error {
-					defer br.done()
+					defer br.Done()
 					logger.Debug().Int64("start", chunkStart).Int64("end", chunkEnd).Msg("starting request")
 					resp, err := m.DoRequest(ctx, chunkStart, chunkEnd, urlString)
 					if err != nil {
@@ -233,20 +234,20 @@ func (m *ConsistentHashingMode) Fetch(ctx context.Context, urlString string) (io
 							resp, err = m.FallbackStrategy.DoRequest(ctx, chunkStart, chunkEnd, urlString)
 						}
 						if err != nil {
-							br.err = err
+							br.Err = err
 							return err
 						}
 					}
 					defer resp.Body.Close()
-					return br.downloadBody(resp)
+					return readBody(br, resp)
 				})
 
 				startFrom = startFrom + chunkSize
 			}
 		}
 	})
 
-	return newChanMultiReader(readersCh), fileSize, nil
+	return multireader.NewMultiReader(readersCh), fileSize, nil
 }
 
 func (m *ConsistentHashingMode) DoRequest(ctx context.Context, start, end int64, urlString string) (*http.Response, error) {