LFS ist nicht die einzige Antwort
Git LFS lost ein Problem, fuhrt aber andere ein: zusatzliche Infrastruktur, Hosting-Gebuhren.
Object Storage mit Manifesten
# assets.json
{
"logo.psd": {
"sha256": "8a1b...",
"url": "s3://my-bucket/assets/8a1b.psd"
}
}
aws s3 cp s3://my-bucket/assets/8a1b.psd ./logo.psd
git-annex
git annex init
git annex add big-file.psd
git commit -m "Add big-file via annex"
git annex copy --to=cloud-remote
DVC fur ML-Datasets
dvc init
dvc add data/raw
git add data/raw.dvc .gitignore
git commit -m "Track raw dataset with DVC"
dvc push
Submodule, die auf ein Binar-Repo zeigen
git submodule add https://example.com/assets-repo assets
git commit -m "Add assets submodule"
Build-Zeit-Generierung
npm run build:assets
# .gitignore: dist/
Sparse Checkout fur partielle Klone
git clone --filter=blob:none --sparse <url>
cd repo
git sparse-checkout set src docs
Auswahl
- Wenige Binaries → Object Storage Manifest.
- Viele Binaries → git-annex oder LFS.
- Datasets und ML-Modelle → DVC.
- Generierter Inhalt → Build-Pipeline.