Ich versuche, die Dateien für ein Projekt mit wget
herunterzuladen, da der SVN-Server für dieses Projekt nicht mehr läuft und ich nur über einen Browser auf die Dateien zugreifen kann. Die Basis-URLs für alle Dateien sind die gleichen
http://abc.tamu.edu/projects/tzivi/repository/revisions/2/raw/tzivi/ *
Wie kann ich wget
(oder ein ähnliches Tool) verwenden, um alle Dateien in diesem Repository herunterzuladen, wobei der Ordner "tzivi" der Stammordner ist und mehrere Dateien und Unterordner (bis zu 2 oder 3 Ebenen) darunter liegen?
Sie können dies in der Shell verwenden:
wget -r --no-parent http://abc.tamu.edu/projects/tzivi/repository/revisions/2/raw/tzivi/
Die Parameter sind:
-r //recursive Download
und
--no-parent // Don´t download something from the parent directory
Wenn Sie nicht den gesamten Inhalt herunterladen möchten, können Sie Folgendes verwenden:
-l1 just download the directory (tzivi in your case)
-l2 download the directory and all level 1 subfolders ('tzivi/something' but not 'tivizi/somthing/foo')
Und so weiter. Wenn Sie keine -l
-Option einfügen, verwendet wget
automatisch -l 5
.
Wenn Sie einen -l 0
einfügen, laden Sie das gesamte Internet herunter, da wget
jedem gefundenen Link folgt.
Sie können dies in einer Shell verwenden:
wget -r -nH --cut-dirs=7 --reject="index.html*" \
http://abc.tamu.edu/projects/tzivi/repository/revisions/2/raw/tzivi/
Die Parameter sind:
-r recursively download
-nH (--no-Host-directories) cuts out hostname
--cut-dirs=X (cuts out X directories)
verwenden Sie den Befehl
wget -m www.ilanni.com/nexus/content/
sie können diesen Befehl auch verwenden:
wget --mirror -pc --convert-links -P ./your-local-dir/ http://www.your-website.com
so erhalten Sie den genauen Spiegel der Website, die Sie herunterladen möchten
wget -r --no-parent URL --user=username --password=password
die letzten beiden Optionen sind optional, wenn Sie den Benutzernamen und das Kennwort zum Herunterladen haben. Andernfalls müssen Sie sie nicht verwenden.
Weitere Optionen finden Sie auch im Link https://www.howtogeek.com/281663/how-to-use-wget-the-ultimate-command-line-downloadingtool/
Das funktioniert:
wget -m -np -c --no-check-certificate -R "index.html*" "https://the-eye.eu/public/AudioBooks/Edgar%20Allan%20Poe%20-%2"