Sok linkelt dokumentum letöltése egyszerűen

A minap szembe jött velem a hobbielektronika.hu oldalon egy bejegyzés, miszerint a német ELVjournal kiadmányai ingyen letölthetőek lettek. Nosza kihagyhatatlan lehetőség, hátha van bennük érdekesség, meg is néztem. Az oldalt böngészve ki is derült, hogy 1979-től kezdve vannak fent a magazinok, amit bizony kézzel letölteni embertelen feladat. De, mint ilyenkor általában, van egyszerűbb megoldás is. Ha nem a wget programot paraméterezem fel megfelelően (ami valahogy most csak nem sikerült, csak két lépésben), akkor megoldom powershellben a feladatot.Ez a következő kis szkript pont ezt a célt szolgálja, az oldalról letölti helyettem a 278 pdf fájlt, ami összességében több, mint 8GB helyet foglal.
$webClient = new-object System.Net.WebClient
$url = "https://de.elv.com/elvjournal/alle-ausgaben/"
$index = $webClient.DownloadString($url)
$pdffajlok = (Select-String -InputObject $index -Pattern '[a-z.:/_0-9]+pdf' -AllMatches).Matches.Value | Sort-Object -unique
foreach($pdf in $pdffajlok){
$hovatoltse = "f:\ebook\"
$helyifajl = [String]::Concat($hovatoltse,$pdf.Split('/')[-1])
$webClient.DownloadFile($pdf,$helyifajl)
}
A használata roppant egyszerű, csak a $hovatoltse váltzóban kell kicserélni a célkönyvtárat, s már szedi is lefele a dokumentumokat. Mindeközben nem ad magáról életjelet, nincs állapotsor, szóval az internetünk sebességétől függően kell türelmesnek lennünk.