in

Comment extraire des liens de n’importe quelle page Web à l’aide de PowerShell

PowerShell 3 a beaucoup de nouvelles fonctionnalités, y compris de nouvelles fonctionnalités puissantes liées au Web. Ils simplifient considérablement l’automatisation du Web et aujourd’hui, nous allons vous montrer comment extraire chaque lien d’une page Web et éventuellement télécharger la ressource si vous le souhaitez.

Racler le Web avec PowerShell

Il existe deux nouvelles applets de commande qui facilitent l’automatisation du Web, Invoke-WebRequest, qui facilite l’analyse du contenu lisible par l’homme, et Invoke-RestMethod qui facilite la lecture du contenu lisible par machine. Puisque les liens font partie du HTML d’une page, ils font partie des éléments lisibles par l’homme. Tout ce que vous avez à faire pour obtenir une page Web est d’utiliser Invoke-WebRequest et de lui donner une URL.

Invoke-WebRequest –Uri ‘http://howtogeek.com’

Si vous faites défiler vers le bas, vous verrez que la réponse a une propriété de liens, nous pouvons utiliser la nouvelle fonctionnalité d’énumération des membres de PowerShell 3 pour les filtrer.

(Invoke-WebRequest –Uri ‘http://howtogeek.com’) .Liens

Comme vous pouvez le voir, vous récupérez beaucoup de liens, c’est là que vous devez utiliser votre imagination pour trouver quelque chose d’unique pour filtrer les liens que vous recherchez. Supposons que nous voulons une liste de tous les articles sur la première page.

((Invoke-WebRequest –Uri ‘http://howtogeek.com ‘) .Liens | Where-Object {$ _. Href-like « http * »} | Où classe -eq «titre»). Titre

Une autre grande chose que vous pouvez faire avec les nouvelles applets de commande est d’automatiser les téléchargements quotidiens. Jetons un œil à la récupération automatique de l’image du jour sur le site Web Nat Geo, pour ce faire, nous combinerons les nouvelles applets de commande Web avec Start-BitsTransfer.

$ IOTD = ((Invoke-WebRequest -Uri ‘http://photography.nationalgeographic.com/photography/photo-of-the-day/’).Liens | Où innerHTML -comme «* Télécharger le fond d’écran *»). Href
Start-BitsTransfer -Source $ IOTD -Destination C: IOTD

C’est tout ce qu’on peut en dire. Avez-vous des astuces de votre choix? Faites le nous savoir dans les commentaires.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Comment installer et configurer la sonnette vidéo SkyBell HD

Comment installer et configurer la sonnette vidéo SkyBell HD

Comment mettre à jour les applications Microsoft Office sur Windows 10 et Mac

Comment mettre à jour les applications Microsoft Office sur Windows 10 et Mac