【スプレイピング】PythonでWebページの画像をすべて保存する方法。【楽に画像収集】

※このサイトの記事内では広告を掲載している場合があります。

今回は、PythonでWebページ上の画像をすべて保存する方法を解説します。

環境はGoogle Colaboratoryです。ご自身のGoogle Driveに自動保存するようにプログラムを作成したので少しでも参考になれば幸いです。

無料オンライン相談を活用しよう!

Pythonというプログラミング言語は機械学習の人気の高まりなどもあり、様々なスクールが無料説明会を開催しています。

その中でも「Freeks(フリークス)|業界初!10,780円のサブスク型プログラミングスクール」がオススメです。Pythonを効率よく学びたいという方はまずは適性を知るためにも無料説明会を利用しましょう。

無料説明会を参加してみる!

実行環境

今回は「Google Colaboratory」を使います。本プログラムはローカルの環境でも実行可能ですが、モジュールのインポート、ファイルパス等適宜変更する必要があります。

スクレイピングに関して、以下の記事も参考になると思います。

参考:PythonでWebページの見出しをすべて抽出する方法!【スクレイピング】CSVファイルからの抽出方法も解説!
参考:【PyScript】HTMLファイルに書くPythonを徹底解説!ローカルサーバでWebブラウザで実行してみよう!

ソースコード

実行すると保存される画像とそのパスが出力されます。

保存場所を指定するには、ソースコードの7行目「SAVE_DIR 」を適宜変更してください。

ローカル環境で実行する場合はコマンドプロンプト等で以下のプログラムを実行してください。

実行結果

このように、Google Colobで実行した場合、マイドライブ/imagesに保存されます。

注意点は、本文中の画像のみならず、広告なども画像として保存されることがあります。これは「img」をHTMLタグに含んでいるものをすべて抽出するプログラムとなっているためです。

まとめ

今回は、PythonでWebページ上の画像をすべて保存する方法を解説しました。

実は今回のサンプルコードはChatGPTに作成してもらい、ちょっと修正したのみのものですが、しっかりと使えるソースコードでした。

少しでも参考になれば幸いです。

無料の説明会を有効活用しよう!

独学での学習は孤独感を感じやすく挫折してしまう初心者も多いです。また、参考書を購入しても全く読む気にならないという方も多いはずです。

それでも、なんとかPythonの勉強を行い、高スキルなエンジニアを目指したいという方は無料で受けられるオンライン説明会に参加してみることも一つの手です。

Pythonというプログラミング言語は機械学習の人気の高まりなどもあり、様々なスクールが無料説明会を開催しています。

その中でも「Freeks(フリークス)|業界初!10,780円のサブスク型プログラミングスクール」がオススメです。Pythonを効率よく学びたいという方はまずは適性を知るためにも無料説明会を利用しましょう。

無料説明会を参加してみる!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA