[新製品・サービス]

インターネット・アカデミー、Pythonで開発する「Webスクレイピング講座」を開始

2022年10月11日(火)日川 佳三(IT Leaders編集部)

Web専門の教育講座を運営するインターネット・アカデミーは2022年10月11日、オンライン教育プログラム「Webスクレイピング講座」を開始した。Webページの情報を自動で収集する“Webスクレイピング”のロボットを、Python言語で開発できるようにする。Webサイトの情報を分析する需要の高まりを受けて同講座を開始した。授業回数は3回で、時間は6~12時間。受講料(税込み)は8万9100円。

 インターネット・アカデミーの「Webスクレイピング講座」は、Webページの情報を自動で収集する“Webスクレイピング”のロボットを、Python言語で開発できるようにするオンライン講座である。Pythonの基本的な文法をある程度理解できている人を対象に、代表的なWebスクレイピングの方法を3回に分けて講義する(授業時間は6~12時間)。

 初級編、中級編、上級編の3回に分けて講義する。

RPA概論/一般的なWebサイトの情報収集(初級編)
RPA概論
Webスクレイピング導入
Beautiful Soup
CSSセレクター(HTMLとCSSの概要)
Webスクレイピング実践
会員サイトの情報収集(中級編)
ログイン認証を必要とするサイトのスクレイピング
Seleniumを利用した自動ページ遷移
会員サイトの情報の自動取得
正規表現を用いたデータ取得(上級編)
正規表現を扱うPython の命令
正規表現で郵便番号(〒)をチェック
正規表現で電話番号(TEL)をチェック
Webスクレイピングを用いたデータ集計

 初級編では、RPAの概論と、一般的なWebサイトの情報収集について学ぶ。HTMLとCSSの概要や、HTMLコンテンツからデータを取得するWebスクレイピング用のPythonライブラリ「Beautiful Soup」の使い方や実践などで構成する。

 中級編では、ログイン処理をともなう会員サイトの情報収集方法を学ぶ。Webアプリケーションの機能テストツール「Selenium」を使ってWebブラウザを自動で操作する方法を学ぶ。上級編では、取得したデータに含まれる文字列を正規表現で検索する。Pythonで正規表現を使う方法や、実際に郵便番号や電話番号を正規表現で抽出するやり方などを学ぶ。

 実務で役立つノウハウを習得できるように、営業員の売上データを集計するシナリオを演習する。正規表現を使ってWebスクレイピングを利用したデータ集計が完了するまでの一連の流れを習得する。

関連キーワード

インターネット・アカデミー / Python / Webスクレイピング / 教育プログラム

関連記事

トピックス

[Sponsored]

インターネット・アカデミー、Pythonで開発する「Webスクレイピング講座」を開始Web専門の教育講座を運営するインターネット・アカデミーは2022年10月11日、オンライン教育プログラム「Webスクレイピング講座」を開始した。Webページの情報を自動で収集する“Webスクレイピング”のロボットを、Python言語で開発できるようにする。Webサイトの情報を分析する需要の高まりを受けて同講座を開始した。授業回数は3回で、時間は6~12時間。受講料(税込み)は8万9100円。

PAGE TOP