自動Webスクレイピングn8nワークフロー構築手順
- 配布ファイルのインポート
本ページ下部でダウンロードできるJSONファイルを、n8nワークフロー作成画面の右上3点アイコン>Import From File をクリックして読み込んでください。 - Google Sheets・Google Gemini認証設定
まずGoogle SheetsノードとGemini AIノードには、Googleアカウント連携(OAuth)認証が必要です。Google Sheetsは編集権限のあるスプレッドシートを事前作成し、ノード設定画面で認証情報を選択しましょう。
ワークフロー主要ノードの役割
- Manual Trigger:手動でワークフローを実行開始します。
- Edit Fields:URLやセレクター、取得件数(limit)など基本パラメータを一括管理。
- Code・Loop Over Items1:指定ページ数分の取得処理を自動生成。
- HTTP Request:リストページ(例:商品一覧)のHTMLソースを取得。
- HTMLノード:リンク要素や詳細データなどをCSSセレクター抽出。
- Split Out / Loop Over Items:抽出したリンク単位で逐次処理(詳細ページ取得)。
- HTTP Request1 → HTML1:各詳細ページから名称、説明文などコンテンツ抽出。
- AI Agent(Google Gemini Chat Model連携):説明文を自動要約。担当者向けの分かりやすい表現に自動変換します。
- Google Sheets:抽出・要約したデータを指定シートに自動追記。担当者間の共有や分析にも便利です。
詳細なCSSセレクターや転記先スプレッドシート情報は自身の用途に合わせ変更可能です。困ったときはサポート窓口(https://www.samox.co.jp/not-ai/)もご活用ください。