Mais conteúdo relacionado
Semelhante a 人のブラウザでクロールする (20)
Mais de LINE Corporation (20)
人のブラウザでクロールする
- 5. headless mode のテスト以外の使い方
- xvfb などの仮想デスクトップを必要とせず、一般的なユーザ
の PC で以下のような処理ができるようになります
- スクリーンショットの生成
- レンダリング結果の利用
- 文字組をブラウザ側に一任できる
- リンクの座標なども利用できる
- Web アプリケーションの操作の自動化
- 7. 解決策
- 多くの問題はあるだろうが、エンドユーザの PC で headless
browser が動くなら、それを貸してもらえばいいんじゃない?
- 多くの問題はあるだろうが、無料!
- 多くの問題はあるだろうが、認証が必要なページにもアク
セスできる
=「人のブラウザでクロールする」ことで
多くの新しい問題を抱えながらも今の問題を解決できる!
- 13. Headless Chrome はどう?
- Headless Chrome、ユーザプロファイルを使いません
- プロファイルのディレクトリを指定する --user-data-dir オ
プションは headless mode では使えない
- それ以外にも、コンテクストの保存はできない仕様
- https://bugs.chromium.org/p/chromium/issues/detail?id=61793
1
- なので、Chrome を利用する場合はログインの自動化も込みで実装
する必要がありますね。
- 14. Firefox headless mode はどう?
- まだ beta だけど、 slimerjs を使うと簡単に試せる。
- https://adriftwith.me/coding/2017/04/21/headless-slimerjs-with-firefox/
- -profile オプションでユーザプロファイルを設定できる。
- その上で、ブラウザのコンテクストで任意の JS を実行できる。
- これが将来的に使えるかどうかはちょっと不透明な気はします。
- 18. 多くの問題
- 運用上のリスク
- 普通の人は、PC の電源を落としてから寝る…
- コストの多くがユーザにふりかかる
- クローラでよくある法的リスクもろもろがユーザにふりかか
る
- 著作権
- 威力業務妨害
- クロール対象サービスの規約違反
- 契約において、ユーザに対する十分な説明が必要