BeautifulSoup: 2007年8月アーカイブ

単純なものとして、BeautifulSoupを使ったHTML解析で
Googleの表示順位を取得するスクリプトを作ってみた。

んだから、もちろんBeautifulSoupと初期設定は必須。
そして、もちろんノンオブジェクト指向。

設定で指定した検索クエリ(q)を使用し、
Googleで検索結果を取得。
その中からURL(s)を発見したら表示するというもの。

環境により違いがあるようだが、Pythonをインストールした
初期設定のままだと、'ascii'などが内部エンコーディングに使用されるようだ。

これにより、日本語の扱いで

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0: ordinalnot in range(128)

などとエラーを吐く場合も多々あるので
以下の箇所の設定を変更する必要がある。

このアーカイブについて

このページには、2007年8月以降に書かれたブログ記事のうちBeautifulSoupカテゴリに属しているものが含まれています。

前のアーカイブはBeautifulSoup: 2007年7月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。