内部エンコーディングに使われるエンコードをUTF-8に設定する方法。

| | コメント(0) | トラックバック(2)

環境により違いがあるようだが、Pythonをインストールした
初期設定のままだと、'ascii'などが内部エンコーディングに使用されるようだ。

これにより、日本語の扱いで

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0: ordinalnot in range(128)

などとエラーを吐く場合も多々あるので
以下の箇所の設定を変更する必要がある。

Python 2.4:
"/Pythonをインストールしたディレクトリ"
もしくは、
"/Pythonをインストールしたディレクトリ/Lib"

Python 2.5の場合は
"/Pythonをインストールしたディレクトリ/Lib"

以下に、/site-packagesというディレクトリが用意されている。
そこに「sitecustomize.py」というファイルを作成し、
テキストエディタで、

import sys
sys.setdefaultencoding('utf-8')

と編集すると、内部エンコーディングにutf-8を使用できる。
文字エンコーディング等で詰まった場合は
まずここを確認してみると良いだろう。

トラックバック(2)

このブログ記事を参照しているブログ一覧: 内部エンコーディングに使われるエンコードをUTF-8に設定する方法。

このブログ記事に対するトラックバックURL: http://mt.blog-slime.com/mt-tb.cgi/10

Perl使いのPythonちゃん - BeautifulSoupでHTML解析 (2007年8月 2日 18:32)

BeautifulSoupが素晴らしいので 他にあまり解説サイトもないし、 簡単... 続きを読む

スクリプトを書く上で、日本語の扱いが最初のネックになる。 pythonは、基本U... 続きを読む

コメントする

このブログ記事について

このページは、adminが2007年8月 2日 17:58に書いたブログ記事です。

ひとつ前のブログ記事は「Perlで言う、join関数が使い難い。」です。

次のブログ記事は「PythonでGoogleの表示順位を取得」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。