旧それなりブログの跡地、画像やスタイルやJSなどが壊れてることがあります。

[Python] 文字クラスを使った範囲指定でunicode型を検索

2008年10月1日

コードだけ書きなぐりますが、
例えば、ユニコード型文字列の内、漢字のみ(”一”~”龥”)をマッチさせる場合

l = re.findall(u"[\u4e00-\u9fa5]+", "ひらがな漢字カタカナascii".decode("utf-8"))
print l[0].encode("utf-8") # -> "漢字"

他の言語と違ってUnicode型というデータ型があるので明瞭極まりない!
気持ちいいねぇ、お前さん

【参考リンク】
Wikipedia – Unicode
ちなみに を含むUnicode表。