[Python] 文字クラスを使った範囲指定でunicode型を検索
2008年10月1日
コードだけ書きなぐりますが、
例えば、ユニコード型文字列の内、漢字のみ(”一”~”龥”)をマッチさせる場合
例えば、ユニコード型文字列の内、漢字のみ(”一”~”龥”)をマッチさせる場合
l = re.findall(u"[\u4e00-\u9fa5]+", "ひらがな漢字カタカナascii".decode("utf-8")) print l[0].encode("utf-8") # -> "漢字"
他の言語と違ってUnicode型というデータ型があるので明瞭極まりない!
気持ちいいねぇ、お前さん