Python で文字数を数えるときの注意点

記事がなかったので、自分用メモを書くことにしました。 Pyhotn で文字数を数えようとして、 何気なく len() で文字を数えようとしたら微妙にアレだったのでメモ。

len() は str型 と unicode型 で微妙に利用目的?が違うらしく

  • str: バイト数
  • unicode: 文字数

なので、それぞれちゃんと使い分けてください、私。

いつもは全部 unicode でやっていたから、今回 str で弄ってるときにハマりそうになった。 というか、今回のも decode() してからゴニョゴニョしろって話なんですけどねw

下に例を示しておきます。