SERVICE こんな事ができます

CNTACT ご相談はお気軽に

 ABOUT US こんな会社です



2009/11/13 by マッチー

mb_convert_encodingで変換できない文字の対処

EUC-JPで書かれている文字列をUTF-8に直したいと思ったら、この記事のタイトルにも書いてあるmb_convert_encodingを使えばエンコードできる。

ただし、ちょっと気をつけておかなければならないのは、中には変換できない文字もあるということ。

たとえば、①とかがそう。これをEUC-JPからUTF-8に変換すると、?になってしまう。

この手の文字が文字列に入っている場合は、↓こんな感じにすれば変換は可能っぽい。

いったんEUCJP-winに変換してからUTF-8に変換するわけですな。

とりあえず僕はこんな感じで対処してますけど、しかしソースとしてはちょっとかっこわるいような・・・?

何かもっとうまい(かっこいい)方法はないものでしょうか・・・何か1発でできるような。

あと、確認はしてないけど、この変換だとMacで見た場合はどうなるのかしら。