skillup

技術ブログ

Java

Javaでの文字コード判定、変換

投稿日:

Javaにて文字コード判定の処理を書きます。

通常の文字コードの判定、変換

まだ処理が追いついてないです(爆)

ちょっとリンクだけ張っておきます。

http://blog.enjoyxstudy.com/entry/20051214/p1

http://qiita.com/pcpDev/items/0c83712e93f8f972f208

http://qiita.com/SAM_tak/items/c64108d472da257dd93a

http://d.hatena.ne.jp/cero-t/20100204/1265302329

ファイルの文字コード判定、変換

ファイルの文字コード変換はInputStreamReaderの引数に読み込ませればよいのですが、問題なのはどの文字コードかわからない場合です。

この場合、文字コード判定をし、変換自体はInputStreamReaderで行います。

それではファイルの文字コードの判定を行うライブラリを紹介します。

juniversalchardet

URL http://java.akjava.com/library/juniversalchardet

ダウンロード

いつも通りmavenで行います。

下記をpomに記述します。

文字コード変換処理

文字コードは下記の処理で変換を行います。

下記のresultが文字コードになります。

注意事項

文字コードを判定するだけなら上記でよいのですが、文字コードの判定と同じInputStreamReaderを使うと文字自体が読めなくなります。

文字コード判定と実際にデータを読み込むストリームは分けるようにしましょう。

 参考リンク集

http://typea.info/tips/wiki.cgi?page=Java+%A5%D5%A5%A1%A5%A4%A5%EB%A4%CE%CA%B8%BB%FA%A5%B3%A1%BC%A5%C9%A4%F2%C8%BD%CA%CC%A4%B9%A4%EB

 

-Java
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

JSPでのカスタムタグ

前回のインク―ドですが、文字列以上の情報を渡すことはできませんでした。 いろいろ調べたり、上司に聞いてみるとカスタムタグという独自のタグを作る機能があるとのことでさっそく調査。 Contents1 カ …

no image

Listの簡便な書き方

Listに要素を加えるときに、スタンダードな書き方は

になりますが、もっとほかにもいろいろな書きがあります。 特にオブジェクトの追加の …

no image

ApacheCommonsのライブラリ

先日のエントリーでBeanUtilsが非常に使えるという話をしたのですが、それ以外にもApacheCommonsのライブラリには使えるものがかなりあります。 かなりあります、というかなぜ今まで使ってな …

no image

BeanValidationの動的メッセージ出力について

JSF+ManagedBeanでは基本的にbeanValidationを使ってバリデーションを行い、エラーメッセージなどはプロパティファイルで管理するのが一般的です。 アノテーションなどを付与してあげ …

no image

型パラメータに関して その2

Javaでオブジェクト指向に基づいたコーディングをするために必須であり、最初の難関だったのが型パラメータでした。 Contents1 型パラメータが必要なケース2 型パラメータの制限3 クラスインスタ …