skillup

技術ブログ

Java

Javaでの文字コード判定、変換

投稿日:2015年7月14日 更新日:

Javaにて文字コード判定の処理を書きます。

通常の文字コードの判定、変換

まだ処理が追いついてないです(爆)

ちょっとリンクだけ張っておきます。

JISAutoDetectって?

Javaで文字コード簡易判定

レビューで鍛えるJavaコーディング力 その7(文字コードチェック)

ファイルの文字コード判定、変換

ファイルの文字コード変換はInputStreamReaderの引数に読み込ませればよいのですが、問題なのはどの文字コードかわからない場合です。

この場合、文字コード判定をし、変換自体はInputStreamReaderで行います。

それではファイルの文字コードの判定を行うライブラリを紹介します。

juniversalchardet

URL http://java.akjava.com/library/juniversalchardet

ダウンロード

いつも通りmavenで行います。

下記をpomに記述します。

文字コード変換処理

文字コードは下記の処理で変換を行います。

下記のresultが文字コードになります。

注意事項

文字コードを判定するだけなら上記でよいのですが、文字コードの判定と同じInputStreamReaderを使うと文字自体が読めなくなります。

文字コード判定と実際にデータを読み込むストリームは分けるようにしましょう。

 参考リンク集

Java ファイルの文字コードを判別する

 

-Java
-

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

no image

CSVの入出力に関して

業務でCSVの入出力と格闘中。 まあよくある頻出の作業だったりするんですが、自前でやるとなかなか面倒です。 面倒なポイントとしては クオートのエスケープ カンマのエスケープ ヘッダーとの結合 ですかね …

no image

JPAでのリレーション(アノテーション使用)

JPAでリレーションを管理するとき、最初はアノテーションでやろうとしたんですが、結局やり方がわからずコンストラクタ式をかいて対処してました。 JPAでのリレーションに関して 外部キー制約があるやり方は …

no image

Javaのarraycopy

最近あまりJava自体には触っていないですが、資格の勉強をコツコツとすすめていることもあり、新たな発見もあります。 8ヶ月ぐらいJava書いていますが、arraycopyというメソッドをはじめてしりま …

no image

Git→Jenkinsの連携 その2

以前、このエントリーでGitとjenkinsの連携に関して書いたんですが、今回jenkinsとgitのソースが別環境にあるケースの構築をしたのでメモしておきます。 Contents1 Jenkinsで …

no image

ApacheCommonsのライブラリ

先日のエントリーでBeanUtilsが非常に使えるという話をしたのですが、それ以外にもApacheCommonsのライブラリには使えるものがかなりあります。 かなりあります、というかなぜ今まで使ってな …

アーカイブ