skillup

技術ブログ

Java

Javaでの文字コード判定、変換

投稿日:

Javaにて文字コード判定の処理を書きます。

通常の文字コードの判定、変換

まだ処理が追いついてないです(爆)

ちょっとリンクだけ張っておきます。

http://blog.enjoyxstudy.com/entry/20051214/p1

http://qiita.com/pcpDev/items/0c83712e93f8f972f208

http://qiita.com/SAM_tak/items/c64108d472da257dd93a

http://d.hatena.ne.jp/cero-t/20100204/1265302329

ファイルの文字コード判定、変換

ファイルの文字コード変換はInputStreamReaderの引数に読み込ませればよいのですが、問題なのはどの文字コードかわからない場合です。

この場合、文字コード判定をし、変換自体はInputStreamReaderで行います。

それではファイルの文字コードの判定を行うライブラリを紹介します。

juniversalchardet

URL http://java.akjava.com/library/juniversalchardet

ダウンロード

いつも通りmavenで行います。

下記をpomに記述します。

文字コード変換処理

文字コードは下記の処理で変換を行います。

下記のresultが文字コードになります。

注意事項

文字コードを判定するだけなら上記でよいのですが、文字コードの判定と同じInputStreamReaderを使うと文字自体が読めなくなります。

文字コード判定と実際にデータを読み込むストリームは分けるようにしましょう。

 参考リンク集

http://typea.info/tips/wiki.cgi?page=Java+%A5%D5%A5%A1%A5%A4%A5%EB%A4%CE%CA%B8%BB%FA%A5%B3%A1%BC%A5%C9%A4%F2%C8%BD%CA%CC%A4%B9%A4%EB

 

-Java
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

JavaFXの基礎

JavaFXの基礎について書きます。

no image

Streamについて

Java8で導入されたStreamですが、名前はしっていたものの、使い方がわからず放置していました。 これを機に調べたのですが、コレクションフレームワークの拡張のようですね。 特徴としては以下のような …

no image

mavenでのjarファイル作成

ここ半年Javaを触っていますが、9割以上がWEBアプリでバッチ系のものを作る機会から外れていました。 今回バッチを作っており、IDEでは動くのにいざコンソールで動かそうと思ったら動かないということが …

no image

正規表現(判定:置換:抽出)

Javaの正規表現を利用した置換、抽出について書きます。 Contents1 正規表現の基本ルール2 Javaでの正規表現の処理の流れ3 実処理3.1 判定3.2 抽出3.3 置換 正規表現の基本ルー …

no image

入出力操作

Javaの出力処理について書きます。 下記リンクが非常に詳しかったので、これをもとにまとめてみたんですが、咀嚼できてないっぽい・・・・ もう1~2度修正がひつようかも。 http://www.arti …