介紹
iconv 是 linux 上字元轉換的工具。因為有很多機會需要把簡體中文轉換為繁體中文。所以 google 介紹了這個好用的工具。
iconv 把指定的檔案從來源字集轉換到目的字集。以我的應用場景,我是需要從簡體中文轉換到繁體中文。
可以查到簡體在 iconv 是 gb2312 而繁體中文是 big5。但是以現在的作業系統來說我們的字集一般是 utf8。
所以實作的操作是先從 utf8 轉換為 gb2312 , 指後再從 gb2312 轉換為 big5 ,最後再從 big5 再轉回 utf8。
使用
列出目前支援的字集。
1 | $ iconv -l |
轉換字集
下面的例子是將檔案轉換為簡體。
1 | $ iconv -f utf8 -t gb2312 file.txt |
實際我們一般會如下進行轉換
1 | $ cat file.txt | iconv -f utf8 -t gb2312 | iconv -f gb2312 -t big5 | iconv -f big5 -t utf8 |