iconv -f gbk -t utf8 shujujiegou.txt >shujujiegou.txt.utf8
你是想要在linux下显示汉字吧,输入下面的指令就行了,记得改文件名啊,别无脑复制iconv -f gbk -t utf8 shujujiegou.txt >shujujiegou.txt.utf8
输入可以采用GB2312或者GBK编码,如果繁体,就用UTF-8读入汉字,从文件或者标准输入读,每次读一个字节,依次存入数组
如果可以确定是全部汉字,那么可以一次读入两个字节
结束符可以用\0,但是由于双字节汉字编码低位可能是0 所以结束符要用双\0
针对英文字符和汉字混合的情况,可以这样判断
每次读入一个字符,如果该字符大于0x80 则这是一个汉字的高位,继续读入并存储
如果该字符小于0x80 则这是一个英文字符,直接存储
do
read one byte
check
if >0x80 read next
save
while(!end)
大致这样
直到读入约定的end标志,可以是\n 可以是eof