C语言是如何用16点阵方法输出汉字的?

Python019

C语言是如何用16点阵方法输出汉字的?,第1张

到目前为止,我们编写的C 程序,其用于人机交互的提示或菜单都是英文

的,那么如何在没有汉化的Turbo C 集成开发环境下编制显示汉字的程序呢?

解决这一编程问题,我们首先必须了解有关汉字编码及字库的知识。根据对汉字使

用频率的研究,可把汉字分成高频字(约100 个),常用字(约3000 个),次常用字(约4000 个),

罕见字(约8000 个)和死字(约45000 个),即正常使用的汉字达15000 个。我国1981 年公布

了《通讯用汉字字符集(基本集)及其交换码标准》GB2312-80 方案,把高频字、常用字、和

次常用字集合成汉字基本字符集(共6763 个),在该集中按汉字使用的频度,又将其分为一

级汉字3755 个(按拼音排序)、二级汉字3008 个(按部首排序),再加上西文字母、数字、图

形符号等700 个。

汉字编码:

区位码

国家标准的汉字字符集(GB2312—80)在汉字操作系统中是以汉字库的形式提供的。汉

字库结构作了统一规定,即将字库分成94 个区,每个区有94 个汉字(以

位作区别)每一个汉字在汉字库中有确定的区和位编号(用两个字节),这就是所谓的区位码

(区位码的第一个字节表示区号,第二个字节表示位号,因而只要知道了区位码,就可知道

该汉字在字库中的地址,每个汉字在字库中是以点阵字模形式存储的,如一般采用16×16

点阵形式,每个点用一个二进位表示,存1 的点,当显示时,可以在屏上显示一个亮点,存

0 的点,则在屏上不显示,这样把存某字的16×16 点阵信息直接用来在显示器上按上述原

则显示,则将出现对应的汉字。

内码

汉字使用两字节表示,国家制定了统一标准,称为国标码。国标码规定,每个字节使用

后面7 位,第一位为0。为了区别于英文的ASCII 码,国标码在计算机上使用的时候,规定

汉字每个字节第一位设置为1,以表示该两字节为汉字,称为内码。以“大”字为例子:

国标码3473H: 0 0 1 1 0 1 0 0 0 1 1 1 0 0 1 1

内码B4F3H: 1 0 1 1 0 1 0 0 1 1 1 1 0 0 1 1

国标码与内码有一定的转换公式,即16 进制的区位码,两个字节各加80H,就成为了

国标码。

汉字字模在字库中存放的位置根据汉字的区位码来确定,内码是汉字在机内的表示。由

于区位码和内码存在固定的转换关系,所以当在支持汉字输入的系统中,键盘输入的汉字内

码即在程序中存在,将其转换为区位码,再从字库中找到对应的汉字字模,然后再用有关的

位操作和循环语句,对每个字节的每一位进行判断,如同过滤一样,如果某位是1,则按设

置的颜色在屏幕的相应位置画点(用graphics.h 中的显示象素点的函数putpixel()),若某位

为0,则不画点,这样就可按预先设置的颜色在相应位置显示出该汉字来。

内码到区位码的转换

若汉字内码为十六进制数h2h1l2l1,则区号qh 相位号wh 分别为:

qh= h2h1-0xa0

wh= l2l1-0xa0;

若用十进制表示内码为dld2,则

qh=dl-l60;

wh=d2-160;

即区位码qw 为:

qw=100*(d1-160)十(d2-160)

反过来,若已经知道了区位码qw。则也可求得区号和位号:

qh=qw/100;

wh=qw-100*qh

因而该汉字在汉字库中离起点的偏移位置(以字节为单位),可计算为:

offset=(94*(qh-1)+(wh-1))* 32

注意:字库中每1 区有94 个字符。

这样,就可以找寻到文件的偏移量,读出一个char bytes[32]数组。这样bytes 数组中则

存了要显示汉字的16×16 点阵字模,然后将字模按行扫描的办法,通过循环用putpixel()函

数在屏幕设定位置显示出象点,因而组合成一个显示的汉字。

CFont ft

ft.CreatePointFont(90,_T("宋体"))//做点阵字体。 90 所需字体高度(用0.1点表示,例如,传递120表示12点字体)。

DC.SelectObject(&ft)

DC.DrawText((LPCTSTR)str,str.GetLength(),&rt,DT_LEFT)把你要的字写入一个DC

然后用GetPixel得到dc的点阵结构 至于怎么存储就看怎么使用了

#include <stdio.h>

#include <alloc.h>

#include <ctype.h>

#include <dos.h>

#include <dir.h>

#include <io.h>

#include <graphics.h>

#define GETADR(n,str) (str *) calloc (n,sizeof(str)) // 申请N个指定字符串长度的地址

#define W16 16

#define C16 32

unsigned char bit[8]={0x80,0x40,0x20,0x10,0x08,0x04,0x02,0x01}

FILE *fi

char *dot,str[20]

main(int argc,char *argv[])

{

int i,j,nn,xc,yc,MaxX,MaxY,menul[1000]

int graphdriver=DETECT,graphmode

if(argc!=2){ //检测是否输入了2个参数

puts("LT16<???.N4>")

exit(0)

}

dot=GETADR(C16,char) //获取16个char长度的内存地址

fnmerge(str,"","",argv[1],".N4") //建立str 为路径 ,文件名是 第一个参数.N4 的文件(这里可能有bug,str没初始化)

if((fi=fopen(str,"r"))==NULL){ //打开这个文件用于输入

puts("Can't open DATA.")

exit(0)

}

fscanf(fi,"%d",&nn)//读取一个整数

if(nn<=0||nn>1000) //这个数字必须在 0~1000之间

exit(0)

for (i=0i<nni++)

fscanf(fi,"%d",&menul[i])//根据这个数字来决定继续读取的数字数量

fclose(fi)

if((fi=fopen("CLIB16.DOT","rb"))==NULL){ //打开 CLIB16.DOT 这个文件

puts("Can't open CLIB16.DOT")

exit(0)

}

initgraph(&graphdriver,&graphmode,"")// 初始化图形模式

MaxX=getmaxx()// 获得屏幕最大坐标范围

MaxY=getmaxy()

xc=0

yc=20

for(j=0j<nnj++){

i=readlibdot(menul[j]) //读取点阵数据

putchar16(xc,yc) //显示到对应的坐标系

xc+=20

if(xc>MaxX-20){

yc+=20

xc=0

if(yc>MaxY-20){

getch()

clearviewport()

yc=0

}

}

}

getch() //按任意键继续

closegraph() //关闭图形模式

}

readlibdot(int j)

{

int i0,j1,j2

long order,k1

j1=j/100

j2=j-j1*100

if(j1>=9)

j1=j1-6

k1=94*j1+j2-95

order=C16*k1

fseek(fi,order,SEEK_SET)

i0=fread(dot,C16,1,fi)

return(i0)

}

putchar16(int bx,int by) //显示readlibdot 得到的汉字(保存在dot 里面)的每个象素点阵

{

int i,j,kk,k,x1,y1

unsigned char marker

kk=0

y1=by

for(i=0i<16i++,y1++){

for(j=0j<2j++){

x1=bx+j*8

marker=*(dot+kk)

kk++

for(k=0k<8k++){

if(!(marker&bit[k]))

continue

putpixel(x1+k,y1,YELLOW)

}

}

}

return

}

点阵字库

一般我们使用16*16的点阵宋体字库,所谓16*16,是每一个汉字在纵、横各16点的区域内显示的。

不过后来又有了HZK12、HZK24,HZK32和HZK48字库及黑体、楷体和隶书字库。

虽然汉字库种类繁多,但都是按照区位的顺序排列的。前一个字节为该汉字的区号,后一个字节为该字的位号。

每一个区记录94个汉字,位号则为该字在该区中的位置。

因此,汉字在汉字库中的具体位置计算公式为:94*(区号-1)+位号-1。

减1是因为数组是以0为开始而区号位号是以1为开始的。

这仅为以汉字为单位该汉字在汉字库中的位置,那么,如何得到以字节为单位得到该汉字在汉字库中的位置呢?

只需乘上一个汉字字模占用的字节数即可,

即:(94*(区号-1)+位号-1)*一个汉字字模占用字节数,而按每种汉字库的汉字大小不同又会得到不同的结果。

以16*16点阵字库为例,计算公式则为:(94*(区号-1)+(位号-1))*32。

汉字库文该从该位置起的32字节信息即记录了该字的字模信息。

了解点阵汉字及汉字库的构成原理后,显示汉字就变得简单。以16*16点阵字库为例,

通常的方法是:将文件工作指针移到需要的汉字字模处、将汉字库文件读入一2*16数组再用for循环一位位地显示。

#include "graphics.h"

#include "stdio.h"

main()

{ int i=VGA,j=VGAHI,k

unsigned char mat[16][2],chinease[3]="我"

FILE *HZK

if((HZK=fopen("hzk16","rb"))==NULL)exit(0)

initgraph(&i,&j,"")

i=chinease[0]-0xa0j=chinease[1]-0xa0/*获得区码与位码*/

fseek(HZK,(94*(i-1)+(j-1))*32l,SEEK_SET)

fread(mat,32,1,HZK)

for(j=0j<16j++)

for(i=0i<2i++)

for(k=0k<8k++)

if(mat[j][i]&(0x80>>k)) /*测试为1的位则显示*/

putpixel(i*8+k,j,WHITE)

getch()

closegraph()

fclose(HZK)

}