字体为什么会缺字?

2024-05-16 00:00:00.0

分類: 字体产品与应用

使用字体碰到缺字的原因有很多,最主要原因是字体使用的字集,其次与输入法有关。

繁体中文在开发时最常使用的字体规格为Big5-2003(大五码),共收录13,060个汉字。 有1万多汉字怎么还会缺字? 原因是有些一般生活常用字并没有收录在其中,像是尘螨的「螨」、擀面的「擀」等文字。 因此形成使用Big5字集开发的字体在编排文件出现缺字的情形。 

为了降低用户用字缺字的机率,文鼎字型以现有Big5-2003字集规格为基础,参考教育部字频总表、中研院现代汉语语料库词频统计、网络流行用字以及营销与客户服务所累积的信息,汇整389个汉字,整合成Big5_AR 2021规格,自2021年以后皆以此规格进行新字体产品的开发,早期热销、经典的字体亦规划补字更新,用户可以透过iFontCloud获得最新版本的字体使用。 

再来谈到输入法。
可以打出汉字的中文输入法有很多种,每种输入法形成汉字的方式不大相同,一般常见为注音输入法和汉语拼音输入法。



如果不是使用注音输入法或汉语拼音输入法,有些字符的汉字与部首外型长得一样,但是实际上分属于不同的Unicode码位,就会形成透过输入法显示出来的文字误植成部首字也浑然不知, 误以为是字体缺字。 以字符「日」为例,「日」汉字的Unicode码位是U+65E5,是定义在中日韩统一表意文字(CJK Unified Ideographs)中,另外有一个与其形状几乎一样的「日」,是位于康熙部首字区( Kangxi Radicals)的部首字,它的Unicode码为是U+2F47,U+2F47其为Unicode于Unicode 3.0根据康熙字典的214个部首按序编排,位于U+2F00 - U+2FD5当中的一个字符。 此区段的字符是用于表示部首使用,不是中日韩统一表意文字区段内的汉字,而繁体中文使用的Big5-2003的规格并没有完整收录这些部首字的字符,在这样的情况下,如果使用标准Big5-2003字集的字体, 在输入U+65E5国字的「日」能够显示套用的字体,但是打成U+2F47部首字的「日」则可能会显示缺字的状况。

下次碰到字体缺字的状况别惊慌,先确认字符是否为汉字以及字体使用的字集就能解决大部分的问题啰!


字体产品与应用

文鼎UD晶熙黑体的西文造型搭配

中文字体与日文字体同样都有汉字、西文与假名,如果有留意日文字体产品,会发现日文字体同样的一个字体家族,但有着不同假名、西文的造型设计做搭配。

文鼎UD晶熙黑体开发之初也规划有这样的设计,亦即晶熙黑体在西文的造型上,共有三种造型可供设计师选用,以简体中文为例,字体名称分别是:

1. 文鼎UD晶熙黑体

2. 文鼎UD晶熙黑体E1

3. 文鼎UD晶熙黑体Aktiv

这三款字体的西文造型可以追溯回到原始的西文字,分别是AR Dori Sans、AR NewHebe Sans、Aktiv Grotesk;AR Dori Sans、AR NewHebe Sans是文鼎字库近年来在西文设计的代表作之一,除了文鼎内部的字体设计师参与设计开发外,也力邀位于美国波士顿Font Bureau字体公司的总监David Berlow协助设计指导、监修;两款原生西文皆有自Light-Ultrablack 9个字重,在与晶熙黑体汉字12个字重搭配时,设计师重新给予字重的设定,细修曲线、调整架构再加入必要的视觉修正,字重扩充至极细的Hair到极粗的Ultrablack(E1版),再依据视觉灰度给予最佳的宽度比例,让中文汉字、西文搭配出最佳的整体视觉效果。

 

西文符号的设计通常会有因应造型、字重而做视觉校正的处理,目的是为了排版上的美观、舒适性而做。以AR Dori Sans /文鼎UD晶熙黑体的符号为例,在数字1和4就有在不同的字重上做视觉校正,经过视觉校正的字型有字高(Font Height)的不同,但随着字重(Weight)加粗,数字1、4、6将差距会缩小。



文鼎UD晶熙黑体Aktiv,是晶熙黑体的汉字与英国合作伙伴Dalto Maag 公司的Aktiv Grotesk 进行搭配后的字体,共有繁体中文+香港字符集、简体中文、日文三个语言,每个语言各四有个字重,旨在将晶熙黑体的简洁与Aktiv Grotesk干净利落加以整合,感受上均匀平稳,视觉连贯而有当代感,目前已经导入国泰航空做企业字体的使用。

文鼎UD晶熙黑体,拉丁以AR Dori Sans做搭配,整体呈现出几何、工程、现代的氛围,具有Medium-Heavy共五个最常使用的字重,适合在数字显示环境下使用,在中文显示各分句之间停顿的逗号(U+FF0C),设计师简化汉字逗号的造型,在这里尝试着做大胆的简化设计,阅读时营造出简洁时尚的视觉感受。

文鼎UD晶熙黑体E1,拉丁以AR New Hebe Sans做搭配,整体呈现出经典、传统、隽永的氛围,适合使用在书籍排印,现有12个字重的产品推出。

搭配着不同西文造型的晶熙黑体产品,这样的整合设计罕见于中文字体上,让设计师们在字体使用时,多了不同设计情境字体选用上的弹性。

字体产品与应用

长体

长久以来,大多数中文汉字数字字体的设计规格都局限在正方形的方框中,从而产品化出结构方正的字体,然而,当遇到字符宽度无法在有限的宽度空间中做文字排版时,即延伸出「长体」的字体产品,用以缩减排版时整体的字符宽度。早期长体的设计,相对于正方形标准产品的设计规格,保持相同的字体高度,但缩小左右的水平空间,所形成长型的字体即称为长体,相对于未变形前水平、垂直100%的比例,缩小左右10%比例的字体,称为长一,缩小左右20%比例的字体,称为长二…。

为什么要使用长体字?
长体数字中文字型的数量相对来的少,在早期,由于软、硬件环境的不成熟,长体字被设计在正方形的方框中,缩小后的左右水平空间以留白的样貌呈现,在水平横向排排版应用时,会形成字符间距过大的情况。随着外部软硬件技术的提升,新技术、新应用情境的发生,字体设计的弹性更加的广泛,让字体设计师的创意可以尽情的发挥。

如前述,规格上,长体是缩小左右比例后的字型产品,在应用上存在经济效益,此经济效益说明的是节省版面的空间,具有较窄字宽的长体字,能够将更多的字符呈现在一行、标题、段落、区块文字甚至是页面中,具有在有限的排版空间上呈现较多字符数的特性,反之,在同样的版面空间上,可以有较多的字符数来呈现内容。 但是,长体字也不是没有缺点,毕竟在汉字,尤其是笔画数多的汉字,在缩小字宽后的辨视度、易读性会比标准字宽的字体来的低。


中文长体字的使用在直排、字符数少的情境下效果最佳,以字符数少的情境,当字体家族具有标准与长体字的设计时,如标题、引言等都是长体适合发挥的舞台。使用同一种字体风格的长体字做排版,除了可以凸显要点外,还可以维持整体风格的一致性;当长体字被独立使用时,其长形字的特色容易被凸显出来,用在独立的标题更显特色。



长体字型产品的开发,丰富且扩展了字体家族。
中文字型产品的字体家族(font family)大多以字重的粗细为基础做字型产品的开发,相对于拉丁字的字体家族设计,除了字重以外,还有斜体(italic)、长体/窄体(condensed/ narrow)、宽体(extended)等设计,对应上就显的单薄。在应用上,若设计案件选择到具有condensed/ narrow设计的拉丁字,这时,往往找不到合适的中文字型产品做匹配。



自2017年开始,文鼎字型着手设计并发行具有规格化的长体字型产品,在字型设计时,即考虑使用行为,为了让设计师/用户快速的从软件的字型列表中找到长体字型,我们在字体名称上做区隔,透过代码即可辨视该字型是否为长体字。长体字型以代码C做为表示,代码后的数字表示在EM1000的规格下,字宽的比例,如「C80」表示为长体、字宽80%的字型。



目前,文鼎字型具有长体设计的字体家族有:文鼎UD晶熙黑體E1、文鼎方新書、文鼎書苑宋、文鼎白玉書體,详细如下:(Variable Font:表示变量轴支持长体的变化)

字型名稱 字重 標準 C95 C90 C80 Variable Font
文鼎UD晶熙黑體 E1 MD
DB
BD
EB
HV
文鼎方新書 H7 MD
DB
BD
EB
HV
文鼎書苑宋 HKH32
文鼎書苑宋 HKH46
MD
DB
BD
EB
HV
文鼎白玉書體 H16 LT
MD
DB
BD
EB
HV
EH
DBL
BL
文鼎白玉書體 H32 MD
DB
BD

*○:可透过可变式字型(Variable Font)使用

长体字型产品图例:






字体产品与应用

如何呈现国字〇

在使用输入法输出中文字时,你的零是以怎样的面貌呈现呢?是写成国字「零」,还是「〇」、「O」、「○」、「0」或是写「0」?在windows作业系统的环境里,「零」、「O」或「0」使用任何输入法都可以打出来,但是「〇」用一般系统内建的输入法像是注音、新注音、仓颉是找不到的,如果您有额外安装的输入法,如自然输入法,键入零这个字,则可以透过选单找到「〇」。

上面举例的这些字符造型都长的很相近,每一个字符在Unicode字码的定义里都有一组数字来代表自己,这组数字一般通称为字码,这几个字码及其代表的意思分别如下:

零:U+96F6,中文汉字零。

0:U+FF10,全角数字零。

○:U+25CB,空心圆圈,几何图形。

〇:U+3007,空心圆圈,几何图形。

0:U+0030,数字零,属于基本拉丁字母。

O:U+004F,拉丁大写字母O,属于基本拉丁字母。

 

这些造型相似的字符在使用上会有怎样的差异,下图我们以微软正黑以及文鼎UD晶熙黑体、思源黑体做举例,在使用国字显示公元年时,我们可以看到使用 U+3007「〇」字符有最佳的排版效果,除了U+3007这个字符本身就是为了与国字一起使用外,以晶熙黑体为例,还会因应字体造型、字重做优化的设计。

如果在绘图软体,如Adobe illustrator里,我们可以透过「字符」工具面版来找到「U+3007,〇」这个字符,或者是用前面word输入的教学方式,在word中将「〇」呼叫出来,再复制到Adobe illustrator中做使用。