在贴有MADE IN CHINA字样标签的商品屡屡漂洋过海、出现在海外市场的今天,我们不得不遗憾地看到,中文信息处理技术市场被国外企业所把持:PC上微软一统天下,连手机汉字输入法也是90%以上来自海外被“洋码”占据……
国内中文信息产业不够强是造成现状的一大原因,不过值得额手称庆的是,如今这一情况正在改变:随着后PC时代电子消费类产品的迅速崛起,国内中文信息产业面临着一次巨大机遇;而从事中文信息处理技术的国内企业经过数年砥砺,厚积薄发、再次出击。这其中,集通科技无疑是一典型。
上海集通数码科技有限公司(简称集通科技)是专业从事汉字信息领域输入输出产品、片载系统SoC(System on Chip)和嵌入式软件的研发和生产,是中文信息处理技术的领军企业。他们发布的“大成计划”使之成为第一家提供全系列汉字信息输入输出产品的厂家,为非PC的信息产品提供汉字整体解决方案。
集通科技的创始人崔巍先生是国内最早从事中文信息处理技术的权威专家之一,发明了该领域诸多专利技术,拥有丰富的理论与实践经验。近日C114记者专程采访了崔巍先生。
中文信息处理技术专家、上海集通数码科技有限公司创始人崔巍
第一家全系列汉字库芯片厂商
C114:集通科技是第一家提供全系列汉字信息输入输出芯片和软件产品的厂家,您能否为我们介绍下集通科技产品具体覆盖了哪些技术领域?
崔巍:产品领域我们这么来分:按照字型输出和中文输入分两大类。
1、中文键盘输入又分汉字输入法和少数民族文字输入法两类。
汉字键盘输入法,它的发展远远没有达到客户所希望的,原因在哪里?从某个角度来说,只要手写笔有需求,就说明你汉字键盘输入不够方便。为此,我们历时二十多年,对汉字字形规律进行深入分析,终于形成了一个三维部件的汉字表达方式,双轨检索,无须翻页大大提高了输入的速度、减低了学习使用的难度,解决拼音问题与字型输入困难的问题。这个输入法我们将在6月上旬的活动中作为一个重点来推广。另外,我们是国内唯一一家从事少数民族文字输入研发的企业,开发了5种少数民族文字的输入法。目前开发西部,通信设备可以通用、人才可以流通,但由于输入法的原因,西部少数民族较难利用手机短信这一现代通信技术最基本的功能。其实开发少数民族文字不是一个经济效益很大的项目,但是从我们公司的定位来说,普及中文信息处理技术包括少数民族文字应用是我们的义务和使命。
2、输出又分两大类,点阵字库和曲线字库。
点阵字库一般用在分辨率较低的产品中,如普通手机上用的字库就是点阵字库。点阵字库有两个问题,第一,目前IT产品中的点阵字库距离国家要求的标准化还有一定差距,第二,当使用多套不同大小点阵字型的时候,每套都需要单独字库,所占存储很大,集通科技采取了一个独特的压缩技术可以把点阵字库所占用的存储容量节省一半以上,而且还原出来的点阵一点也不错,是无损点阵压缩技术。
还有一类高分辨率的叫曲线字库,曲线字库平常生活中也经常用到,PC激光打印机中打出来的汉字使用的都是曲线字库,字形像印刷体一样美观。但是到目前为止,除了用集通科技的智能曲线字库芯片产品之外,大量的低端IT产品,离开PC是输出不了曲线汉字的,因为曲线字库不是简单的黑白点,而是一个压缩算法,在使用的时候要经过解压缩程序还原。因此整机CPU的性能要能足够支持曲线字库的解压缩速度,并且需要存储字库的硬盘空间。目前大量的低端IT产品还不能使用曲线字库,这个瓶颈,国内外都没有解决。而集通科技非但把曲线字库的性能提高到现在最好水平,而且把硬盘、内存、CPU等全部资源整合在一颗芯片中,也就是说非PC的手持终端所需要高质量汉字,通过集通科技的汉字芯片都能够解决。
点阵字库和曲线字库是不能相互取代的,曲线字库在高分辨率输出时非常漂亮,如激光打印机输出Word的5号字体大小为80×80点。可是一个手机屏幕一共才100多点,用曲线字库就只能显示两行字,所以点阵还是要的。点阵字库通常就是小到12点大到32点,再大就是用曲线字库了,两者互补。
所以总体我们可以看到一个轮廓就是:在汉字信息处理领域分输入和输出,输入我们是汉字和少数民族文字,输出我们是点阵和曲线。这就是我们全部产品的大纲、框架。当然这里面每个产品都有各自的特色,比如输入法我们有基本的GB2312字符集(6,763汉字)、GB1803字符集(27,533汉字),甚至还有Unicode(国际码)的。点阵字库芯片我们有12点、16点的、24点、32点等,也有一片里含多种点阵的。曲线我们有很多了,点阵只有宋体黑体,曲线有魏碑、隶书等等。整个领域有大量工作要做。
分别来讲,刚才说的4大块,汉字输入有很多企业在做;少数民族文字没人做;曲线字库用单芯片来做的除集通科技外没有一家能做到,这是我们的专利产品。在这些产品的开发中,其实还围绕着一个“以芯片为载体”,以芯片为载体看起来比软件成本高了,但利用集通科技独特的技术将系统的存储量减少了,成本没有增加。而且集通科技为了配合国家推广汉字标准,定位字库芯片含正版软件但只按空白存储芯片定价。
C114:这样对打击盗版是非常有利的,我觉得你们解决了一个以往知识产权难以维护的问题,这是你们给IT企业提供了一个比较好的方向。
崔巍:是,也就是换句话说,你再盗版,载体是要钱的。比如一张空白光盘2块钱,今天正版的也卖2块钱,肯定没人买盗版。这是我们的商业模式。
我们对公司的定位有一个想法,实际上也是我们的一种使命感。做公司在商言商,赚钱固然重要,但是必须站在更高的高度。毕竟靠少量的暴利成不了规模,如果能够把汉字标准推广得很好,当市场规模大了之后,公司的整体收入也会随之提升。
C114:因为毕竟你们在这块市场上已经占了比较大的份额,如果这个市场做大了,按照这个份额你们的收入也会越来越高。
崔巍:但这里面有一个市场工作要做。通过我们客户的不断累积,让IT制造业里形成一个观念:涉及到汉字这块,整机厂就不需要动脑筋自己想办法了,找集通科技就可以了。
那么再归结过来,公司定位有一个比较特别的,既是IT公司又是一个带有汉字文化的,实际上是文字和IT相结合。既是一个软件公司又是出芯片的硬件公司,我们公司的核心竞争力在于自主的知识产权。
与中文信息处理技术同生共长
C114:您能否结合您自己,对中文信息处理技术在我国的发展历程、以及集通科技成立以来所获得的成绩为我们做个具体些的介绍?
崔巍:国内汉字输入的研发从83年就开始了,但是其中有一个问题,就是各说各的好,很难客观评价,只有用过了才知道好不好。到底怎么样的评价才是最好?当时国际上也是空白。当年我写了一篇论文《汉字键盘的评价方法》(在美国IEEE《COMPUTER》杂志发表——该杂志是IT业中最为权威的理论刊物)为汉字键盘评价方法提供一种理论依据。
之后我89年做汉卡,90年做中标字库芯片。92年到94年我们的高通汉卡成功开发推广,当时是四大汉卡之一,被评为“上海市十大软件公司”第二位。96年,开发成功“曲线压缩汉字库芯片”,被广泛用于铁道部客票打印机。98年到99年,和美国ESS公司合作为中国市场开发信息家电,高通公司负责系统规格设计及中文软件开发,定名为“斯坦福计划”。该计划实际是微软公司“维纳斯计划”的前身。
集通科技整个框架中所有的产品是从02年开始规划的。我们称之为“大成计划”,为什么叫“大成计划”?表示是中国文化和IT的大成,软件和芯片的大成,输入和输出的大成,集20年技术积淀之大成。03年含CPU的智能曲线字库芯片已研发成功。为什么现在在做新的东西,03年只是验证功能,但在成本必须降到更低。05年完成标准点阵字库芯片的开发,06年完成汉字输入法的开发,今年已经研发成功数字电视机顶盒防闪汉字库产品。
C114:可以说您和您创办的企业一同见证了中文信息处理技术的发展,那么为什么集通科技要做非PC的信息产品?
崔巍:产品的定位和策划对企业发展非常重要,你不仅横向分析它的地位、特有优势、竞争对手,还要纵向来分析历史,不是简单的认为好卖就去做,每个时期都有每个时期的特点。
我们把中文信息处理技术历史分成三个阶段,所有中文信息处理技术都是与PC挂钩的,从85年到95年我们把它定位为DOS时代,从95年到04年为Windows时代,04年为后PC时代。
为什么以95年作为DOS和Windows时代的划分?95年之前也有Windows,但Windows3.0、3.1没有普及,95年之后Windows95中文做得比较完善,同时到了486之后PC硬件也配置比较充分了,所以Windows95出来后就把中文DOS(国内以汉卡产品形式为主)都替代了。为什么以04年作为PC的结束?之前IT的标志性国际展会有两个,一个是COMDEX展会,一个是CES展会。COMDEX展会以PC为主,CES展会以消费类电子产品为主,到了04年COMDEX寿终正寝了,因为所有个人信息产品都和消费类电子产品有关了。
你看这三个时代很有意思,在DOS时代每年装机150万台,在Windows时代每年装机1500万台,在后PC时代每年装机1.5亿台。10年一个时代,10倍增长。我们再来看中文信息处理技术在3个时代的情况:DOS时代为什么汉卡特别兴旺?首先PC的存储空间不够收容汉字,第二当时MS中文DOS的汉字功能不被国内接受,所以用中文DOS和汉卡只利用微软的英文的内核,而中文自己做,把汉字扩展到汉卡的存储芯片上,取代中文的MS DOS。
另外还有个特点,80年代中关村一些大的公司都是做汉字起家,如四通中文打字机、联想汉卡、方正中文排版等。当时媒体也都归纳,这不是一个偶然,为什么搞了中文就会起来,那是因为中文是美国人让出来的市场。可是到95年Windows95出来,微软也有实力了,中文自然也不放过了,前面这些公司消失的消失,转行的转行,高通坚持到现在。04年消费电器起来之后大部分公司都没了,坚持下来的公司都面临着巨大的机遇。
非PC信息产品是PC产品销量的10倍,我们现在所有的产品应用除了PC,从手机到电视什么都覆盖。目前我们汉字库产品载体是半导体芯片,现在半导体成本非常低,所以才有一个有利于产品的环境,如果是10年前我们这么定位的话产品做得再好卖不掉,芯片太贵。
产业链地位唯一
C114:以IT产业链而言,集通科技处在哪个位置上?
崔巍:在IT领域中,从PC到手机,都有一个主机,这个主机都要有输入输出装置,如键盘。涉及到汉字,输入方面包括手写输入、语音输入和键盘输入,其中集通科技做汉字键盘输入。输出方面包括语音合成和字型生成,集通科技做字型生成技术。也就是说在IT产业链中汉字输入输出环节集通科技都涉足了。
为什么是集通科技的地位是独特的呢?其中有几点原因:首先输入/输出技术的应用范围覆盖了从手持设备到大型计算机,比任何单一产品都量大面广。其次个这些技术都有历史积淀,具有很高的技术壁垒,所以品牌非常集中,不是其他厂商不愿意做而是进入比较困难。还有,这些输入/输出技术一开始都是以PC软件为基础开发的,但是现在是以消费电子产品为主,所以转向了做脱离PC的嵌入式产品。最后还有一点值得注意的是,语音和手写输入都是意识到键盘输入的技术瓶颈,另辟蹊径,而集通则是正面挑战几十年没有解决的键盘输入难题。
C114:现在集通科技的运营情况如何?07年集通科技的工作重点是?
崔巍:为什么搞汉字的少呢?搞汉字产品前期投入时间比较长,很多公司作为纯经营公司不是很沉得住气投入。我们公司的企业文化是在做事业,所以我们有种使命感,中文的处理技术本应由国内公司主导。
市场推广是今年的工作重点,我们每两个月会有一个活动,我们6月上旬将有个比较大规模的活动,这一系列的市场活动,其实是前些年技术积累的成果最后与市场见面。每个阶段主推一个产品,到年底还会有一个大型发布会,把集通全部的产品系统介绍一下。
C114:集通科技自成立以来就一直专注于中文信息处理技术的研发推广,现在集通科技主要的产品线包括哪些?这些产品是否都是由您发明的专利技术转化而来的?
崔巍:全部专利都是。
产品主要有这么几类:
汉字输入法:GT-KEYIN
点阵字库芯片:GT20系列、GT21系列、GT22系列
汉字液晶驱动芯片:GT30系列
智能点阵字库芯片:GT40系列
智能曲线字库芯片:GT60系列
手机和防闪字库芯片:GT50系列
C114:这些汉字库芯片产品主要应用于哪些领域?
崔巍:典型应用领域有手机、商务电话、税控收款机、针式打印机、身份证读卡机、微型打印机、LED广告屏、热打印机、数字电视、机顶盒、MP3、IP PHONE等30多个不同的市场。
因用户电报结缘中文信息处理技术
C114:您在中文信息处理技术方面已经有着多年的研究,出了许多成果,是什么促使您从电话通信技术转向研究中文信息处理技术的?
崔巍: 70年代末我就在
来源: |