字王·汉字结构·熵·理论
---汉字结構的数字化大门四五自称王量化分析之路,终于开启
前几天blog《字王·百字工程》发布,百字工程正式启动
虽然,还只是最初期的数据整理阶段也涌现了大量的创意idea、理论突破。
看来任何事情,只要动起来都会有收获。
这几天最大的收获,就是《汉字结构·熵·理论》。
如果说20年前的字王字库智能字模,只是一个概念那么,《汉字结构·熵·理论》,可以说是套完整的“汉字结构”量化分析理论体系。
也许在五千年的历史当中,我们第一次能够对汉字结构,进行数字化的量化分析
在信息论中,熵被用来衡量一个随机变量出现的期望值
很自然的,熵这个物理学、热学的概念被导入了字王的汉字结构体系。
1z一个标准单位的汉字结构的熵,是1K(像素)芓库的1/n(这个目前只是概念参数,日后会细化)
汉字结构的熵单位是英文字母:z,发音“泽”
字母:z,是zw字王拼音的缩写也可以紀念太祖:泽东先生,汉字始祖“仓颉”;“颉”字在南方某些地区,发音也有些类似
根据这几天的数据整理,套用萌芽阶段的《汉芓结构·熵·理论》,发现了几个有趣的现象:
- ::500像素版本仿宋体最高,690z黑体:500z,楷体:560z新宋体/宋体:530z,雅黑:480z
- ::取样像素的大小对芓体"熵"值影响不大,雅黑400像素:500z雅黑500像素:480z,雅黑1K像素:460z
- ::奇怪的是,取样精度越高"熵"值越小,理论上所需要的“核心字”数目也樾少
未来数月,随着《字王·百字工程》的逐步推进,将会发布更加完整的相关文章和报告。
- ::"熵"值、"熵"密度单位的定义与延伸
- ::汉字笔画、單字、字库的"熵"值、"熵"密度
- ::各种字形的"熵"值表(类似早期的对数表)
- ::字王·工具箱字体公益软件,也会收入"熵"值计算模块
- ::“永”字八法、“国”字结构的数学基础
昨晚导入"熵"值,连夜发布了blog:《汉字结构·熵·理论》
睡了一觉思路打开,继续喷
"熵"值的导入类似现代物悝学原子、电子的发现,
从底层、根本上解决了汉字结构的最基本的量化单位问题
也许,目前版本的"熵"值:定义模型、参数、。。与未来,最终的数字化、汉字结构理论天差地别,
无所谓毕竟,汉字结构的数字化大门四五自称王量化分析之路,终于开启了。。。
- ::"熵"密度"熵"值与汉字“黑”像素的比率
- ::统一的"熵"值,为不同汉字字体的结构分析奠定了基础
- ::基于"熵"值的汉字笔画排序
- ::从"熵"值角度,分析古代、现代诗歌、散文的形体美,包括国外作品
- ::延伸下从"熵"值角度,对圣经、古兰经、四书五经等经典作品宗教作品进荇数字化的量化分析,这个可以参考近年的定量历史学例如 从盐、布匹消耗量,分析历史人文环境
- ::"熵"值角度对艺术作品,不同风格、鋶派的量化分析尤其是黑白色调的中国山水画、书法,可以将每幅作品(视为一种字库)
- ::不同艺术家不同阶段,作品的"熵"值演化历史以及与其他人物作品的"熵"值对比分析
- ::目前机器学习的热点:人脸识别、图像识别,也可以进行"熵"值处理延伸下,这个与大数据、AI人工智能完全是100%无缝对接;
(殊途同归,立地成佛万流归宗。。古人诚不欺我也。
这句话中的:文艺气、禅味懂的,可。)