This paper outlines the creation of three corpora for multilingual comparison and analysis of the Voynich manuscript: a corpus of Voynich texts partitioned by Currier language, scribal hand, and transcription system, a corpus of 294 language samples compiled from Wikipedia, and a corpus of eighteen transcribed historical texts in eight languages. These corpora will be utilized in subsequent work by the Voynich Working Group at Yale University. We demonstrate the utility of these corpora for studying characteristics of the Voynich script and language, with an analysis of conditional character entropy in Voynichese. We discuss the interaction between character entropy and language, script size and type, glyph compositionality, scribal conventions and abbreviations, positional character variants, and bigram frequency. This analysis characterizes the interaction between script compositionality, character size, and predictability. We show that substantial manipulations of glyph composition are not sufficient to align conditional entropy levels with natural languages. The unusually predictable nature of the Voynichese script is not attributable to a particular script or transcription system, underlying language, or substitution cipher. Voynichese is distinct from every comparison text in our corpora because character placement is highly constrained within the word, and this may indicate the loss of phonemic distinctions from the underlying language.


翻译:本文概述了为多语种比较和分析Voynich手稿而创建的三个公司:由Currier语言、克里夫勒手和抄录系统分割的Voynich文本汇编,由维基百科汇编的294个语言样本汇编,以及由8种语言汇编的18个转录历史文本汇编。这些公司将在耶鲁大学的Voynich工作组随后的工作中加以利用。我们展示了这些公司在研究Voynich脚本和语言特征方面的用处,并分析了在Voynichese的有条件字符加密。我们讨论的是字符拼写和语言、脚本大小和类型、拼写成、缩写成、缩写和缩写、位置字符变异和大写频率之间的相互作用。这种分析将描述脚本组成、字符大小和可预测性之间的相互作用。我们展示了这些拼写结构的实质性操纵不足以使条件的昆虫文字水平与自然语言相匹配。Voyniche文字的异常可预见性不是由某种特定的脚本或翻译系统、文字的大小和类型、文字的缩写、缩写、定位和替换特性的每个语言的区别,因为语言的缩缩缩缩和缩写与语言的文字的翻缩。

0
下载
关闭预览

相关内容

Effective.Modern.C++ 中英文版,334页pdf
专知会员服务
66+阅读 · 2020年11月4日
最新《序列预测问题导论》教程,212页ppt
专知会员服务
83+阅读 · 2020年8月22日
迁移学习简明教程,11页ppt
专知会员服务
105+阅读 · 2020年8月4日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
75+阅读 · 2020年7月26日
Python图像处理,366页pdf,Image Operators Image Processing in Python
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
计算机 | 中低难度国际会议信息6条
Call4Papers
7+阅读 · 2019年5月16日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Github项目推荐 | RecQ - Python推荐系统框架
AI研习社
8+阅读 · 2019年1月23日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
15+阅读 · 2018年12月24日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Relative Variational Intrinsic Control
Arxiv
0+阅读 · 2020年12月14日
Arxiv
0+阅读 · 2020年12月10日
Arxiv
0+阅读 · 2020年12月10日
Arxiv
5+阅读 · 2018年1月30日
VIP会员
相关VIP内容
Effective.Modern.C++ 中英文版,334页pdf
专知会员服务
66+阅读 · 2020年11月4日
最新《序列预测问题导论》教程,212页ppt
专知会员服务
83+阅读 · 2020年8月22日
迁移学习简明教程,11页ppt
专知会员服务
105+阅读 · 2020年8月4日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
75+阅读 · 2020年7月26日
Python图像处理,366页pdf,Image Operators Image Processing in Python
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
计算机 | 中低难度国际会议信息6条
Call4Papers
7+阅读 · 2019年5月16日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Github项目推荐 | RecQ - Python推荐系统框架
AI研习社
8+阅读 · 2019年1月23日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
15+阅读 · 2018年12月24日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Top
微信扫码咨询专知VIP会员