火星字转换(90后非主流文字繁体字)

田文一号登陆火星,中华民族对浩瀚苍穹的探索已经走了很长一段路。在这个值得举国欢庆的时刻,过去关于火星的各种科幻想象又近了一步。那么,如果火星真的存在,在现有的技

田文一号登陆火星,中华民族对浩瀚苍穹的探索已经走了很长一段路。在这个值得举国欢庆的时刻,过去关于火星的各种科幻想象又近了一步。

火星字转换(90后非主流文字繁体字)插图

那么,如果火星真的存在,在现有的技术条件下应该如何解读呢?

字典大法:查表

如果对方已经研究过中华文明,那么一本现成的字典就是最好的工具。

例如,在地球语言中,中英文之间的翻译很大程度上依赖于词典。比如《火星》:

火星字转换(90后非主流文字繁体字)插图(1)

通过字典,即使你没见过这个词,意思也能一眼看出。

这种策略在电信编码中的应用更为广泛。比如UTF8编码。UTF8编码可以理解为计算机说的中文和英文。它把汉字转换成特定的二进制,然后通过查表还原。在谍战中发挥巨大作用的莫尔斯电码,是汉语的语音表达,每个长音、短音及其组合都有对应的含义。

火星字转换(90后非主流文字繁体字)插图(2)

最近这方面最知名的创作大概就是《长安最长的一天》里的瞭望塔了。这部优秀的作品创造了一套光通信码,实现了用光讲中文。

火星字转换(90后非主流文字繁体字)插图(3)

这种方法在计算机领域也是最容易实现的。从字典,便携式电子词典,到各种翻译设备,基于字典的方法为文化交流提供了许多便利。

猜词:结合上下文进行推断

这个词汇不在字典里怎么办?

甚至在阅读中文的时候,经常会遇到生词,词典可能还没有收录。明星写作和流行词就是例子。

先说火星人。在我们真正登上火星之前,我们把这些难以理解的词叫做火星人。其实也是一种网络流行文化。天文馆看起来怪怪的,直接查字典可能得不到答案,比如:

嘿,嘿,嘿(嘿,你好)

星象中的文字没有一个是正确的,甚至夹杂着其他符号,但通过同形异义的联想,我们还是能猜出这句话的原意。

就程序而言,它可以建立一个字典,然后搜索出与现有字符形状和声音相似的单词来完成这个任务。比起直接查字典,难度只能说是略有提高。

火星字转换(90后非主流文字繁体字)插图(4)

结合上下文猜测是更高级的任务。比如外来词,cool,就是英文cool的翻译。

酷的本义是残忍、深沉;但在新的时代背景下,它使用的句子发生了变化。如果能收集到大量的文字对比,程序会发现原来的“这东西让人想试试”“这东西让人感觉不错”之类的表述变成了“这东西很酷”。通过附近的词汇,程序可以大致推断出这个词的意思,这是一种基于概率的翻译思维。

完全破译:多维空间上的抽象计算

如果一点信息都没有,是全新的文本,收集的信息很少,那才是真正的考验。

现存的书写系统有两种类型:表音和表意;要得到一个古汉字,首先要确定它是表音的还是表意的;这可以通过观察符号的数量大致猜到。一般来说,音标的数量比表意符号的数量少。

然后通过符号组合一起出现的概率,可以大致划分出几个词;这一步类似于之前基于概率的思考。

经过这一步,知识渊博的古文字专家会根据关键词的形式和所知道的语言来猜测单词的构成,比如哪些符号代表哪些音节,然后依次破译。

这一步,用算法的语言来说,就是找到单词之间对应的连接关系。假设有n个符号,那么它组成一个有长度的句子,有a n种可能。通过已有的语料库,可以统计出经常出现的可能性;同样,我们可以对另一种语言做类似的统计;如果两种语言有相似的关系,比如都是表音或表意的,那么它们之间对应的词也应该有相似的【统计关系】。通过描述这种关系,我们可以得到一对一的翻译。

火星字转换(90后非主流文字繁体字)插图(5)

利用这种方法,计算机科学家在Linear-B数据集上进行了尝试,准确率达到了67.3%。

如果真的有火星文,按照现有的科技也不是不能理解。关键是探索未知的意志和开放的心态。接受未知,探索未知,飞机空深入,我们的认知也能深入。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/80840.html

发表回复

登录后才能评论