模拟80%的中文理解

前阵子我写过 80%的理解感如何,并引用了Marcos Benevides中使用的英语示例’出色的演示,通过包含类似英语的虚构词汇,可以模拟80%的英语理解。

I’我一直在考虑该演示文稿,既考虑了这种演示的影响,又考虑了如何用中文完成演示。我最终用中文创建了自己的示例。一世’我会先分享这一点,然后再对所涉及的注意事项进行一些讨论。

(在尝试阅读以下内容之前,请注意,如果您的中文至少处于中级水平,以下练习将无法进行。像英语一样,这些示例对母语为母语的人最为有效。)

中国样本

这是 98% 理解:

中文:98%的理解力

这是 95% 理解:

中文:95%的理解力

这是 80% 理解:

中文:80%的理解力

注意事项

阅读中文的棘手之处在于’不仅仅是词汇和语法的问题;那里’s用英语不存在的问题: 中国文字。当学习者阅读困难的中文课文时,所有这三个要素都在难度中起一定作用:词汇,语法和字符。

但是,为了使示例适用于学习者和母语使用者,都需要一种方法 保证 用英语中的虚构词完成后,文本的某些部分难以理解。用中文怎么办?

我是怎么做到的

首先,要最大限度地提高“intelligible”学习者也可以阅读部分中文示例文本,我尽可能使用简单的文本:1级汉语普通话分级读者。对于这些示例,它是 秘密花园.

然后,我必须确保选择较难的内容词以换出,并且在每个样本中都获取了它们的所有实例。显然,我必须数数单词以确保我正确地获得了所需的百分比。但同样重要的是,为了使我的样本能够代表真实的98%,95%和80%的理解经验,所选择的词语应“cloud”阅读理解程度达到适当的程度,不多也不少。

但在这儿’s the tricky part: 读者如何表现人物’t know。最明显的方法是创建自己的角色’真的存在。我喜欢这样做,但是’这很耗时,并且要使其看起来真正可信,与其他角色混合使用时,根本不必脱颖而出。太多工作。

因此,我转向了Unihan汉字数据库。多年来,越来越多的晦涩字符被添加到这组字符中,我发现了最新添加的字符列表。 (最近添加的内容应该最晦涩,但我选择了 此页面的扩展名D 因为它既是最新版本,又是一个小下载。)

快速检查确认这些字符确实是晦涩难懂的,但其中许多没有’t 看起来像 简体中文字符,还是 太奇怪了,因此我必须谨慎选择。在做出选择之后,我还必须检查以确保受过良好教育的中国成年人没有’t识别字符(猜测不会’t count).

之后,我有选择地交换了样本中的字符。 (我的80%理解力文字样本是最短的,因为我用完了“good”晦涩的人物,我没有’不想找到更多!)

在我的文本中使用这种晦涩的字符的一个有趣的副作用是,大多数软件无法’渲染它们。他们使用的任何字体都没有’包括那些怪异的人物。只要 文林,其自定义字体旨在呈现各种晦涩的字符,因此可以全部显示。所以我不得不做文林的截图’s 在terface.

如何使用

LanguageCon

我将这些段落用作演示的一部分 广泛的阅读LanguageCon 在九月。我得到了想要的效果:中国观众对他们所扮演的角色咯咯笑(尴尬?)’不知道,尤其是当他们达到80%的理解力示例时。

中国学习者苦笑着:没有’t much amusing about a 假 recreation of the challenge they face on a daily basis, trying to read Chinese.

我最希望中国观众能够 移情 与中文学习者在一起。大多数中国人从来不知道要学习这​​么多外国字符作为外语学习经历的一部分是什么感觉。但是,通过这些示例,他们可能会感到困惑。

其实,也许他们在笑 救济… 在 least they’他们面临着挑战。


全集学习博客也有与此主题类似的中文文章: 80%没有你想的那么多.

分享

约翰·帕斯登

约翰是上海的语言学家和企业家, 全集学习.

评论

  1. “The obvious way would be to create my own characters that 不要’真的存在。我喜欢这样做,但是’这很耗时,并且要使其看起来真正可信,与其他角色混合使用时,根本不必脱颖而出。太多工作。”

    那突袭徐冰呢?’s天上的书(天书)?它’(我相信)由虚构的人物制成,看起来像真实的人物(使用真实的部首等)。

    //en.wikipedia.org/wiki/A_Book_from_the_Sky

  2. 约翰一如既往地很棒。对我来说’这是另一个有趣的层面“don’t recognize a word”问题是,有时在某些情况下,汉字的性质使80%的单词识别比中文更容易。

    跳过所有关于书写系统是否有效的常规讨论(’),字符相对于英语的一个小优势是有时— maybe even often —他们传达了角色的含义。无论谁’在看普通的中文菜单时,可能会碰到他们无法看到的奇怪的食物’t发音正确,但可以猜出其含义。即使上下文比菜单少,正确的模糊汉字分类也经常发生。人们会想到旧武器角色是另一个很明显的类别。

    这是一些晦涩的英语单词’经常给您:有关其含义的一些线索。当然,我知道,您可以尝试寻找词根和外国借词,这种做法有时会奏效,但大多数情况下,这些来源却被拼写怪异和词法等因素所掩盖。

    因此,80%的识别率可能不是英语和中文之间的苹果对苹果。再说一次,不要说中文不是’真该死,但在这一有限的领域中,它可能比英语具有一点优势。

    • 史蒂夫

      我知道你’重新到达,但我不知道’直到很晚才认为这在理解新词汇方面起着重要作用。能够使用语义组件进行有根据的猜测需要大量的语言经验。 (您’例如,在您开始尝试阅读有关古代中国武器的知识之前,d需要相当多的学习汉语的经验。)

  3. 绝对出色。感谢您抽出宝贵的时间来举例说明如何有效地与中国观众交流。我很快将与(几乎所有)以中文为母语的人举行网络研讨会,讨论汉语教学中的可理解输入。我是否可以分享这篇文章的链接,以使他们感受到不同程度的可理解性所带来的影响?

  4. 这很棒。我记得您在此发表的英文帖子,但忘记了具体内容,因此我假设您是’d只是涂黑字符。直到我的第三个无法识别的角色出现,我本来只是一段简单的文字,但后来我变成了-

  5. 真酷!我认为,它非常有效地实现了80%的可理解性目标。至少在某些情况下,您还设法掩盖了发音的任何暗示(当然,没人能猜出这些音调)。那’作为非母语读者,这部分确实让我感到困扰。

  6. 谢谢你令人沮丧的是,我可以’无法从中国境内完全加载95%和80%的样本–即使在VPN上。有什么建议么?

    • 即使图像被阻止,您也应该能够单击到该图像被舔到的URL。那样有用吗?

      这是在Flickr上托管的问题,并且考虑到Yahoo’s imminent doom, I’我可能迟早都要从Flickr迁移所有内容,但是现在’我非常头痛’m delaying on…

  7. 大卫·劳埃德·琼斯说: 2016年11月16日下午5:39

    Hi, 约翰,

    我喜欢您的体贴,聪明和— to me 在 least — original stuff.

    两个查询。您撰写有关将英语与中文区分开的字符问题。在我看来,这是武断的:很高比例的母语英语读者同意p-l-a-t-e拼写“dish”除非他们有除页面上字母以外的其他线索。我自己’可能会导致我们所有人都需要除页面上字母以外的其他线索,并且’只是我们中的一些人擅长提供我们自己的这些。

    类似地,您可以区分“Guessing doesn’t count”在判断是否经验丰富的汉语母语读者会追随您的晦涩字符时。为什么不?什么’猜测和知道之间的区别?

    我对这些问题有自己的偏见。在我看来’各种各样的专家中都出现了马可波罗综合症,从认为自己比小学学生了解更多的小学老师开始。这种综合症源于肯定的知识,即一个人优越,因为它已经完成了一件极其困难的事情,例如:在15世纪到达北平,然后回到欧洲。

    这意味着您知道听众不了解的内容’t,这反过来又给了您许可,告诉他们您该死的任何事情。拥有此许可证以告诉他们迫使他们承认一个人的事情尤其重要’s superiority.

    这肯定不会’意思是说,您应该告诉任何不实之处。在马可波罗’例如,说世界另一端的人的脸在胸前,没有头就不是不真实的事,’只是捷径。解释它们的皮肤灰黄,上皮皱褶和长指甲可能需要花费很长时间,因此,胸头可作为一种真理的占位符。

    语言手册中充斥着此类占位符。民间词源,更糟的是外国人’发明的民间词源学是这些虚构类的全部类别。

    我认为这是密歇根州美国陆军学校的埃莉诺·哈兹·乔丹(Eleanor Hartz Jordan)和国务院的胜利之一’乔治敦的FSI是他们避免此类错误的程度。他们的方法包括在真实情况下进行极端练习。“孩子们,这真是无聊,但确实有效。”

    “将此十四磅重的录音机戴在脖子上三个月,每天播放八小时,然后’re going to Osaka,”是美国之音’s Jack Masey’1967年向新兵提出的建议。’t,你正要在街上…。国务院FSO-2的摩门教传教士’和CIA人员,请遵循以下说明。他们做得很好。

    他们在三个月的努力中完成的工作似乎微不足道。他们说的目标语言很少,口音也比较好。实际上,这是一个奇迹,而且拥有大量词汇和大量出版物的人们一生中所能获得的成就不止这些。它们起作用。

    干杯,
    -dlj。

  8. Terry Waltz 说: 一月7,2017在2:14下午

    我去了乔治敦’的中文学校,我认识许多讲中文的摩门教传教士。这些要求中关于这些程序所赋予的流利程度或熟练程度均不准确。抱歉。约翰说对了。他的观点不是说中文本身很难,而是’简单地说,任何一种语言都是通过可理解的输入获得的,并且对于独立阅读而言,可理解性水平必须非常高—比大多数老师想的要高。那里’马可·波罗(Marco Polo)对此一无所知,除了大多数老师不’t get it.

  9. […] Pasden du 博客 中国剪接一家公共刊物,文字与文字的翻译之间存在差异。…]

发表评论