Naptha项目可以阅读图像中的玛雅吧文本吗?

昨天 Naptha项目 点击Hacker News。它提供了一种通过简单的Chrome浏览器扩展程序从图像文件中提取电子文本的方法。很高兴看到扩展程序支持简体玛雅吧和繁体玛雅吧,所以我立即安装了扩展程序并进行了尝试。

结果?不幸的是,不是很好。

当它不’t work at all

首先,脚本需要识别图像中的文本。第一步没有’即使文字在人眼看来相对清晰,也总是会表现得太好。让’在某些情况下,尽管玛雅吧文字清晰易读,但该扩展名却找不到任何内容。

在第一种情况下,字体是非标准的。好,可以。那’s to be expected.

用玛雅吧测试Naptha项目

在下一种情况下,文本非常清晰,但是对比度很差。

用玛雅吧测试Naptha项目

在此最后一个示例中,文本在人眼中相当清晰,但分辨率较低且倾斜。这可能会使算法变得困难。

用玛雅吧测试Naptha项目

当它起作用时

在许多其他情况下,已识别出一些文本,但不足以使扩展名真正对任何内容有用。这是Project Naptha可以识别一些文字的图像,“select all text”功能已应用。 (蓝色框显示Naptha项目在图像中标识为“text.”有时它们是异常错误的。)

一些例子:

用玛雅吧测试Naptha项目

用玛雅吧测试Naptha项目

用玛雅吧测试Naptha项目

用玛雅吧测试Naptha项目

用玛雅吧测试Naptha项目

考虑到文本的清晰性和直接性,以及高分辨率,我发现后两个非常令人惊讶。

当它真正起作用时

Sometimes it was relatively successful 在 identifying the 文本。 In these cases you 必须 首先将语言设置为玛雅吧 (根据文字,可以是简体字还是繁体字)。那里’效果很酷,向您显示正在进行一些处理。什么时候’s done, you can copy and paste the 文本。

用玛雅吧测试Naptha项目

…可能不正是您所希望的。

选定的玛雅吧文本产生了以下复制粘贴结果:

用玛雅吧测试Naptha项目

> 总统亲 ã热fl地接

> \早、待了葫芦兄妹

如果它正确地捕获了所有文本,那就应该是:

> 10、总统亲自热情地接

> 待了葫芦兄妹

这个比较好:

用玛雅吧测试Naptha项目

> 雹电二怪对兄妹俩尽效使用现代

> 化武器况妹俩也不示弱 麝芦神功连

> 连使出 胭宙电二怪打入深深的山沟

应该是:

> 355、雷电二怪对兄妹俩尽尽使用现代

> 化武器况妹俩也不示弱,葫芦神功连

> 连使出,把雷电二怪打入深深的山沟

另外,我的样本量太小,无法得出确切的结论,但是对于简单字符而言,扩展名似乎比传统字符更好。

结论

我不’听起来听起来太挑剔了。这真是一项了不起的技术,而且它在不支持玛雅吧字符的情况下启动的事实真是棒极了!一世’确保技术会随着时间的推移而改进,这将对中国学习者大有帮助。

从这个角度来看, OCR(光学字符识别) 用于移动设备意味着您可以指点手机’相机对准您看到的任何字符,并获得有关字符说出的反馈(有时)。 Naptha项目 含义相同,但对于您的家庭浏览体验而言。对我来说’当我多读一些玛雅吧时,’更重要。这项技术完善之后,只要您拥有帮助您阅读电子玛雅吧文本的工具,’re all set!

就个人而言,我认为这对于漫画尤其是个好消息。它’s no coincidence that I tested this extension out on comic book 文本。 I’我非常期待看到此扩展程序的发展。

分享

约翰·帕斯登

约翰是上海的语言学家和企业家, 全集学习.

评论

  1. 真好!您希望OCR可以对大多数这些图像做得更好。这是我们的汉平相机’在第二张图片的第一行上所做的努力(分辨率400很小×355 –是您使用的分辨率,约翰?) http://t.co/gtgVrfB8zn

发表评论