新的Pleco OCR很棒

最近在上海的华语汉语学生中有一些嗡嗡声,’关于Pleco 苹果手机应用程序的新功能。从 网站:

> We’ve刚刚宣布了下一个版本的Pleco 2.2的一项非常酷的新功能; OCR(光学字符识别),可让您指向iPhone’s camera at 中国文字 to look them up “live” (similar to an “augmented reality” system): demo video is 这里 (要么 这里 如果你可以的话’t access YouTube).

观看视频。说真的好大

基本上,新应用允许您执行的操作是添加“popup definitions” to any Chinese you’re reading–even a book. It’瞬间。它使用iPhone相机,但是’根本不像拍照。 (它’更像是使用3D护目镜…神奇的3D护目镜,可为汉语单词提供拼音阅读和定义。)

该应用程序背后的技术并不是非常新的…这些年来,汉字的光学字符识别一直在稳步提高。但是还没有智能手机应用程序做得很好,而且’看到Pleco出众的表现令人赞叹不已,这真是令人惊讶。

哦,还有来自Pleco的好消息:

> Also, we’re finally working on an 安卓系统 version of 普莱科, and have just signed a license for our first Classical Chinese 字典….

太棒了祝贺Michael Love和Pleco团队的其他成员。

分享

约翰·帕斯登

约翰是上海的语言学家和企业家, 全集学习.

评论

  1. 您说得对,Pleco’的新功能很棒。

    更妙的是:右侧的广告…. http://img683.imageshack.us/img683/3101/asiandatingatsinospilic.png

    “中国女性寻求男性…. ” – I am excited!

  2. 看起来还不错你有一些背景吗?它是否依赖于黑白背景图像,或者甚至可以拾取我周围真实世界中的角色?

  3. 我喜欢它。拖曳盒是如此Photoshop’高效。当您有帮助的应用程序’紧要关头,有文字要阅读!我想知道它是否可以在不同的环境中(而不仅仅是纸质书)读取/扫描标志和其他内容。

    亲爱的爸爸,您能给我买一部iPhone以便我学习中文吗?你知道的’苹果的主要原因’s sell – EDUCATION –父母会为此付出任何代价。

  4. 丹吉特,我不’不需要iPhone,但Pleco看起来很棒。一世’我希望在我可以买到智能手机的时候,Pleco可以移植到Android。

    顺便说一句,你“notify me 通过 email” checkbox doesn’实际上有一个复选框,是设计使然吗?

  5. I’已经等了几年了… I’我有点惊讶’t/isn’您可以购买的许多电子词典中都没有,但我’我肯定这会更方便… Now if it can just ‘autofit’到文字的大小…

  6. 我不知道开发商’这个OCR事情的工作原本是’这是Android的最终推动力(最后!)。一些Android应用程序(立即想到条码扫描仪和Google Google)以这种方式有效地使用了相机。只是让我怀疑那里’相机的基本原理“talks”操作系统使开发人员全神贯注。

    抱歉,毫无意义的猜测;不能’t help myself.

    OCR应用程序的底线是:WANT。

  7. 人。难以置信。

    这些天我们变得如此轻松。

  8. 恨Iphone这么久之后…。突然看起来更有吸引力。

  9. 有人对他们使用的技术有任何想法吗?
    实时OCR在智能手机上并不明显。

  10. 感谢您的所有评论!

    汉斯–它可以做白底黑字或白底黑字或浅色/深色;我们’有一个很好的系统可以自动检测它是否’s白底黑与白底’也可以使用手动开关强制它执行错误的一种操作。只要它们在迹象上看起来确实运作良好’光线充足且采用标准字体。

    威尔逊– thanks!

    斯坦·杜克– “autofit” is a bit dicey for performance reasons; while 在 alphabetic 语言s you can 自动调整 to a word using nothing but a simple visual analysis –找到大的黑色斑点并在其周围画一个盒子–使用中文,您必须查看实际字符以了解单词边界在哪里,这意味着我们’d浪费时间在每个帧上识别出很多额外的字符。

    但是,只要将识别框的左边缘与单词的开头对齐’如果时间更长,则完全可以’会返回找到的最长匹配项),的确,我们确实希望大多数人将框设置为足以容纳约4个字符的大小,然后将其指向单词,而无需不断调整其大小。

    可手动调整大小的框还具有使界面更易于理解的附加好处。–许多人仍然避风港’t弄清楚了|-> / |<-文档阅读器中的按钮(它们使您可以扩展/收缩突出显示以专注于一个特定字符),并且我们’希望该可拖动框将使人们更容易弄清楚如何将单个字符的定义归零。

    瑞秋–Android的推动力更多的是他们最终发布了NDK(本机开发套件)的版本,该版本足够健壮,可以实际用于大规模开发。它的先前版本似乎主要是为了使应用程序的性能至关重要的部分运行得更快– there wasn’即使是一个体面的调试系统–但是今年夏天’在R4的发布中,他们终于改变了这一点,在此之间以及通过使用名为SWIG的开源程序进行的一些巧妙的黑客操作,我们能够轻松地在Android上运行我们的跨平台Palm / Windows / 苹果手机,从而使Android端口变得可行。

    但是你’重新纠正相机到OS的界面与此有关的问题; 3GS在一年前拥有摄像机和处理器来进行实时OCR,但直到上个月才出现’这是让我们的操作系统从摄像头出来时立即向我们提供视频帧的一种方法。实时捕获条形码读取器应用程序(例如RedLaser)都可以通过从iPhone拍摄屏幕快照来工作’的内置照片捕获预览屏幕,它比直接读取视频数据要慢得多/更尴尬。事后看来,即使我们这样做,我们也可能能够启用实时OCR,但我们不得不投资 很多 花费很多钱来获得一个好的中国OCR系统,然后移植到iPhone’d肯定知道它是否可行,并且花了iOS4和iPhone 4’更快的处理器/ 720p视频捕获支持,使我们有足够的信心去冒险。

    威廉–核心识别引擎已获得中国一家公司的许可– there isn’还没有任何我们需要的具有性能/准确性的开源软件– though there’还有很多视频处理代码,因为我不知道’t believe anybody’尚未开发出专门用于视频的OCR引擎。

    • 关于何时会发布带有OCR的2.2版本的任何消息?一世’自从第一次阅读此帖子以来,我一直在定期检查,可以’t wait for it!

      保持良好的工作…

  11. passerby 说: 2010年11月25日下午2:36

    这是Pleco的画廊。来自香港Tany Hart的照片。
    http://gallery.me.com/tanya_hart#100104&bgcolor=black&view=mosaic&sel=1

  12. […]的观点来看,针对移动设备的OCR(光学字符识别)的开发意味着您可以指点手机’相机对准您的任何字符[…]

发表评论