Fluid idea for Life

随笔,杂记

as3 pdfReader的进展

最近一段时间,用所有可用的时间,投入到as3 pdfReader的开发中,取得了一定的进展。

相对于0.1版本,修正了若干Bug和错误。对PDF 1.4版本的文件进行了测试,基本上没发现问题,由于1.5以后有新的变化,比如object stream,这些还需要分析解决。

在提取文本上,没有进行编码的文本已经没问题了(这好像是废话,没有被压缩就是纯文本),对于压缩过的,由于压缩算法有几种,现在在写移植解码算法,比如 ASCII85、LZW。

另外,对于中文的提取,还有很多疑问,希望在这方面有经验的同志,能够加入。最新代码可以通过 SVN获取。

Tags: pdfreader

上一篇: 别太 OOP了
下一篇: 说《复仇》兼谈许巍

访客评论

  1. #1 walktree 2010-03-03, 8:50 AM
    源码通过svn可以下载,上面有项目的链接。
  2. #2 飞翎 2010-02-28, 11:30 PM
    写得很好啊!
    想学习一下啊,能否把您的代码发一份给我呢?谢谢。
    邮箱:feiling2007.love@163.com
  3. #3 walktree 2010-02-01, 9:36 AM
    是的,PDFTextStripper还没有完全好,这个应该是最实用的功能,我会继续努力的。
  4. #4 崔旭 2010-01-31, 11:24 AM
    特别需要 PDFTextStripper 的功能,不过看起来不能用。
  5. #5 walktree 2010-01-05, 12:19 PM
    谢谢支持!pavo很强大,已经远远走在我的前面,不过作者和我的偏重点不同,他目前偏向于提取文本,没有注重解码,但很多地方都值得认真学习。
  6. #6 崔旭 2010-01-03, 10:59 AM
    好,期望新进展。
  7. #7 Y.Boy 2009-12-31, 5:20 PM
    http://code.google.com/p/pavo/
    这套库感觉如何?
  8. #8 流动的树 2009-12-10, 3:57 PM
    刚发现了一个日本人写的PDF解析库http://code.google.com/p/pavo/

发表评论

评论内容:

点击获得Trackback地址