Fluid idea for Life

随笔,杂记

as3 pdfReader的进展

最近一段时间,用所有可用的时间,投入到as3 pdfReader的开发中,取得了一定的进展。

相对于0.1版本,修正了若干Bug和错误。对PDF 1.4版本的文件进行了测试,基本上没发现问题,由于1.5以后有新的变化,比如object stream,这些还需要分析解决。

在提取文本上,没有进行编码的文本已经没问题了(这好像是废话,没有被压缩就是纯文本),对于压缩过的,由于压缩算法有几种,现在在写移植解码算法,比如 ASCII85、LZW。

另外,对于中文的提取,还有很多疑问,希望在这方面有经验的同志,能够加入。最新代码可以通过 SVN获取。

Tags: pdfreader