切换到宽版
  • 19766阅读
  • 23回复

电子图书:超星篇 [复制链接]

上一主题 下一主题
离线dedream
 
发帖
5085
财富
5058
威望
211
交易币
1
只看楼主 倒序阅读 使用道具 0楼 发表于: 2008-01-19 | 石油求职招聘就上: 阿果石油英才网
— 本帖被 dedream 执行取消锁定操作(2008-01-27) —
超星(cx)是国内最大的数字图书机构,相信大家都知道。

主站:超星数字图书馆|全球最大的中文数字图书馆
        www.ssreader.com   书籍总量大概有60万左右,有部分免费书籍可以随便下。
教育镜像:大概是大家用得最多的了,很多人习惯称为sslib
                www.sslibrary.com
读秀:超星的联体婴儿,但表面上二者没有关系 www.duxiu.com

指针:www.zhizhen.com  这个很好用,免费查询书目,而且可以获取很多信息,比如出版社、作者,免费试读17页等等,需要找相关参考书的,直接去这里搜寻,是一个很简洁的方式。
[ 此帖被dedream在2011-05-04 10:14重新编辑 ]
1条评分
阿果 威望 +1 分享技术 2008-01-19
评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

无聊

灌水
Shale gas
离线dedream
发帖
5085
财富
5058
威望
211
交易币
1
只看该作者 1楼 发表于: 2008-01-19 | 石油求职招聘就上: 阿果石油英才网
人们对超星书一直都褒贬不一,大概有很多人都抱怨:cx的书籍不清晰、用一段时间后会过期,或者只能在本电脑上看。

其实这些都是可以避免的,我个人比较喜欢pdg,因为cx书属于图片形式的书籍,它最大的好处是忠于原书,因为它是通过扫描方式制作的,所以错误比较少,现在cx推出的文本书,虽然清楚,但错误很多的,传统的pdg格式就不存在这些问题。如果方法正确,可以很方便的把它转换成pdf格式,也可以进行高精度的ocr。采用虚拟打印方式转换cx书到pdf格式,那是最笨的一种,也是转换质量最差的一种。

要比较深入的理解并达到理想的效果,需要从cx格式说起。

==============
根据高人对pdg2.dll的分析,结果如下

    作者:coolman

        1.  什么是超星文件格式? 如何判别?
    超星文件一般以pdg 为扩展名,分文本和图像2 种。一般所指的格式是针对
图像类的。  _
    可以用任何 16 进制文件编辑器打开,如 ultraedit,    第 16 个字节处的数字就
是该文件的类型。例如02H 表明该处数字为 02. Jpeg 格式除外。
    2. 超星文件格式有哪些?
    现有格式 00-05h, 10-1CH, 64-68h, aah,abh,ach, FFh(其中FFh 格式为已经破
坏的格式,无法阅读)以及Jpeg 格式
        3.  超星文件会过期吗? 如何避免?
    10h,  64-68h 的文件均为加密格式,有阅读限制。避免的办法:1.  避免得到
这样的文件。2.  买卡并在过期前备份注册信息,阅读时导入注册信息,并断开
网络连接。3.  过期后续卡。.
    4.  超星文件可以 转换为其它图像格式吗?
    可以。1.  虚拟打印是最简单的办法  2. Pdg2Pic 程序
    5.  超星文件可以打印吗?
    可以,但是不同版本的限制不同。 寻找破解或者参考回答4。
    6. 为什么有些05h 的文件SSREADER 不能阅读?
    排除文件下载不完整的因素后,最可能的原因是该文件为DJVU 格式的,如
下图,只需要将05 改为00 即可。 
   
    7. ssreader 3.9 下载的本地文件会被破坏吗? 如何避免?
    用 ssreader  3.9 阅读本地文件时会判断该文件是否过期,如果过期,该文件
所在目录的所有本地文件都会被破坏,这样的文件都有一个日期标志,可以清除
此标志,避免被破坏。

    8. be 下载的某些04h,05h 的pdg 文件不能阅读,怎么办?
    这样的文件一般偏移为 66h 的字节为01,修改为00 即可。
 
    9.  直接能在 SSREADER 中无需注册就能阅读的图书格式都有哪些?
    最新的SSREADER 版本可以直接阅读的格式为00,02,03,04,05 和JPEG 格式
    10.  如何在 SSREADER 中阅读1xh 和axh 格式书?
    某些(不是全部)1xh 和axh 格式的书可以通过建立本地虚拟http web 服务


========

是不是看不太明白?那再看看这个
超星加密格式!http://www.agpr.net/bbs/read.php?tid-24162-fpage-39.html


还是不怎么明白?
那你明白这些就可以了,现在吵醒的多数格式有:


00h
01h
02h
04h
05h
10h
11h
48h
64h
66h
67h
ffh


其中00h是原始格式,ffh表示文件已经被吵醒阅读器破坏,已经成了垃圾,其余格式均为加密格式。其中02、05、11、66、67是我们最常遇到的
Shale gas
离线dedream
发帖
5085
财富
5058
威望
211
交易币
1
只看该作者 2楼 发表于: 2008-01-27 | 石油求职招聘就上: 阿果石油英才网
先说一下6xh格式,这是吵醒新版本下载后获得的格式,3.9版以前的没有这些格式,这种格式的文件,只能本机阅读,怎么避免下载到这样的格式,请读:
介绍一下如何“正确”下载CX书,避免66H格式(检索研究,认证区)http://www.agpr.net/bbs/read.php?tid-179804.html

或者

用BE下载超星主站免费图书馆的方法http://www.agpr.net/bbs/read.php?tid-127778-fpage-14.html


===========

引用楼主qqw于2006-10-20 20:20发表的 【原创】用BE下载超星主站免费图书馆的方法 :
对不起!您没有登录,请先登录论坛.

======



对付超星文本书的策略分析+Httplook截留技术要点http://www.agpr.net/bbs/read.php?tid-157030-fpage-8.html


==========
引用楼主leukemia于2007-04-22 16:13发表的 对付超星文本书的策略分析+Httplook截留技术要点 :
    超星文本书一向是不太受欢迎的,一是下载和处理不方便,二是OCR和排版还不过关。我在这里整理了一下对付超星文本书比较可行的几招,大致分为上中下三策,以供书友们参考。

上策:
1.从镜像上下载对应的05H快速版,来代替文本书。如果让你在超星文本书和快速版之间选一个,你会选哪样呢?相信大多数人都会选择后者吧。所以不要忽视那些只能下载快速版的镜像哦。

2.用3.91阅读器直接下载成66H格式,然后用解密工具解密。这对于拥有Pizza或者Supper的书友来说确实方便省事。不过对于一时无法拥有解密工具的人,也不必着急,还有其他策略,且听我道来:

中策:
1.用Httplook截留,然后用老马的工具转成PDF。根据我的经验,Httplook截留文本书还是比较可靠的,一般不会截下坏页。缺点是操作有点麻烦。这里结合我的经验讲讲httplook截留的要点:
1)有些人反映Httplook开启后影响上网,可能要先对杀毒工具的端口监控设置作一下调整。另外最好是先打开相关网页(还不要打开IE阅读页面),然后再开启Httplook监听。
2)截留前,先点工具栏上面那个绿色的小箭头,开始监听,然后点SSlib或者主站的“IE阅读”,便开始截留。
3)自动翻页:可以先用按键精灵写一个简单的脚本,大致如下所示:
按键Pagedown
按键Pagedown
延时若干秒(延迟时间根据网络状况和下载速度自己调整)
然后设置脚本为“循环到按终止键为止”。

或者也可以用3.91阅读器阅读,用SSpage自动翻页。
4)截留后处理:
翻页完毕后,关闭Httplook前它会提示是否保存,点"yes”,接着还会询问你是否保存entities,entities 就是我们截留下来的文件,点"yes"保存,接着我们会看到截留下来的文件都是这种形式的文件名:
路径_文件名_pdg.Unknown,
必须对它们批量重命名,我推荐用Total Commander。方法是在Total Commander的窗口中,选中那些文件,然后按快捷键Ctrl+M,弹出一个批量重命名的窗口,先批量去掉路径名,接着批量去掉后面的多余后缀.Unkown,如此处理之后,就可以用老马的工具转换成PDF了。

2.用Wget和相关配套工具下载。这个我没试过,所以没有发言权,不知道这种方法是否方便可靠,还请高手们补充。

下策:用Pdgsniffer截留。
根据我的经验,用Pdgsniffer截留文本书总是会出现数据丢失,而且Pdg2Pic对文本PDG的检查标准很严格(如果文件头、尾不符合PDF文件格式规范规定的固定字符串则判断为Broken File),结果总是报告大量坏页。不知道其他人是否出现这种情况。
.......


=======

如果你认真研究一下,会有收获的
Shale gas
离线dedream
发帖
5085
财富
5058
威望
211
交易币
1
只看该作者 3楼 发表于: 2008-01-27 | 石油求职招聘就上: 阿果石油英才网
对于非6xh格式的文件就好办多了,
可以用这个工具转化到00h格式

pizza lite
可以破解大多数的吵醒密码. (除了66h).
复制到目标文件夹,运行即可http://www.agpr.net/bbs/read.php?tid-141190-fpage-2.html



或者直接用马健的软件阅读,有强大的解密功能

UnicornViewer_v0[1].04_chn
一个很好用的吵醒阅读器,比吵醒的强,推荐(感谢软件作者马健)http://www.agpr.net/bbs/read.php?tid-160732-fpage-7.html

这样做的好处是:吵醒文件不会过期,可以永久保留。不会出现ffh格式。

顺便说一下,如何避免ffh格式,只有一句话,如果你没有把文件转换成00h格式,就不要用正版的吵醒阅读器去读。

怎么知道我的吵醒文件是哪种格式呢?
用马健的软件http://www.comicer.com/stronghorse/software/index.htm#PdgThumbViewer
附件也是PdgThumbViewer
附件: PdgThumbViewer.zip (1044 K) 下载次数:39 ,你所在用户组没有附件下载权限 ,VIP会员免积分下载
Shale gas
离线dedream
发帖
5085
财富
5058
威望
211
交易币
1
只看该作者 4楼 发表于: 2008-01-27 | 石油求职招聘就上: 阿果石油英才网
PDG文件的DPI以及快速清晰版的辨别

======


PDG文件的DPI
作者cheming

看了一下PDG2.DLL,知道DPI信息不是保存在PDG中,而是计算出来的
.text:1001E220 ; __int32 __cdecl IT_Pdg01__dpi_get(void *pThis)
.text:1001E220 IT_Pdg01__dpi_get proc near ; DATA XREF: .rdata:100D4E3Co
.text:1001E220 ; .rdata:100D54C4o
.text:1001E220
.text:1001E220 pThis = dword ptr 4
.text:1001E220 arg_4 = dword ptr 8
.text:1001E220
.text:1001E220 mov eax, [esp+pThis]
.text:1001E224 lea ecx, [eax+0C0h]
.text:1001E22A call GetDPI
.text:1001E22F mov ecx, [esp+arg_4]
.text:1001E233 mov [ecx], eax
.text:1001E235 xor eax, eax
.text:1001E237 retn 8
.text:1001E237 IT_Pdg01__dpi_get endp
.text:10011B50 GetDPI proc near ; CODE XREF: IT_Pdg01__dpi_get+Ap
.text:10011B50 mov edx, [ecx+2194h]
.text:10011B56 xor eax, eax
.text:10011B58 cmp edx, 1200
.text:10011B5E setle al
.text:10011B61 dec eax
.text:10011B62 and eax, 150
.text:10011B67 add eax, 150
.text:10011B6C retn
.text:10011B6C GetDPI endp
根据上述程序可知:
pdgWidth>1200 : pdgDPI = 300
else: pdgDPI = 150

===================

以上意思就是清晰版的pdg一般是dpi=300,快速版为150。

其中:
  DPI是Dot Per Inch的缩写,字面意思就是“每英寸点数”,即在一英寸的长度上,设备能够显示、打印、扫描、拍摄……多少个点,其基本计算公式为:
DPI=象素点数÷英制长度(点/英寸)

另外介绍一个简单的辨析cx是否为清晰版快速版或文本书的方法

  用cx阅读器打开书,如果左下方默认显示的是50%就是清晰版,显示100%的为快速版,200%为文本书。如果cx书文件名是类似这样的x_X.pdg,那么它肯定是文本书。
Shale gas
离线dedream
发帖
5085
财富
5058
威望
211
交易币
1
只看该作者 5楼 发表于: 2008-01-30 | 石油求职招聘就上: 阿果石油英才网
破解超星打印量限制
用超星图书室版4.0下了几本书,要转成PDF格式,忽提示打印量超出.
网上有两法:

备份C:\Program Files\SSREADER36\ssreader.ul,当打印页数超出限制时,用备份的文件覆盖原文件后,就可以再打印了。或将安装目录下的ssreader.ul文件属性改为只读即可

使用 UltraEdit-32 软件打开 SsReader.exe 文件,选择搜索菜单下的查找命令,在查找栏输入 750D8B0764A3 然后点击下一个按钮,将搜索到的750D8B0764A3中的0D改为2A ,最后存盘即可!
注意:一共可搜索到两处,只修改第一次搜索到的。
这种方法适合超星3.9~4.0的各种版本。其它版本未测试!
Shale gas
离线dedream
发帖
5085
财富
5058
威望
211
交易币
1
只看该作者 6楼 发表于: 2008-01-30 | 石油求职招聘就上: 阿果石油英才网
截留法下载sslib中的超星图书(快速版),避免出现6XH格式(根据zhfeng教程改写)

所需工具:pdgsniffer(或assniffer或websniffer)、原版的超星阅读器、Pizza lite、winpcap,http://www.winpcap.org/install/bin/WinPcap_4_0.exe


推荐用pdgsniffer,因为它把没有用的过滤了,只保留了有用的pdg和dat文件
 

第1步 拷贝pdgsniffer至系统文件夹中

把pdgsniffer拷贝到你的系统目录中,假设你的pdfsniffer在c:\pdgsniff中,系统目录为c:\windows\system32:
在开始菜单中点击运行,输入cmd回车
弹出命令行窗口,在窗口中输入
copy c:\pdgsniff\pdgsniffer.exe c:\windows\system32\pdgsniffer.exe

这样的好处在于,以后你执行命令的时候可以少打一次 cd c:\pdgsniff

第2步 创建截留后要保存pdg文件的文件夹
比如你要把你截留的书保存在c:\pdgsniffdata中
继续在上面的窗口中输入 cd \pdgsniffdata(当然用资源管理器也可以)



第3步 运行pdgsniffer
仍然在cmd窗口中,输入pdgsniffer c:\pdgsniffdata -nosubdirs -nomime,
网卡根据你具体情况进行选择(如果不知道,简单的测试方法是选择后,用超星打开sslib上的一本书,如果截留到了pdg文件,说明选择正确)

第4步添加要下载的书
在浏览器点击你要下载的书,并且点击下载,注意在点确定之前,将线程设为1

当线程设为1时,截留基本无坏页,面线程增加后截留的坏留增多

依次将要下载的书添加到列表中
第5步 开始下载
到超星的下载监视窗口中将前面你添加的书全部选中,然后右击选开始下载


第6步 后期处理的一些设置(重要过程)
查看刚才的截留目录C:\pdgsniffdata出现了一大堆文件

当然,这里是写使用方法,所以只留了几个表示一下
在资源管理器中打开c:\pdgsniffdata目录,在工具栏上点右键,勾选创建日期

然后按创建日期进行排列



第7步 深加工

当然这步不是必须的,Pizza lite免费提供这一点好啊,适用范围广
对于非文本书,把pizza lite拷贝到每本书的目录中,双击pizza.exe再回车一次就OK了

友情提示:进行这一步前最好备份一下,另外不要去处理文本PDG,要不你的文本PDG全损坏了不要找我,KaKa。因为那时的Pizza还不支持文本PDG,再说文本PDG还没出来那时




================



截留法下载sslib中的超星图书(清晰版),避免出现6XH格式(根据zhfeng教程改写)

所需工具:需要增加一个翻页工具



第1步 第2步 第3步 相同,

第4步添加要下载的书
在浏览器点击你要下载的书,不点击下载,只是阅读,打开翻页工具,设置好翻页时间,不要翻得太快,否则可能出现坏页。

第5步没有了


第6步 第7步 相同。

可能很多兄弟不习惯用pdgsniffer这样的软件,推荐另外一款软件进行截流,使用起来更简单:HTTPLook,在打开超星书前先打开httplook,然后打开cx书,在httplook上按绿色的箭头(开始),软件开始自动截流,然后使用翻页工具翻页,完成以后使用Export4HTTPLook.exe批量导出所截流到的pdg文件。




所需工具可自行到网上找


其中翻页工具
any@web及自动翻页工具+键盘宏http://www.agpr.net/bbs/read.php?tid-104492-fpage-13.html

pizza lite
可以破解大多数的吵醒密码. (除了66h).
复制到目标文件夹,运行即可http://www.agpr.net/bbs/read.php?tid-141190-fpage-2.html
附件: Export4HTTPLook.rar (163 K) 下载次数:36 ,你所在用户组没有附件下载权限 ,VIP会员免积分下载
Shale gas
离线dedream
发帖
5085
财富
5058
威望
211
交易币
1
只看该作者 7楼 发表于: 2008-01-30 | 石油求职招聘就上: 阿果石油英才网
PDG转图像、PDF的若干方法
作者:马健
邮箱:stronghorse@tom.com
主页:http://stronghorse.yeah.net
发布:2006.05.26
一、前言
二、截图法
三、打印法
四、BooX Viewer
五、pdg2bmp&jpg&tif&pdf&txt
六、Pdg2Pic
七、方法之比较与展望
八:题外话:图像文件转PDF
一、前言
PDG文件是超星公司电子图书的专有格式,需要用超星公司的专用浏览器才能阅读。本文讨论PDG转图像、PDF的方法,仅出于研究目的,并无意对超星公司的版权进行任何形式的侵犯,也不希望任何人用本文讨论的工具或方法从事侵权活动。如果需要浏览PDG电子书,请通过购买点卡等方式,以合法的途径获得。
本文假定用户通过合法的手段获得PDG文件,只是由于希望能够在比超星浏览器更好、更方便的浏览器上阅读,并且不对转换出来的文件进行扩散的情况下,才需要将PDG文件转换成图像文件或PDF文件。
二、截图法
简单点说,就是通过截图的方法,直接将超星浏览器中显示的内容,截为图片,再将图片转换成PDF文件。
这个方法可能是世界上最简单、最朴素,也是最容易想到的方法,并且对于所有版本的超星浏览器和所有能够正常显示的PDG文件均适用。制约这个方法的因素包括:
页面大小超出显示区域,导致截图截不全。解决的办法包括:找一台支持高分辨率设置的PC(现在17"液晶已经很便宜,19"也快平民化了);如果显卡支持旋转显示,则将整个屏幕旋转90°显示,方便显示细长页面。
手工一页一页截图,劳动强度比较大。解决的办法就是用各种现成的按键、
鼠标录制/播放软件与屏幕截图软件相结合,或者自己做一个连翻页带截图的小软件,实现自动化操作。
截出来的图像可能需要进行整理,包括切边、图像文件格式转换等。
总之,截图发虽然有一些限制,用起来也比较麻烦,但很难被超星屏蔽,不失为一种终极的方法。
三、打印法
即在超星浏览器中发布打印命令,将正在浏览的PDG文件打印到PDF虚拟打印机(包括Acrobat PDF打印机、PDFFactory打印机等),成为PDF文件。
这种方法也是较早被用于转换PDG文件的方法之一,而且用起来非常简单、方便,因此广为流传,导致后来超星阅读器针对这种方法加了一些限制,但是这些限制很快就被突破,然后双方就这样乐此不彼、义无反顾、周而复始地一轮、一轮折腾下去。虽然在无关的人看来有点无聊,但是投身其中的人经常都会为每一个微小的突破而激动 ,还真是有精神寄托的人生。
目前制约这个方法的因素包括:
超星浏览器对PDF打印机的封锁。 新版超星浏览器会检查打印机的名称,发现是PDF打印机则不让打印。不过超星软件毕竟没有人智能,打印机被人一改名就检测不出来了。也有人先将PDG打印到支持PostScript(PS)文件格式的真实打印机,再用Acrobat将PS文件转换成PDF文件,以绕过超星对虚拟打印机的检查。
超星浏览器对打印页数的限制。超星浏览器会限制合法用户每个月的打印总页数,够数(每月一千页)后就不允许打印。解决的办法包括将ssreader.ul文件属性改为只读,或定期对这个文件进行备份、恢复。
超星浏览器对打印效果的限制。 新版本的超星浏览器可能对以前的限制与反限制游戏终于厌倦了,因此干脆在打印的时候降低打印质量,导致打印出来的PDF图像质量与原始PDG文件差很多。针对这一招,目前网上提出的解决办法包括将新版DLL文件替换为旧版DLL,或提高打印机DPI设置等。
总之,在我看来,打印法虽然简单方便,打印黑白图像也问题不大,但是打印灰度/彩色图像会出现图像质量衰减或文件膨胀等问题,所以至少我自己不到不得已是不会用的。
四、BooX Viewer
BooX Viewer是Momotalo、ShunCox、dd321等合作开发的一款轻量、绿色PDG浏览器,无需安装,单独一个EXE文件即可运行,并且能够直接读取ZIP文件中的PDG文件等,这些都比原版超星浏览器强,也导致了它的流行。
早期版本的BooX Viewer提供一个“转换到DjVu”功能,该功能先将PDG文件转换成BMP,再转换成DjVu文件。因此也有人利用此功能的前半部分,先将PDG文件转换成BMP,再将BMP转换成PDF。不过这个功能在后来的版本
中已经取消了,并且加了一些类似广告的限制。
BooX Viewer的开发基于对PDG文件格式的分析,不需要超星浏览器或DLL的支持,并且能够解码加密的10H等格式,这些都让我对其开发者充满了敬意。
五、pdg2bmp&jpg&tif&pdf&txt
这个软件是coolman开发的,对PDG的支持(包括OCR)基于超星Pdg2控件,对图像、PDF的支持基于Pegasus ImagXpress Professional控件,运行前需要先注册控件。
这个软件的发行范围很窄,最新版是多少我也不知道,只能以我手上现有的3.8b0419版来说事。在使用这个版本的过程中,我发现它存在下列限制:
直接将PDG转换成PDF,则所有彩色、灰度图像均变成黑白图像。解决的办法是先转换成BMP,再用其它软件将BMP转换成PDF。 但是不知道为什么,pdg2bmp&jpg&tif&pdf&txt没有文件重新编号功能,所以在从BMP转换成PDF时,页面顺序调整起来很麻烦。
将PDG转换成BMP等图像格式时,允许使用多线程并行转换,但是似乎稳定性会随之下降,所以我都只敢用单线程转换。
最要命的一点就是:这个软件在转换时需要占用系统剪贴板,因此如果在转换过程中同时用Office等软件干活(没办法,转换过程实在是太漫长了),则复制/粘贴功能将失效。我先是在工作时发现了这个问题,然后用剪贴板监视软件证实了我的猜测。对剪贴板的占用不仅影响前台软件的正常使用,而且由于Windows本身对系统剪贴板的限制,在转换 幅面很大的PDG文件时会转不了。
虽然有一些问题,但是这个软件支持加密的AAH格式等(除该软件外,coolman还开发了一些独立运行的PDG解密软件),这些都让我对coolman及其作品充满敬意。
六、Pdg2Pic
在发现coolman的pdg2bmp&jpg&tif&pdf&txt会占用系统剪贴板后,我google了一下,还真查到了一段源代码,虽然我不可能看到pdg2bmp&jpg&tif&pdf&txt的源代码,但我相信它的核心应该与这段代码相似。不过在多看了两遍这段代码后,我觉得既然已经用了Pdg2控件,为什么不用它提供的其它接口获取图像,干嘛非要用系统剪贴板?为了证实我的想法的可行性,我花了点时间写了Pdg2Pic这个软件,顺便对我在使用pdg2bmp&jpg&tif&pdf&txt过程中发现的一些问题做了改进,包括:
转换过程不占用系统剪贴板,不影响用户在前台的正常工作。
可以自动将文件按封面、前言、目录、正文、附录的顺序排列,也可以手动调整文件顺序。
提供预览功能,在转换前可以先浏览PDG图像。
PDG文件的扫描DPI自动转存入生成的TIFF、PNG文件,便于在转换成
PDF文件时设置页面大小。
如果检查发现PDG文件是纯正的JPG文件,将不进行任何转换,直接将PDG复制为JPG;黑白PDG文件转存为采用CCITT G4压缩的TIFF文件,以获取高压缩比;灰度/彩色PDG重新压缩为有损的JPG或采用JPEG压缩的TIFF文件,或无损压缩的PNG文件,或JPEG 2000(有损/无损)。
由于我没有时间对加密PDG文件进行研究,因此Pdg2Pic不像pdg2bmp&jpg&tif&pdf&txt那样支持众多加密PDG格式。如果在Pdg2Pic统计的文件类型中出现加密格式,需要用1xhkillerfull、aahkiller等进行解密,然后再用Pdg2Pic进行转换。如果您原意提供PDG文件解密算法或代码,欢迎与我联系。
七、方法之比较与展望
上面介绍了一些PDG转图像、PDF的方法,说句实在话,我认为没有一种方法是完美的,多多少少都有点毛病。而且在我看来,对于一个真正的PDG转PDF软件,至少还要解决以下问题:
从PDG目录到PDF书签(Bookmark)的转换。现在有些PDG图书是带目录的,在超星浏览器中打开后,左侧会显示树状结构的目录,便于快速定位需要阅读的页面。这个与PDF中的书签很类似,但是现在似乎还没有一个软件能够在将PDG转换成PDF时,顺手将目录转换成书签。
将图书信息(bookinfo.dat)插入PDF文件,便于用Adobe PDF Reader的搜索(search)功能,在一大堆PDF文件中找到需要的书。bookinfo.dat其实是一个标准INI文件,用文本记录了书籍的书名、作者等信息,如果作为一个文本页插入PDF文件尾,无疑将给搜索提供一些必要的信息。
支持透明背景。原始的黑白PDG文件本身可以按透明背景色显示,因此在超星浏览器中可以根据需要对背景色、前景色进行设置,便于长时间观看。相比之下,PDF的白底黑字看起来就累多了。其实PDF Reader本身是支持对页面背景进行定义的,条件是PDF中的图像必须采用透明背景。如果图像本身敲死了一定要用白底,PDF Reader也没有办法。
现在最后一个问题可以通过FreePic2Pdf 1.01版解决,第二个问题可以通过超星章节目录提取器(SSContent)部分解决,其它问题解决起来都有点难度,不知道有多少人原意去做?至少我自己是没打算要去做,但是我很期待看到其他高手能够解决这些问题,推出更好的PDG转PDF工具。
八:题外话:图像转PDF
本文的题目叫《PDG转图像、PDF的若干方法》,但是前面讨论的某些方法,如截图法只能得到图像,不能直接得到PDF文件,因此自然还需要讨论一个问题:怎样将图像转换成PDF文件?
别人怎么想的我不知道,我自己认为比较好的转换方法有两种:
1、用Adobe Acrobat Professional的Create PDF from Multiple Files,而不用它的虚拟打印机
这种方法的优点是:
如果在转换前先指定黑白图像用无损JBIG2压缩,可以获取最高压缩比。
可以获得经过线性优化的PDF文件,这种文件在通过网络浏览时可以边浏览边下载,因此也被称为Fast Web View文件。但是对于只在本地阅读的PDF文件来说,我认为这种优化只会增加文件长度,不会节省实际的打开时间。
这种方法的缺点是:
对于灰度/彩色图像,可能会因为重新采样压缩而造成图像质量衰减或文件膨胀。这方面的讨论参见我写的《图像转PDF的问题、方法及题外话》。
如果一次需要处理几本书,操作起来有点麻烦。
如果图像大小不一,转换出来的页面大小也不一致,看起来有点心烦。
至尽为止,我还没有找到如何设置,才能在转换黑白图像时,能够将背景设置为透明。如果您知道,还请不吝赐教。
2、用FreePic2Pdf
这种方法的优点是:
按照缺省设置,黑白图像转换成CCITT G4数据流,JPEG/JPEG 2000数据流直接嵌入PDF文件,不会因为重新采样压缩而造成图像质量衰减或文件膨胀。
便于批量处理,包括设置页面大小、页边距,在开始转换前调整文件顺序也很方便。
从1.01版开始,对于黑白图像,可以自动转换成透明背景色。由于有了这个功能,我甚至打算在有了好的PDF转图像软件后,把以前收集的一些扫描版PDF还原成图像,再用它转成PDF。原因无它, 白底黑字的PDF实在是看怕了。
最重要的一点:它是免费的绿色软件,个人使用不存在法律后患。
这种方法的缺点是:
由于缺乏相关开源项目的支持,因此不支持JBIG2压缩,只能采用CCITT G4压缩黑白图像,转出来的PDF文件可能会比Acrobat用JBIG2转出来的大一点。如果您手上有没有法律问题的JBIG2压缩源代码,欢迎与我联系。
没有线性优化功能。如果您制作的PDF只在本地阅读,不打算通过IE在线阅读,这个缺点将变成优点。
总之,现在也没有十全十美的图像转PDF软件,也许这样的方法会是更好的选择:转换还是用支持JBIG2和JPEG 2000的Acrobat转,但是做一个小程序,将它转出来的PDF文件的黑白图像的背景改为透明。由于是单纯的字符替换,所以软件很好写,并且不需要其它第三方代码或控件的支持。
Shale gas
离线dedream
发帖
5085
财富
5058
威望
211
交易币
1
只看该作者 8楼 发表于: 2008-01-30 | 石油求职招聘就上: 阿果石油英才网
关于马健先生的部分作品及介绍请看http://www.agpr.net/bbs/read.php?tid-191525.html
其中pdg2pic ,pic2pdf软件请直接到
马健先生的个人主页:http://www.comicer.com/stronghorse/下载,用这两款工具转换出来的文件,清晰度不会有太大改变。是pdg转换到pdf的最佳选择。
Shale gas
离线dedream
发帖
5085
财富
5058
威望
211
交易币
1
只看该作者 9楼 发表于: 2008-01-31 | 石油求职招聘就上: 阿果石油英才网
有兄弟问,为什么我在阅读器里看到的吵醒书很清晰,但是下载到电脑上看怎么就不清晰了呢?

这是阅读器搞的鬼。下载过程中把清晰版变成了快速版
Shale gas

网站事务咨询:QQ:1392013 | 26189883
阿果石油网为免费个人网站,为石油人提供免费的在线即时技术交流场所,拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论和行为!
如有言论或会员共享的资料涉及到您的权益,请立即通知网站管理员,本站将在第一时间给予配合处理,谢谢!